Встреча двух фундаментальных дисциплин — машинного обучения и биологии — открывает новую эру в науке, получившую название «цифровая биология». В рамках подкаста венчурного фонда a16z основательница и генеральный директор компании insitro Дафна Коллер побеседовала с Виджаем Панде о том, как искусственный интеллект трансформирует разработку лекарств и почему понимание живых систем требует принципиально новой корпоративной культуры. Переход от изучения отдельных генов к крупномасштабным вычислениям позволяет создавать скрытые пространства данных и решать сложнейшие задачи здравоохранения.
🧬 Слияние двух миров: почему искусственный интеллект приходит в биологию 0:34
Дафна Коллер, признанный пионер в области искусственного интеллекта и бывший профессор Стэнфордского университета, в 2016 году приняла решение покинуть образовательную платформу Coursera, соосновательницей которой она являлась, ради нового масштабного вызова. По её словам, в мире существует очень мало задач, способных сравниться по своей сложности и значимости с безопасным и эффективным вмешательством в здоровье человека. Гость полагает, что такое направление идеально подходит для реализации её стремления использовать ИИ на благо человечества.
Главным фактором, предопределившим этот шаг, стало осознание того, что человечество впервые научилось измерять биологические процессы в беспрецедентных масштабах — как на клеточном, так и на организменном уровнях. Коллер утверждает, что это создало условия для развертывания современных алгоритмов машинного обучения, ценность которых раскрывается только на действительно огромных массивах данных. Обладая уникальным опытом работы на стыке фундаментального ИИ и биомедицины, она увидела возможность преодолеть колоссальный разрыв между этими дисциплинами. По её оценке, в 2016 году технологии машинного обучения стремительно меняли мир, но практически не оказывали влияния на науки о жизни из-за отсутствия специалистов, способных свободно говорить на обоих «языках».
🔬 Фабрика данных insitro и технологическая платформа Posh 3:38
Главное отличие insitro от традиционных биотехнологических компаний заключается в создании собственной «фабрики данных» (Data Factory). Коллер отмечает, что компания использует индуцированные плюрипотентные стволовые клетки для направленного создания специфических тканей, например, нейронов или гепатоцитов, «на заказ». В эти системы искусственно внедряются болезнетворные мутации, что позволяет детально сравнивать поведение генетически модифицированных клеток разных доноров. Этот подход открывает огромные возможности для активного обучения ИИ и прецизионного планирования экспериментов, что спикер считает уникальной технической возможностью в современной индустрии.
Одним из ключевых прорывных решений компании стала платформа Posh (Pooled Optical Screening in Humans). Метод строится на следующих этапах:
- Живые клетки помещаются в общий пул вместе с направляющими гидами CRISPR для генетического редактирования.
- Каждая отдельная клетка получает строго индивидуальное генетическое вмешательство.
- Поведение и перемещение клеток фиксируются с помощью высокоточного микроскопа.
- Клетки фиксируются, после чего проводится секвенирование их индивидуальных штрихкодов.
По мнению Коллер, объединение клеток в один общий пул устраняет тонкие артефакты окружающей среды, неизбежные при разделении образцов по отдельным лабораторным лункам. Это позволяет проводить полногеномный скрининг всех 20 000 генов человеческого организма всего на 10–12 плашках за две недели. Подобный подход, как утверждает гость, кардинально ускоряет расшифровку связи между генотипом и фенотипом для их последующего перевода в плоскость клинического применения.
🤖 Языковые модели для биологии и концепция скрытого пространства 7:12
Автоматизация и проведение столь масштабных экспериментов невозможны без сквозной интеграции искусственного интеллекта на каждом этапе — от сегментации клеток на снимках до считывания штрихкодов. На основе сотен миллионов клеточных изображений и профилей экспрессии генов insitro строит так называемое скрытое пространство (latent space), выступающее языковой моделью для биологии. Коллер использует понятную аналогию: эта архитектура работает точно так же, как GPT, но обучается не на текстах из интернета, а на поведении живых клеток.
Благодаря созданию базовой модели (Foundation Model) исследователи могут использовать подходы low-shot и zero-shot обучения. По мнению спикера, имея даже небольшое количество данных, модель способна наглядно продемонстрировать, как именно мутация смещает клетку в состояние болезни и в каком направлении терапевтическое вмешательство должно вернуть её к здоровому профилю. Эта технология не ограничивается только клеточным уровнем. Insitro применяет аналогичные методы к анализу клинических данных: гистопатологии и МРТ.
Коллер утверждает, что традиционная радиология и патоморфология используют лишь малую долю информации, заложенной в снимках, в то время как ИИ обучается языкам различных биологических модальностей и осуществляет перевод между ними. По оценке Виджая Панде, переход к базовым моделям полностью меняет правила игры, устраняя необходимость собирать огромные выборки из сотен активных примеров для каждого отдельного случая разработки лекарств.
🐁 Преодоление «мышиного барьера» в клинических исследованиях 10:00
Фундаментальная сложность биологии заключается в её высокой стоимости и огромном проценте ошибок на финальных стадиях. Ведущий Виджай Панде иронично заметил, что сейчас наступили отличные времена для «богатых мышей», которых современная наука научилась излечивать практически от любых недугов. Однако перенос результатов на людей чаще всего оборачивается дорогостоящим провалом клинических испытаний из-за глубоких физиологических различий видов.
Коллер подчеркивает, что именно этот барьер лег в основуDiscovery-стратегии insitro: все исследования проводятся исключительно на человеческих клетках или созданных на их основе комплексных системах. ИИ позволяет ученым задавать контрфактические вопросы формата «что, если» и изучать поведение генов в активном и неактивном состояниях.
Конечная цель insitro, как заявляет её руководитель, состоит в том, чтобы к концу текущего десятилетия превратить разработку лекарств от таких тяжелых недугов, как боковой амиотрофический склероз (БАС) или жировая болезнь печени, в систематический пошаговый рецепт. Успех этой стратегии, по мнению гостя, будет подкрепляться непрерывным развитием биологического инструментария: от ранних технологий РНК-интерференции до высокоточного праймированного редактирования CRISPR, способного заменять целые участки генома.
⚙️ Культура на стыке ИИ и биологии: интеграция атомов и битов 13:30
Объединение специалистов по машинному обучению и ученых-биологов в рамках одной компании Коллер называет одной из самых трудных управленческих задач. Даже при максимальной доброжелательности они мыслят разными категориями и говорят на разных профессиональных языках. Чтобы преодолеть этот разрыв, insitro нанимает редких специалистов-«переводчиков», способных понимать обе стороны. Важнейшую роль играет жесткий отбор кандидатов на соответствие ценностям компании.
Ценности компании, помогающие интегрировать ученых разных профилей:
- Взаимодействие: работа ведется исключительно в кросс-функциональных проектных группах, исключающих изоляцию отделов.
- Открытость: готовность задавать «наивные» вопросы при непонимании и принимать нестандартные идеи из других дисциплин.
- Уважение: признание авторитета коллег и бережное отношение к чужому опыту, поскольку лучшие идеи часто приходят из ортогонального мышления.
В качестве личного примера Коллер вспоминает свое детство, когда её мать-ученый предостерегала её от занятий программированием, будучи уверенной, что на продаже софта никто никогда не заработает. Для ИИ-специалистов, приходящих в материальный мир, у Коллер есть главный совет: необходимо иметь глубокое уважение к «атомам». Живые биологические системы ведут себя идиосинкразично и непредсказуемо.
Коллер делится наблюдением, что при анализе данных сильнейшим фактором шума часто оказывается то, какой именно лаборант проводил эксперимент, поскольку люди по-разному работают с пипетками и клетками. Именно для исключения этого человеческого фактора insitro делает огромную ставку на роботизацию лабораторий. По её прогнозам, следующий технологический фронтир лежит именно там, где ИИ соприкасается с физическим миром, что наглядно доказывает пример с беспилотными автомобилями, создавать которые оказалось несоизмеримо сложнее, чем чат-ботов.
🌍 На пороге эры цифровой биологии: прогнозы до конца десятилетия 17:34
Оценивая историческую перспективу, Дафна Коллер проводит аналогию с прошлыми научными прорывами, когда определенная дисциплина совершала гигантский скачок за короткий период времени.
Исторические вехи развития науки, приведшие к текущему моменту:
- Конец XIX века: прорыв в химии, открытие электронов и создание Периодической таблицы элементов.
- Начало XX века: революция в физике, связавшая воедино пространство, время, энергию и материю.
- 1960-е годы: появление вычислительной техники и компьютеров.
- 1990-е годы: разделение на data science (развитие ИИ) и количественную биологию (первый масштабный сбор генетических данных).
- Текущая эпоха: слияние ИИ и количественной биологии в единую цифровую биологию.
Сегодня, по глубокому убеждению Коллер, происходит слияние этих двух направлений в единую дисциплину — цифровую биологию. Она позволяет измерять живые системы на невиданном уровне, интерпретировать терабайты данных с помощью машинного обучения и направленно изменять организмы с помощью CRISPR.
Коллер прогнозирует, что применение цифровой биологии выйдет далеко за рамки медицины. Технологии будут востребованы в сельском хозяйстве для выведения культур, устойчивых к засухе и экстремальной погоде в условиях климатических изменений, что критически важно для обеспечения продовольствием 10 миллиардов человек. Еще одним перспективным вектором спикер считает защиту окружающей среды, включая проекты по эффективному улавливанию углерода с помощью модифицированных растений или водорослей. Коллер призывает новое поколение ИИ-исследователей выбирать это междисциплинарное направление как наиболее вдохновляющее и способное изменить облик физического мира.