Биология как код: как ИИ-модели проектируют белки и лекарства

В этом выпуске ведущий Нейтан Лабенц обсуждает с вычислительным биохимиком и ИИ-исследователем Амели Шрайбер (Amelie Schreiber), как искусственный интеллект совершает фундаментальный сдвиг в биологии — от пассивного наблюдения к активному проектированию живых систем. Эксперт объясняет, почему современные нейросетевые архитектуры идеально подходят для расшифровки сложности белков и как «цифровые эксперименты» могут заменить десятилетия традиционных лабораторных исследований.

🧬 Сложность биологии и тупик традиционных методов 5:38

Биологические системы обладают колоссальной сложностью, которая долгое время не поддавалась традиционному аналитическому подходу . Амели Шрайбер отмечает, что на текущий момент человечество понимает лишь от 5% до 10% всех взаимодействий внутри клетки . Основная проблема заключается в том, что ДНК, РНК и белки представляют собой не просто статичные цепочки данных, а динамические машины, взаимодействующие в трехмерном пространстве.

Традиционные методы исследования имели серьезные ограничения:

Направленная эволюция (Wet Lab): Требует физического внесения мутаций в образцы в лаборатории. При попытке изменить более двух аминокислот одновременно возникает проблема комбинаторной сложности, делающая процесс практически неуправляемым .
Молекулярная динамика (MD): Использование классической физики Ньютона для симуляции движения молекул. Это требует огромных вычислительных мощностей и времени (дни или недели на одну молекулу), при этом симуляции часто оказываются недостаточно длительными, чтобы зафиксировать все состояния белка .

По словам Амели Шрайбер, истинным «золотым стандартом» в биологии является распределение Больцмана — теоретическое распределение вероятностей, которое показывает, в каких формах (конформациях) белок проводит больше всего времени . Низкоэнергетические состояния — это стабильные формы, а пики энергии — транзитные, мимолетные состояния .

🦾 От статики к динамике: эпоха AlphaFold и Alpha Flow 18:04

Появление AlphaFold 2 от Google DeepMind стало отправной точкой революции, позволив предсказывать статичную 3D-структуру белка по его аминокислотной последовательности . Однако, как подчеркивает гостья, белки в клетке — это не застывшие статуи, а «дрожащие» (jiggly) структуры, меняющие форму в зависимости от температуры и окружения .

Новое поколение моделей решает проблему динамики:

Distributional Graphormer: Обобщение AlphaFold, которое выдает не одну структуру, а целый ансамбль состояний и пути перехода между ними . Это диффузионная модель, работающая с белками аналогично тому, как DALL-E работает с изображениями .
AlphaFlow: Модель на базе метода «matching flow» (сопоставление потоков), натренированная на данных молекулярной динамики. Она способна генерировать до 10 000 различных конформаций для одной молекулы, показывая, какие части белка наиболее подвижны .
AlphaFold Multimer: Специализированная версия для моделирования взаимодействий между несколькими белками, предсказывающая, насколько плотно они стыкуются друг с другом, как детали пазла .

Амели Шрайбер объясняет успех ИИ-моделей эффектом «сжатия информации». В отличие от физических симуляций, нейросети работают как архиваторы: они не просчитывают каждый атом, а выучивают высокоуровневые концепции (мотивы белков) . Это позволяет получать ответы за минуты там, где физика требовала часов или дней .

🛠️ «Белковая хирургия» и проектирование новых лекарств 52:41

Одним из самых мощных инструментов в арсенале современного биохимика стала модель RF Diffusion. Она позволяет не просто предсказывать существующее, а создавать белки, которых никогда не было в природе .

Основные возможности «белковой хирургии» по версии Амели Шрайбер:

Дизайн связующих (Binders): Создание белка, который с идеальной точностью прилипнет к мишени (например, к белку раковой клетки). RF Diffusion генерирует 3D-каркас, а вспомогательная модель ProteinMPNN подбирает под него аминокислотную последовательность .
Скаффолдинг мотивов (Motif Scaffolding): Исследователь может взять полезный фрагмент из одного белка (например, активный центр фермента) и заставить ИИ «достроить» вокруг него новый стабильный корпус .
Симметричные олигомеры: ИИ может проектировать сложные симметричные структуры, напоминающие футбольные мячи или нано-контейнеры. Это применяется для создания вирусных капсидов в вакцинах или систем адресной доставки лекарств .

В качестве примера Шрайбер приводит борьбу с раком через блокировку взаимодействия белков PD-1 и PDL-1. Опухоль использует это взаимодействие, чтобы «выключить» иммунную систему человека . С помощью RF Diffusion можно спроектировать белок-заглушку, который прикрепится к раковой клетке эффективнее, чем её естественная мишень, и тем самым разблокирует иммунный ответ .

🧪 Новая парадигма: от пробирок к цифровым агентам 1:18:03

Амели Шрайбер отмечает, что мы переходим к этапу, когда сложность инструментов требует участия ИИ-агентов. Она выделяет несколько перспективных направлений:

310 AI Co-pilot: Чат-интерфейс, который понимает естественный язык и умеет вызывать специализированные биологические модели как функции. Пользователь может просто написать: «Создай белок с такими-то свойствами и увеличь его сродство к этой мишени» .
Evo: Языковая модель, обученная на геномных данных (300 млрд токенов). Она способна предсказывать «существенность» генов: если изменение последовательности приводит к хаосу в предсказаниях модели, значит, этот участок критически важен для жизни .
Future House: Проект по созданию полностью автономного научного агента. Он должен самостоятельно изучать литературу, выдвигать гипотезы, проектировать молекулы и даже управлять роботизированной «мокрой» лабораторией .

По мнению гостьи, узким местом сейчас является не скорость вычислений, а внедрение этих технологий в реальную практику. Большинство биологов всё ещё не владеют навыками программирования, необходимыми для запуска этих моделей .

⚠️ Биобезопасность и этические риски 1:39:46

Обсуждая риски создания биологического оружия с помощью ИИ, Амели Шрайбер призывает к взвешенному подходу. Она считает сравнение чат-ботов с Google в контексте создания вирусов «старомодным» (quaint) .

Ключевые тезисы Шрайбер по безопасности:

Барьер синтеза: Спроектировать токсичную молекулу на компьютере — это лишь 10% дела. Основная сложность заключается в её синтезе, очистке и доставке, что требует высокотехнологичного оборудования и строго контролируется .
Государственные акторы: Реальная опасность исходит не от одиночек с Llama 3, а от государственных структур, имеющих доступ и к мощным моделям, и к современным лабораториям. Это вопрос международной политики, а не только технологий .
Преимущество защиты: ИИ может ускорить создание «универсальных вакцин», способных защищать от множества мутаций вируса одновременно, что дает защитникам преимущество перед атакующими .

Нейтан Лабенц обращает внимание на недавнюю политику Белого дома, установившую порог отчетности для биологических моделей на уровне 10^23 FLOPS (для сравнения, для языковых моделей — 10^26) . Это подчеркивает осознание государством того, что даже относительно небольшие модели в биологии могут иметь колоссальное влияние.

🌈 Финал: Смена человеческого сознания 1:55:50

В завершение дискуссии Амели Шрайбер делится оптимистичным прогнозом. Она считает, что в течение следующего десятилетия мы увидим значительное продление человеческой жизни и победу над многими неизлечимыми болезнями .

По её мнению, это приведет к сдвигу в самом сознании человечества. Когда ресурсы здоровья перестанут восприниматься как конечные и дефицитные, это изменит культуру и то, как люди относятся друг к другу и к времени, проведенному с близкими . Она утверждает, что ИИ может помочь исцелить не только физические болезни, но и психологические травмы общества, изменив наше восприятие окружающей среды .