Биология как код: как ИИ-модели проектируют белки и лекарства

The Cognitive Revolution 6,7 тыс. 1 ч 59 мин 5 мин 25.05.2024
Главное

В этом выпуске ведущий Нейтан Лабенц обсуждает с вычислительным биохимиком и ИИ-исследователем Амели Шрайбер (Amelie Schreiber), как искусственный интеллект совершает фундаментальный сдвиг в биологии — от пассивного наблюдения к активному проектированию живых систем. Эксперт объясняет, почему современные нейросетевые архитектуры идеально подходят для расшифровки сложности белков и как «цифровые эксперименты» могут заменить десятилетия традиционных лабораторных исследований.

🧬 Сложность биологии и тупик традиционных методов 5:38

Биологические системы обладают колоссальной сложностью, которая долгое время не поддавалась традиционному аналитическому подходу . Амели Шрайбер отмечает, что на текущий момент человечество понимает лишь от 5% до 10% всех взаимодействий внутри клетки . Основная проблема заключается в том, что ДНК, РНК и белки представляют собой не просто статичные цепочки данных, а динамические машины, взаимодействующие в трехмерном пространстве.

Традиционные методы исследования имели серьезные ограничения:

По словам Амели Шрайбер, истинным «золотым стандартом» в биологии является распределение Больцмана — теоретическое распределение вероятностей, которое показывает, в каких формах (конформациях) белок проводит больше всего времени . Низкоэнергетические состояния — это стабильные формы, а пики энергии — транзитные, мимолетные состояния .

🦾 От статики к динамике: эпоха AlphaFold и Alpha Flow 18:04

Появление AlphaFold 2 от Google DeepMind стало отправной точкой революции, позволив предсказывать статичную 3D-структуру белка по его аминокислотной последовательности . Однако, как подчеркивает гостья, белки в клетке — это не застывшие статуи, а «дрожащие» (jiggly) структуры, меняющие форму в зависимости от температуры и окружения .

Новое поколение моделей решает проблему динамики:

  1. Distributional Graphormer: Обобщение AlphaFold, которое выдает не одну структуру, а целый ансамбль состояний и пути перехода между ними . Это диффузионная модель, работающая с белками аналогично тому, как DALL-E работает с изображениями .
  2. AlphaFlow: Модель на базе метода «matching flow» (сопоставление потоков), натренированная на данных молекулярной динамики. Она способна генерировать до 10 000 различных конформаций для одной молекулы, показывая, какие части белка наиболее подвижны .
  3. AlphaFold Multimer: Специализированная версия для моделирования взаимодействий между несколькими белками, предсказывающая, насколько плотно они стыкуются друг с другом, как детали пазла .

Амели Шрайбер объясняет успех ИИ-моделей эффектом «сжатия информации». В отличие от физических симуляций, нейросети работают как архиваторы: они не просчитывают каждый атом, а выучивают высокоуровневые концепции (мотивы белков) . Это позволяет получать ответы за минуты там, где физика требовала часов или дней .

🛠️ «Белковая хирургия» и проектирование новых лекарств 52:41

Одним из самых мощных инструментов в арсенале современного биохимика стала модель RF Diffusion. Она позволяет не просто предсказывать существующее, а создавать белки, которых никогда не было в природе .

Основные возможности «белковой хирургии» по версии Амели Шрайбер:

В качестве примера Шрайбер приводит борьбу с раком через блокировку взаимодействия белков PD-1 и PDL-1. Опухоль использует это взаимодействие, чтобы «выключить» иммунную систему человека . С помощью RF Diffusion можно спроектировать белок-заглушку, который прикрепится к раковой клетке эффективнее, чем её естественная мишень, и тем самым разблокирует иммунный ответ .

🧪 Новая парадигма: от пробирок к цифровым агентам 1:18:03

Амели Шрайбер отмечает, что мы переходим к этапу, когда сложность инструментов требует участия ИИ-агентов. Она выделяет несколько перспективных направлений:

По мнению гостьи, узким местом сейчас является не скорость вычислений, а внедрение этих технологий в реальную практику. Большинство биологов всё ещё не владеют навыками программирования, необходимыми для запуска этих моделей .

⚠️ Биобезопасность и этические риски 1:39:46

Обсуждая риски создания биологического оружия с помощью ИИ, Амели Шрайбер призывает к взвешенному подходу. Она считает сравнение чат-ботов с Google в контексте создания вирусов «старомодным» (quaint) .

Ключевые тезисы Шрайбер по безопасности:

Нейтан Лабенц обращает внимание на недавнюю политику Белого дома, установившую порог отчетности для биологических моделей на уровне 10^23 FLOPS (для сравнения, для языковых моделей — 10^26) . Это подчеркивает осознание государством того, что даже относительно небольшие модели в биологии могут иметь колоссальное влияние.

🌈 Финал: Смена человеческого сознания 1:55:50

В завершение дискуссии Амели Шрайбер делится оптимистичным прогнозом. Она считает, что в течение следующего десятилетия мы увидим значительное продление человеческой жизни и победу над многими неизлечимыми болезнями .

По её мнению, это приведет к сдвигу в самом сознании человечества. Когда ресурсы здоровья перестанут восприниматься как конечные и дефицитные, это изменит культуру и то, как люди относятся друг к другу и к времени, проведенному с близкими . Она утверждает, что ИИ может помочь исцелить не только физические болезни, но и психологические травмы общества, изменив наше восприятие окружающей среды .

💬 Цитаты

«Мы понимаем лишь от 5% до 10% всех взаимодействий внутри клетки. ИИ — единственный инструмент, способный справиться с остальным хаосом.»

Амели Шрайбер 07:49

«Дизайн белка на компьютере — это только одна стадия. Реальный мир требует синтеза и доставки, что крайне сложно для злоумышленников-одиночек.»

Амели Шрайбер 1:44:15
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Распределение Больцмана
Математическая модель, описывающая вероятность нахождения молекулы в определенном энергетическом состоянии.
Конформация
Пространственная форма, которую принимает молекула белка при вращении вокруг одинарных связей.
MSA (Multiple Sequence Alignment)
Метод сопоставления нескольких биологических последовательностей для выявления консервативных (неизменных) участков.
Олигомер
Молекула в виде цепочки из небольшого числа одинаковых звеньев (в контексте статьи — комплекс из нескольких белков).
📊 Цифры
🗓 Хронология
  1. 2021 Выход AlphaFold 2, решившей проблему предсказания статических структур белков.
  2. 2023 Появление моделей Distributional Graphormer и RF Diffusion, добавивших динамику и генеративные возможности.
  3. 2024 Партнерство OpenAI и Moderna для внедрения сотен специализированных GPT в процесс разработки вакцин.
⚖️ Другая сторона
Биология и медицина Амели Шрайбер AlphaFold RF Diffusion ProteinMPNN биоинженерия