Сиюй Хэ: «Биологический ИИ позволит прожить столетие прогресса за десять лет»

The Cognitive Revolution 5,4 тыс. 1 ч 43 мин 4 мин 23.03.2025
Главное

В области современной биологии происходит фундаментальный сдвиг: традиционные «мокрые» лаборатории (wet labs) дополняются и во многих аспектах замещаются вычислительными методами. Сиюй Хэ, исследователь из Стэнфорда, работает на острие этой трансформации, создавая ИИ-архитектуры, способные предсказывать поведение клеток и реконструировать структуру тканей с беспрецедентной точностью. В центре внимания — два прорывных проекта: Squidiff, использующий диффузионные модели для симуляции реакции клеток на внешние раздражители, и CORAL, решающий проблему интеграции пространственных данных разного разрешения.

🧬 Клетка как массив данных: Основы транскриптомики 7:30

Для понимания работы Squidiff необходимо пересмотреть биологическое определение клетки. Сиюй Хэ цитирует своего научного руководителя Стивена Куэйка, который называет клетку «мешком с РНК» . Хотя почти все клетки организма содержат одинаковую ДНК, именно процессы транскрипции (превращение ДНК в РНК) определяют их функции и состояние.

🦑 Squidiff: Диффузионные модели для симуляции жизни 14:44

Squidiff — это генеративная модель, предназначенная для создания «цифровых транскриптомов». Вместо того чтобы ждать месяцы в лаборатории, исследователи могут использовать ИИ для предсказания того, как клетка ответит на химическое воздействие или генетическую модификацию.

🧪 Эксперименты in-silico: Векторная арифметика в биологии 48:18

Одной из самых впечатляющих возможностей Squidiff является проведение виртуальных экспериментов через манипуляции в латентном (скрытом) пространстве. Это работает по аналогии со знаменитым примером из лингвистических моделей: «Король - Мужчина + Женщина = Королева».

🪸 CORAL: Сшивание тканей и решение проблемы разрешения 1:11:48

Если Squidiff работает на уровне отдельных клеток, то проект CORAL (COherent Reconstruction and Alignment) нацелен на уровень тканей. Главная проблема здесь — «разрыв масштабов».

🤖 Будущее: Синтетические данные и «Манхэттенский проект» для биологии 1:30:36

Сиюй Хэ и ведущий обсудили перспективы масштабирования этих технологий. Одной из ключевых тем стало использование синтетических данных для обучения.

Оба собеседника сошлись во мнении, что биология данных переживает экспоненциальный рост. Сиюй Хэ подчеркнул, что хотя ИИ развивается пугающе быстро, в медицине он является инструментом «чистого созидания», который поможет значительно ускорить разработку методов лечения тяжелых заболеваний .

💬 Цитаты

«Клетка — это мешок с РНК.»

Сиюй Хэ (цитируя Стивена Куэйка) 10:40

«Мы можем использовать векторные операции в латентном пространстве для манипуляций с биологическими смыслами.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Транскриптом
Совокупность всех молекул РНК, синтезируемых в клетке в данный момент времени.
Деконволюция
Процесс разделения смешанного сигнала на его исходные компоненты (в данном случае — разделение усредненных данных ткани на отдельные клетки).
In-silico
Биологический эксперимент, проводимый исключительно на компьютере или с помощью компьютерной симуляции.
📊 Цифры
🗓 Хронология
  1. 2017 Появление первых технологий пространственной транскриптомики (примерно за 7 лет до интервью).
  2. 2022 Публикация модели I-Design для генерации синтетических пространственных данных в Nature Biotech.
  3. 2024 Активная разработка и обсуждение моделей Squidiff и CORAL.
⚖️ Другая сторона
Биология и медицина Сиюй Хэ Squidiff CORAL транскриптомика Diffusion Models