# Бхарат Рамсундар о будущем науки: от AlphaFold до меш-фри методов

Источник: https://www.youtube.com/watch?v=YhklrslgnC8
Канал: The TWIML AI Podcast with Sam Charrington
Опубликовано: 04.04.2022

---

## Революция в поиске лекарств: Бхарат Рамсундар и экосистема DeepChem 🧪
[[JUMP:0:16]]

В мире биофармацевтики, где разработка одного препарата может стоить миллиарды долларов и занимать десятилетия, искусственный интеллект становится главным инструментом ускорения прогресса. Бхарат Рамсундар, основатель и CEO компании Deep Forest Sciences, рассказал в подкасте The TWIML AI Podcast о том, как его проект DeepChem трансформирует процесс поиска молекул и почему будущее медицины зависит от междисциплинарных экспертов, владеющих как биологией, так и глубоким обучением.

### 🧬 Искусственный интеллект на службе у химиков и биологов
[[JUMP:4:48]]

Рамсундар предлагает разделять область применения ИИ в науке на две фундаментальные сферы: машинное обучение (ML) для химии и ML для биологии.

*   **Машинное обучение в химии:** Эта область демонстрирует стремительный рост. Прогнозирование свойств молекул, по словам Рамсундара, становится всё более стандартизированной задачей, сравнимой с анализом изображений. Основной барьер здесь — дефицит данных («low data setting»). В отличие от интернета, где данные генерируют пользователи, в химии каждый датасет требует дорогостоящих экспериментов в лаборатории.
*   **Машинное обучение в биологии:** Сфера остается загадочной и находится на ранней стадии. Исключением стал прорыв AlphaFold 2 от DeepMind, который, по мнению Рамсундара, «решил» 50-летнюю проблему предсказания структуры белков. Тем не менее, попытки использовать ИИ для понимания таких сложных заболеваний, как болезнь Альцгеймера, пока сталкиваются с непреодолимыми трудностями, так как текущие алгоритмы не могут полностью охватить «историю эволюции» человеческого организма.

### 🛠 DeepChem: от академических скриптов к производственному стандарту
[[JUMP:8:15]]

Проект DeepChem начался с желания Рамсундара воспроизвести научную статью, написанную во время стажировки в Google, когда он работал с системой Disbelief (предшественником TensorFlow). Сегодня это одна из самых популярных open-source платформ для поиска лекарств.

Основные задачи, которые решает DeepChem для практиков:

*   **Стабилизация моделей:** DeepChem забирает лучшие наработки из научных статей, которые часто остаются «брошенными» кодом на GitHub, и превращает их в стабильные, протестированные реализации.
*   **Научно-ориентированный слой:** Библиотека работает на уровень выше, чем стандартные фреймворки типа PyTorch или TensorFlow, предоставляя инструменты для загрузки специфических химических форматов данных и их обработки («featurization»).
*   **Образовательная миссия:** Сообщество активно развивает базу знаний, включая серию из 30 обучающих материалов и книгу «Deep Learning for the Life Sciences», изданную O’Reilly.

### 🎯 MoleculeNet: «ImageNet для молекул»
[[JUMP:20:11]]

Чтобы стандартизировать оценку алгоритмов, Рамсундар вместе с коллегами создал бенчмарк-сюиту MoleculeNet. По его словам, успех ImageNet в компьютерном зрении вдохновил их на создание аналогичного набора данных для молекулярного дизайна. Важнейшим вкладом проекта стало внедрение «химически осознанного» процесса валидации.

В отличие от случайного разделения данных (random split), которое часто дает ложные результаты, в MoleculeNet используется «scaffold splitter» (разделитель по остову молекулы). Это позволяет тестировать модели на молекулах, химическая структура которых существенно отличается от той, что была в обучающей выборке, что лучше отражает реальную эффективность препарата.

### 🚀 Будущее моделирования: меш-фри методы
[[JUMP:26:17]]

Одним из наиболее перспективных направлений своих текущих исследований Рамсундар называет применение глубокого обучения к решению дифференциальных уравнений в частных производных (PDE). Это фундаментальный математический инструмент, лежащий в основе проектирования всего: от автомобилей до аэрокосмической техники.

Главное преимущество новых ИИ-методов — возможность отказаться от использования «сетки» (mesh), которая была обязательна в традиционных методах конечных элементов (finite element methods). «Меш-фри» (mesh-free) подходы позволяют значительно ускорить итеративное проектирование, позволяя инженерам, например, тестировать радикальные формы автомобилей за секунды вместо долгих часов расчетов.

### 💼 Продуктовое видение: Deep Forest Sciences
[[JUMP:28:01]]

Компания Deep Forest Sciences, основанная Рамсундаром, постепенно переходит от консалтинга к созданию собственного продукта — системы Chiron.

По мнению Рамсундара, большинство биотехнологических компаний не могут позволить себе содержать отдел разработки программного обеспечения мирового уровня, так как их бизнес — поиск лекарств, а не написание кода. Deep Forest Sciences берет на себя «сложные проблемы ИИ», позволяя ученым сосредоточиться на их главной задаче — терапии и биологических гипотезах.