Рафаэль Гомес-Бомбарелли о дизайне новых материалов с помощью машинного обучения

The TWIML AI Podcast 1,1 тыс. 55 мин 2 мин 07.02.2022
Главное

⚛️ Революция в дизайне материалов: Машинное обучение ускоряет открытие будущего 0:37

Современная материаловедческая наука стоит на пороге масштабной трансформации благодаря интеграции машинного обучения (ML) и квантовой физики. Рафаэль Гомес-Бомбарелли, доцент кафедры материаловедения и инженерии MIT, в своем выступлении на The TWIML AI Podcast обсудил, как именно ML помогает переосмыслить методы создания новых материалов — от молекулярных соединений до нанопористых структур.

🧪 Две стратегии создания материалов 3:59

Фундаментально подход к дизайну новых материалов разделяется на два ключевых направления, где ML выступает либо как инструмент оценки, либо как творческий генератор:

По мнению Гомеса-Бомбарелли, эти подходы лучше рассматривать как последовательность: сначала необходимо освоить «внутреннее пространство» физических законов через виртуальный скрининг, прежде чем пытаться полноценно моделировать «неограниченный» мир новых соединений.

🧱 Роль физики и вызовы «пермутационной инвариантности» 2:23

В своей работе исследовательская группа опирается на теорию функционала плотности (DFT) — метод квантовой механики, обеспечивающий высокую точность при приемлемых вычислительных затратах. Однако ML сталкивается с фундаментальной проблемой в работе с материей — пермутационной инвариантностью.

Природу, в отличие от алгоритмов, не волнует порядок нумерации атомов: системе безразлично, какой атом считается первым, а какой двадцать седьмым. Использование простых последовательностей для описания молекул не решает эту задачу, поэтому отрасль активно развивает графовые нейронные сети (GNN), которые способны учитывать симметрию и инвариантность структуры.

🧠 Оптимизация и проблема «химических скал» 34:03

Важной частью процесса является гиперпараметрическая оптимизация (HPO). Гомес-Бомбарелли отмечает, что HPO — это не просто «вишенка на торте», а критический этап, превращающий экспериментальную модель, которая «работает кое-как», в стабильный инструмент.

Тем не менее, даже с использованием продвинутых методов, остаются значительные препятствия:

  1. Проблема переноса (Transferability): Модели часто с трудом обобщаются на новые семейства молекул, не представленные в обучающей выборке.
  2. «Химические скалы»: Малые изменения в структуре могут приводить к радикальным изменениям свойств, что делает интерполяцию крайне сложной задачей.
  3. Специфичность расстояний: Определение «похожести» молекул крайне зависимо от конкретного свойства (например, токсичности или растворимости). Метрики, работающие для одного параметра, часто оказываются бесполезны для другого.

🦾 Реализуемость: от симуляций к лаборатории 49:04

Вопрос о том, можно ли созданный моделью материал действительно произвести, остается дискуссионным. Академическое сообщество сейчас активно внедряет автоматизированные лабораторные установки (роботов), которые могут реализовывать химические операции, предложенные алгоритмами. В материаловедении, где создание веществ часто определяется термодинамикой и поведением сплавов при высоких температурах, ученые стремятся встроить ограничения «реализуемости» непосредственно в архитектуру моделей.

💬 Цитаты

«Мы осознали, что у нас больше нет проблем с физикой, у нас были проблемы с данными.»

Рафаэль Гомес-Бомбарелли 1:32

«В материаловедении химическое пространство оказалось невероятно сложным для интерполяции.»

Рафаэль Гомес-Бомбарелли 38:16
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
DFT (Density Functional Theory)
Метод симуляции, основанный на квантовой механике, который используется для предсказания свойств материалов.
Графовые нейронные сети (GNN)
Архитектура нейронных сетей, идеально подходящая для обработки данных, представленных в виде графов (например, атомов и связей в молекуле).
Пермутационная инвариантность
Свойство алгоритма выдавать одинаковый результат независимо от порядка, в котором описываются элементы системы (например, атомы).
Инверсивный дизайн
Метод проектирования, при котором свойства материала являются входными данными, а структура — результатом работы модели.
Коарс-грейнинг (Coarse graining)
Метод симуляции, при котором группа атомов объединяется в одну «бусину» для упрощения и ускорения вычислений.
📊 Цифры
⚖️ Другая сторона
Наука Rafael Gomez-Bombarelli Материаловедение Машинное обучение DFT Генеративные модели