Рафаэль Гомес-Бомбарелли о дизайне новых материалов с помощью машинного обучения

⚛️ Революция в дизайне материалов: Машинное обучение ускоряет открытие будущего 0:37

Современная материаловедческая наука стоит на пороге масштабной трансформации благодаря интеграции машинного обучения (ML) и квантовой физики. Рафаэль Гомес-Бомбарелли, доцент кафедры материаловедения и инженерии MIT, в своем выступлении на The TWIML AI Podcast обсудил, как именно ML помогает переосмыслить методы создания новых материалов — от молекулярных соединений до нанопористых структур.

🧪 Две стратегии создания материалов 3:59

Фундаментально подход к дизайну новых материалов разделяется на два ключевых направления, где ML выступает либо как инструмент оценки, либо как творческий генератор:

Виртуальный скрининг (Forward Problem): Это исторически более устоявшийся подход. Исследователи создают «прокси-функции» — модели, которые заменяют дорогостоящие физические эксперименты или сложные компьютерные симуляции. С помощью активного обучения модель ищет «неопределенные» точки в дизайне, где данные могут принести максимальную пользу для поиска новых кандидатов.
Инверсивный дизайн (Inverse Design): Это «переворачивание» задачи: вместо того чтобы проверять структуру на наличие свойств, исследователь задает нужные свойства, а модель пытается подобрать соответствующую структуру. В этом процессе используются генеративные нейронные сети, аналогичные тем, что создают изображения лиц, но применительно к кристаллическим решеткам и молекулам.

По мнению Гомеса-Бомбарелли, эти подходы лучше рассматривать как последовательность: сначала необходимо освоить «внутреннее пространство» физических законов через виртуальный скрининг, прежде чем пытаться полноценно моделировать «неограниченный» мир новых соединений.

🧱 Роль физики и вызовы «пермутационной инвариантности» 2:23

В своей работе исследовательская группа опирается на теорию функционала плотности (DFT) — метод квантовой механики, обеспечивающий высокую точность при приемлемых вычислительных затратах. Однако ML сталкивается с фундаментальной проблемой в работе с материей — пермутационной инвариантностью.

Природу, в отличие от алгоритмов, не волнует порядок нумерации атомов: системе безразлично, какой атом считается первым, а какой двадцать седьмым. Использование простых последовательностей для описания молекул не решает эту задачу, поэтому отрасль активно развивает графовые нейронные сети (GNN), которые способны учитывать симметрию и инвариантность структуры.

🧠 Оптимизация и проблема «химических скал» 34:03

Важной частью процесса является гиперпараметрическая оптимизация (HPO). Гомес-Бомбарелли отмечает, что HPO — это не просто «вишенка на торте», а критический этап, превращающий экспериментальную модель, которая «работает кое-как», в стабильный инструмент.

Тем не менее, даже с использованием продвинутых методов, остаются значительные препятствия:

Проблема переноса (Transferability): Модели часто с трудом обобщаются на новые семейства молекул, не представленные в обучающей выборке.
«Химические скалы»: Малые изменения в структуре могут приводить к радикальным изменениям свойств, что делает интерполяцию крайне сложной задачей.
Специфичность расстояний: Определение «похожести» молекул крайне зависимо от конкретного свойства (например, токсичности или растворимости). Метрики, работающие для одного параметра, часто оказываются бесполезны для другого.

🦾 Реализуемость: от симуляций к лаборатории 49:04

Вопрос о том, можно ли созданный моделью материал действительно произвести, остается дискуссионным. Академическое сообщество сейчас активно внедряет автоматизированные лабораторные установки (роботов), которые могут реализовывать химические операции, предложенные алгоритмами. В материаловедении, где создание веществ часто определяется термодинамикой и поведением сплавов при высоких температурах, ученые стремятся встроить ограничения «реализуемости» непосредственно в архитектуру моделей.