# Рафаэль Гомес-Бомбарелли о дизайне новых материалов с помощью машинного обучения

Источник: https://www.youtube.com/watch?v=lz1r3l4Erm0
Канал: The TWIML AI Podcast
Опубликовано: 07.02.2022

---

## ⚛️ Революция в дизайне материалов: Машинное обучение ускоряет открытие будущего
[[JUMP:0:37]]

Современная материаловедческая наука стоит на пороге масштабной трансформации благодаря интеграции машинного обучения (ML) и квантовой физики. Рафаэль Гомес-Бомбарелли, доцент кафедры материаловедения и инженерии MIT, в своем выступлении на The TWIML AI Podcast обсудил, как именно ML помогает переосмыслить методы создания новых материалов — от молекулярных соединений до нанопористых структур.

### 🧪 Две стратегии создания материалов
[[JUMP:3:59]]

Фундаментально подход к дизайну новых материалов разделяется на два ключевых направления, где ML выступает либо как инструмент оценки, либо как творческий генератор:

*   **Виртуальный скрининг (Forward Problem):** Это исторически более устоявшийся подход. Исследователи создают «прокси-функции» — модели, которые заменяют дорогостоящие физические эксперименты или сложные компьютерные симуляции. С помощью активного обучения модель ищет «неопределенные» точки в дизайне, где данные могут принести максимальную пользу для поиска новых кандидатов.
*   **Инверсивный дизайн (Inverse Design):** Это «переворачивание» задачи: вместо того чтобы проверять структуру на наличие свойств, исследователь задает нужные свойства, а модель пытается подобрать соответствующую структуру. В этом процессе используются генеративные нейронные сети, аналогичные тем, что создают изображения лиц, но применительно к кристаллическим решеткам и молекулам.

По мнению Гомеса-Бомбарелли, эти подходы лучше рассматривать как последовательность: сначала необходимо освоить «внутреннее пространство» физических законов через виртуальный скрининг, прежде чем пытаться полноценно моделировать «неограниченный» мир новых соединений.

### 🧱 Роль физики и вызовы «пермутационной инвариантности»
[[JUMP:2:23]]

В своей работе исследовательская группа опирается на теорию функционала плотности (DFT) — метод квантовой механики, обеспечивающий высокую точность при приемлемых вычислительных затратах. Однако ML сталкивается с фундаментальной проблемой в работе с материей — пермутационной инвариантностью.

Природу, в отличие от алгоритмов, не волнует порядок нумерации атомов: системе безразлично, какой атом считается первым, а какой двадцать седьмым. Использование простых последовательностей для описания молекул не решает эту задачу, поэтому отрасль активно развивает графовые нейронные сети (GNN), которые способны учитывать симметрию и инвариантность структуры.

### 🧠 Оптимизация и проблема «химических скал»
[[JUMP:34:03]]

Важной частью процесса является гиперпараметрическая оптимизация (HPO). Гомес-Бомбарелли отмечает, что HPO — это не просто «вишенка на торте», а критический этап, превращающий экспериментальную модель, которая «работает кое-как», в стабильный инструмент.

Тем не менее, даже с использованием продвинутых методов, остаются значительные препятствия:

1.  **Проблема переноса (Transferability):** Модели часто с трудом обобщаются на новые семейства молекул, не представленные в обучающей выборке.
2.  **«Химические скалы»:** Малые изменения в структуре могут приводить к радикальным изменениям свойств, что делает интерполяцию крайне сложной задачей.
3.  **Специфичность расстояний:** Определение «похожести» молекул крайне зависимо от конкретного свойства (например, токсичности или растворимости). Метрики, работающие для одного параметра, часто оказываются бесполезны для другого.

### 🦾 Реализуемость: от симуляций к лаборатории
[[JUMP:49:04]]

Вопрос о том, можно ли созданный моделью материал действительно произвести, остается дискуссионным. Академическое сообщество сейчас активно внедряет автоматизированные лабораторные установки (роботов), которые могут реализовывать химические операции, предложенные алгоритмами. В материаловедении, где создание веществ часто определяется термодинамикой и поведением сплавов при высоких температурах, ученые стремятся встроить ограничения «реализуемости» непосредственно в архитектуру моделей.