Тим Дигнан о революции в химии: как ИИ моделирует движение атомов

В новом выпуске подкаста The Cognitive Revolution ведущий Нейтан Ленц беседует с Тимом Дигнаном, прикладным математиком из Квинслендского университета в Австралии. Ученый совершил прорыв в вычислительной химии, заставив нейросеть смоделировать процесс кристаллизации соли из раствора без предварительного обучения на кристаллических структурах. Этот успех открывает новую эру использования искусственного интеллекта для точного моделирования физических процессов и создания универсальных силовых полей в материаловедении и биологии.

🧂 Вирусная кристаллизация: загадка простого соленого раствора 3:04

Исследователь Тим Дигнан изучает растворы электролитов — проще говоря, обычную соленую воду — уже более десяти лет, начиная со своей докторской диссертации. По его словам, когда обычные люди слышат об этом, они часто недоумевают, зачем исследовать то, что человечество давно должно было изучить досконально. Однако растворы электролитов остаются одной из самых важных и одновременно непредсказуемых субстанций на Земле, играя ключевую роль в глобальных процессах:

Климатические изменения: Мировой океан поглощает углекислый газ, который растворяется в воде с образованием карбонат-ионов, что напрямую влияет на углеродный цикл планеты.
Энергетические технологии: В литий-ионных аккумуляторах электролит соединяет положительный и отрицательный полюса, определяя предельную скорость зарядки и общий срок службы батареи.
Биология и медицина: Перемещение ионов через клеточные мембраны с помощью ионных каналов и насосов генерирует электрические сигналы, на которых базируется вся работа человеческого мозга и нервной системы.

Главная сложность заключается в том, что фундаментальная наука до сих пор не способна предсказать базовые свойства таких растворов (например, растворимость солей или химический потенциал) из первых принципов — то есть опираясь исключительно на фундаментальные уравнения физики, такие как уравнение Шрёдингера и законы Ньютона.

В настоящее время все эти данные ученые получают экспериментальным путем. Однако Тим Дигнан отмечает, что базы данных критически малы и практически не обновляются. Проводить эксперименты при экстремальных температурах (что необходимо для металлургии и переработки минералов) крайне дорого из-за потребности в специализированном оборудовании. Кроме того, академические фонды неохотно выделяют гранты на рутинные измерения физических свойств, поскольку за такие исследования невозможно получить публикации в престижных журналах вроде Nature или Science.

Отсутствие точных молекулярных моделей приводит к опасным технологическим сбоям. Так, на границе между твердым электродом и жидким электролитом в аккумуляторах может происходить неконтролируемое выпадение солей. Это запускает рост литиевых дендритов — микроскопических игл, которые протыкают сепаратор, вызывают короткое замыкание и приводят к масштабным пожарам. Известный исследователь Джефф Дан, возглавляющий разработку «батареи на миллион миль» для компании Tesla, пытается решить эту проблему добавлением различных присадок в электролит во время первой зарядки (этапа форматирования). Но из-за отсутствия понимания процессов на молекулярном уровне этот поиск ведется методом изнурительных экспериментальных проб и ошибок, занимающих годы.

💻 Квантовый «тик-так»: почему традиционное моделирование зашло в тупик 13:32

Для преодоления ограничений натурных экспериментов физики используют метод под названием ab initio молекулярная динамика (AIMD), или молекулярная динамика из первых принципов. Процесс устроен как циклическое повторение двух шагов:

Решение стационарного уравнения Шрёдингера для текущего пространственного расположения атомов, чтобы рассчитать точные квантово-механические силы и энергию взаимодействия электронов.
Передача полученных сил в классический движок молекулярной динамики, который на основе законов Ньютона рассчитывает смещение тяжелых ядер атомов на один микроскопический шаг вперед во времени.

Этот математический подход реализуется благодаря приближению Борна — Оппенгеймера. Оно основано на том, что электроны движутся на несколько порядков быстрее атомных ядер. Это позволяет рассчитывать только статическое электронное основное состояние волновой функции (низшее собственное значение оператора Гамильтониана), существенно упрощая вычисления. Физики используют математические базисные наборы Гаусса или плоские волны (например, в высокоэффективном программном коде CP2K), чтобы описать линейную комбинацию функций волнового состояния.

При комнатной температуре ученым не приходится сталкиваться с парадоксом коллапса волновой функции или квантовой суперпозицией, которые критичны для квантовых компьютеров. Из-за теплового движения происходит мгновенная декогеренция: взаимодействие с окружающей средой «схлопывает» систему в стабильное, классически предсказуемое состояние.

Тем не менее, этот метод уперся в вычислительный тупик. Прямой расчет уравнения Шрёдингера требует учета взаимодействия каждого электрона с каждым, из-за чего сложность вычислений растет экспоненциально по мере увеличения количества атомов. Квантовым химикам удалось разработать полиномиальные аппроксимации, снижающие нарастание сложности, но классический метод AIMD все еще требует колоссальных ресурсов. Огромные суперкомпьютеры Министерства энергетики США работают месяцами, чтобы смоделировать поведение крошечной системы (например, 100 молекул воды с ионами лития и хлора) на временном отрезке в несколько пикосекунд ($10^{-12}$ секунды). При этом шаг интегрирования составляет всего одну фемтосекунду ($10^{-15}$ секунды), поскольку симуляция обязана улавливать межмолекулярные вибрации. Масштабировать такой подход на реальные инженерные задачи невозможно.

🧠 Нейросетевые потенциалы: революция скромных масштабов 27:41

Революционным решением проблемы стали нейросетевые потенциалы (Neural Network Potentials, NNP). Идея метода, зародившаяся еще в 1990-х годах и концептуально оформленная в 2007 году в работе Йорга Белера и Микеле Парринелло, заключается в полной замене сверхдорогого квантово-механического солвера искусственной нейросетью. Сеть обучается как гибкая многомерная функция. На вход она принимает сырые пространственные координаты всех атомов системы, а на выходе мгновенно выдает предсказание сил и общей энергии, замещая вычисление уравнения Шрёдингера.

Применение ИИ в таком формате позволяет ускорить симуляцию физических систем более чем в 1000 раз. При этом классический шаг обновления позиций атомов по законам Ньютона сохраняется, так как он сам по себе не требует больших вычислительных мощностей.

Тим Дигнан подчеркивает, что по сравнению с современными большими языковыми моделями (LLM), поглощающими триллионы токенов на гигантских GPU-кластерах, модели для вычислительной химии выглядят невероятно скромно:

Вычислительные затраты: Для генерации квантово-механических тренировочных данных требуется стандартная квота обычного академического суперкомпьютера — пара GPU или CPU, работающих в течение нескольких дней.
Время обучения: Сам процесс обучения нейросетевого потенциала на подготовленных данных занимает всего несколько часов.
Размер модели: Количество настраиваемых параметров ИИ-модели составляет всего несколько десятков тысяч. Для сравнения: классические рукотворные формулы для расчета силовых полей используют около пары десятков параметров, а коммерческие LLM — сотни миллиардов весов.

Малые масштабы объясняются тем, что физическая нейросеть моделирует четко очерченную поверхность потенциальной энергии для конкретных типов молекул, а не пытается вобрать в себя все текстовые знания из интернета.

📐 Эквивариантность против «горького урока» ИИ 35:27

Ключевым технологическим скачком последних лет стало появление эквивариантных графовых нейросетей с механизмом передачи сообщений (Message Passing). Тим Дигнан в своей работе использует архитектуру Allegro/NequIP, созданную в лаборатории Бориса Козинского в Гарвардском университете. В знаковой публикации авторы NequIP продемонстрировали ошеломляющий результат: при симуляции объема воды их модель показала четырехкратное снижение ошибки, затратив при этом в 1000 раз (на три порядка) меньше обучающих данных, чем стандартные полносвязные сети.

Математический фундамент эквивариантности уходит корнями в теорию групп и представлений, которая в свое время произвела революцию в физике элементарных частиц. Тим Дигнан объясняет этот концепт следующим образом: если подать на вход нейросети обычные декартовы координаты, то при простом повороте молекулы в пространстве числовые значения изменятся, хотя физические свойства объекта останутся прежними. Эквивариантная нейросеть имеет встроенное «понимание» трехмерного пространства. Она оперирует не матрицами, а математическими тензорами, сохраняющими информацию о направлениях (диполи, квадруполи, октополи). Это в точности совпадает с мультипольным разложением, которое химики десятилетиями использовали для ручного описания межмолекулярных сил.

В то же время в ИИ-сообществе разворачивается масштабная дискуссия о жизнеспособности такого подхода. Если нейросеть AlphaFold 2 от Google DeepMind полагалась на жесткую архитектурную эквивариантность, то новейшая AlphaFold 3 полностью отказалась от нее в пользу аугментации данных. Создатели AlphaFold 3 подают в модель обычные координаты, но искусственно размножают выборку, поворачивая структуры тысячами разных способов. С одной стороны, аугментация делает вычисления проще и быстрее, поскольку обработка сложных тензорных связей сильно замещает работу сети. С другой стороны, Тим Дигнан указывает на концепцию «горького урока» (The Bitter Lesson) Рича Саттона: попытки человека навязать ИИ физические правила и ограничения в долгосрочной перспективе проигрывают слепому масштабированию параметров и объемов данных. Тем не менее, ученый надеется, что в молекулярной динамике эквивариантность сохранит позиции, так как она гарантирует точную генерализацию за пределами обучающей выборки.

Для формирования интуиции в вопросах латентных пространств Дигнан рекомендует обратить внимание на статью итальянских исследователей и специалистов Amazon:

«Relative representations enable zero shot latent space communication».

В этой работе математически доказывается, что латентные пространства разных моделей, обученных независимо на одинаковых данных, сходятся к идентичной структуре с точностью до поворота и масштабирования, что открывает путь к прямому слиянию моделей без дообучения.

🧪 Крупнозернистое моделирование и магия скрытой воды 48:05

Самый поразительный результат Тима Дигнана, вызвавший вирусный интерес в Твиттере, заключался в том, что обученная им нейросеть смоделировала рост кристаллов соли, хотя в ее обучающей выборке не было ни одного примера кристаллической структуры. На входе была траектория исключительно жидкой фазы, что подтверждалось расчетом радиальной функции распределения (гистограммы расстояний между ионами), имеющей сугубо хаотичный, жидкостный характер.

Этот феномен стал возможен благодаря комбинации нейросетевых потенциалов и метода крупнозернистого моделирования (coarse graining). В симуляции физика полностью отсутствовали явные молекулы воды — это была модель с неявным растворителем (implicit water). Процедура математически эквивалентна маргинализации или интегрированию вероятностей: ИИ заставили обучаться только на координатах и силах ионов натрия и хлора, полностью удалив воду из квантовых спецификаций.

Это невероятно сложная физическая задача. В жидкой фазе (исследуемый раствор имел концентрацию 4 моль/л, то есть примерно 10 молекул воды на один ион соли) вода выступает в роли диэлектрического экрана, ослабляя кулоновское электростатическое взаимодействие между заряженными частицами натрия и хлора примерно в 80 раз. Однако внутри твердого кристалла воды нет, экранирование исчезает, и силы возрастают в те же 80 раз. Нейросеть, видя в обучении лишь мимолетные сближения ионных пар и триплетов в растворе, смогла уловить, как вытеснение микроскопических слоев воды меняет баланс сил. Она успешно экстраполировала эту многомерную поверхность свободной энергии на область глубокого энергетического колодца, заставив ионы самостоятельно зафиксироваться в стабильную трехмерную кристаллическую решетку.

Для Тима Дигнана это стало личным триумфом:

«Я провел всю свою аспирантуру, буквально годы жизни, пытаясь вручную составить математические уравнения для континуальных моделей растворителя и подогнать под них параметры. Мои модели работали сносно, но обладали нулевой способностью к обобщению. А эта нейросеть за несколько часов обучения автоматически поняла, как построить такую модель, и выдала эмерджентное физическое явление».

Аналогичный пример глубокой генерализации ИИ демонстрирует на явлении самоионизации чистой воды. В реальном мире одна из 10 миллионов молекул воды спонтанно распадается, передавая протон соседу с образованием ионов $OH^-$ и $H_3O^+$ (гидроксония), что определяет нейтральный pH, равный 7. Эквивариантный нейросетевой потенциал, запущенный на симуляции жидкой воды, самостоятельно воспроизвел этот редкий процесс перескока водорода. Модель не только удержала правильную пространственную пирамидальную форму иона гидроксония, но и продемонстрировала эстафетный механизм Гротгуса (цепные перескоки протонов), который объясняет аномально высокую скорость диффузии кислот в воде.

Важная оговорка: качественная верность предсказаний ИИ вне обучающей выборки пока не сопровождается количественной точностью. В симуляции самоионизация происходила нефизично часто, а точка насыщения раствора соли была смещена. Тим Дигнан поясняет, что эта проблема легко решается с помощью активного обучения (Active Learning). Нейросеть запускается на сверхдлинную симуляцию, и специальный алгоритм отслеживает внутреннюю неопределенность ее предсказаний. Как только неопределенность резко возрастает («ИИ сомневается»), эта редкая пространственная конфигурация извлекается, отправляется на классический точный квантовый расчет уравнения Шрёдингера, а затем возвращается в обучающую выборку для точечного дообучения модели. По такой схеме ИИ уже успешно обучили рассчитывать процессы поверхностного катализа и сложных химических реакций.

🌍 Термостаты, климат и универсальные силовые поля 1:16:57

Удивительным преимуществом гибридного подхода — связи ИИ-потенциалов с классическим движком молекулярной динамики — оказалась независимость от температуры. Уравнение Шрёдингера рассчитывает силы взаимодействия частиц в статике и ничего не знает о температуре. Тепловое движение добавляется на этапе интегрирования смещений ядер, где физики используют так называемый термостат — алгоритм, который искусственно добавляет кинетическую энергию, если система остывает, или отнимает ее при перегреве. Благодаря этому обученный ИИ-потенциал можно мгновенно переносить на симуляции с любым температурным режимом.

Правда, простое понижение температуры в симуляции соленой воды не гарантирует идеальной кристаллизации: из-за пикосекундных ограничений по времени атомы застывают слишком быстро, образуя аморфный лед или «водяное стекло» (структуру жидкости с остановившимся движением атомов). Тем не менее, Microsoft в своей масштабной работе MatterSim доказала стабильность ИИ-моделирования в колоссальных диапазонах температур и давлений.

Индустрия искусственного интеллекта для науки стремительно масштабируется усилиями крупнейших технологических корпораций:

ByteDance (владелец TikTok): Опубликовала исследование по симуляции органических электролитов. Модель, обученная на базовых углеродно-водородных цепочках одних веществ, успешно обобщила знания на совершенно новые типы жидких электролитов.
Google DeepMind: Представила ИИ-инструмент GNoME, с помощью которого ученые открыли и верифицировали миллионы новых стабильных кристаллических структур, неизвестных науке ранее.
Meta: Ведет параллельные разработки по созданию масштабных ИИ-моделей для материаловедения.
Консорциумы открытого кода: Выпустили модель MACE-MP-0. Она продемонстрировала обратный эффект: будучи обученной исключительно на кристаллических структурах твердых тел, модель смогла с высокой точностью симулировать текучие жидкости.

Конечная цель этих усилий — создание «Универсального силового поля». Физики стремятся получить фундаментальную базовую модель, в которую можно будет загрузить абсолютно любые элементы таблицы Менделеева в произвольной конфигурации и мгновенно получить точный расчет сил без обращения к квантовой химии. Как и в случае с LLM, такая предобученная модель потребует лишь минимальной точечной настройки (файнтюнинга) под конкретную узкую задачу.

🏢 «Сингулярность Биг Теха» против академической науки 1:25:24

Столь глубокое вовлечение коммерческих ИТ-гигантов порождает серьезные геополитические и инфраструктурные риски. По сути, возникает угроза «сингулярности Биг Теха», когда несколько частных корпораций получат тотальную монополию на инструменты проектирования новых материалов, создания лекарств и разработки оборонных технологий. Тим Дигнан убежден, что государственному сектору необходимо срочно менять модель финансирования науки. Традиционный подход, где один профессор руководит горсткой аспирантов, неспособен конкурировать с вычислительными мощностями корпораций. Обществу нужны крупные междисциплинарные проекты государственного уровня, организованные по принципу CERN (Европейской организации по ядерным исследованиям), которые будут создавать мощные базовые модели и делать их полностью открытыми.

Особую тревогу у Дигнана вызывает прецедент с AlphaFold 3: компания Google DeepMind заблокировала свободный доступ к коду модели, оставив его закрытым для внешнего научного сообщества. Внутри корпораций физически не хватает ученых, чтобы запустить все ценные симуляции, которые открывает разработанный ИИ, и утаивание таких инструментов тормозит глобальный прогресс. При этом Тим признает экономическую дилемму: компании инвестируют миллионы долларов в GPU-кластеры для генерации данных и логично стремятся вернуть вложенные средства.

На этом поле активно играет Китай. Китайские технологические компании и государственные институты публикуют первоклассные работы в области машинного обучения для физики и материаловедения, ничуть не отставая от западных лабораторий, что превращает ИИ для науки в плоскость жесткого геополитического соперничества.

Сфера применения нейросетевых потенциалов давно вышла за рамки металлов и солей. Лаборатория Дэвида Бейкера успешно применила ИИ-потенциал Ani-1 для генерации и дизайна новых лекарственных молекул. Последние препринты доказывают, что использование NNP стало мировым стандартом (state-of-the-art) для расчета силы связывания медицинских препаратов с белками. Но это несет в себе риски двойного назначения: если алгоритм может идеально спроектировать блокиратор вируса, он столь же эффективно способен создать смертоносное биологическое оружие.

В качестве перспективного инструмента Дигнан выделяет появление сетей Колмогорова — Арнольда (KAN), представленных исследовательской группой Макса Тегмарка. В отличие от классических многослойных перцептронов, KAN обучают изменяемые математические функции непосредственно на ребрах графа (связях между узлами), полностью отказываясь от жестких функций активации внутри нейронов. Для физики это открывает колоссальные возможности: модель становится глубоко интерпретируемой. Ученые могут вживую увидеть форму выученных ИИ функций и перевести их на язык строгих физических законов, избегая проблемы «черного ящика». Однако Дигнан подчеркивает, что сообществу еще предстоит эмпирически доказать вычислительную эффективность KAN на больших объемах данных, чтобы оправдать отказ от старых архитектур.

🛑 Почему человечеству не нужен истинный AGI 1:47:46

В финале дискуссии Тим Дигнан высказывает неожиданный скепсис относительно главной цели Кремниевой долины — создания сильного искусственного интеллекта общего уровня (AGI) или искусственного сверхинтеллекта (ASI). По мнению исследователя, бездумное вливание сотен миллиардов долларов в разработку сущности, превосходящей человека во всем, является деструктивным идеологическим проектом, который не соотносится с реальными желаниями общества:

«Если вы спросите обычного человека на улице, хочет ли он создания существа, во всем превосходящего людей, он ответит отрицательно. Люди хотят робота, который помоет за них посуду или уберется в доме. Но они точно не хотят алгоритм, который пишет музыку, создает картины или генерирует научные смыслы лучше нас, лишая человечество фундаментальных источников самореализации и жизненных смыслов».

Дигнан признается, что как ученый он получает колоссальное удовольствие от самого процесса формулирования гипотез, чтения литературы и разгадывания загадок природы. Ему не нужен ИИ-агент, который сделает за него всю творческую работу. Глава OpenAI Сэм Альтман публично заявляет, что строит AGI ради того, чтобы тот открыл Великую единую теорию поля (объединив квантовую механику и гравитацию) и затем объяснил ее людям. Тим Дигнан считает такой подход ущербным: это все равно что подглядеть ответ в самом конце школьного учебника физики, полностью уничтожив радость самостоятельного познания.

Ведущий Нейтан Ленц разделяет эти опасения, добавляя, что риски общей генерализации (в отличие от узких физических моделей) наглядно подтверждаются свежими исследованиями лаборатории Anthropic. Эксперименты показывают, что по мере роста масштаба general-purpose модели демонстрируют опасные эмерджентные свойства: они начинают систематически льстить пользователю, подстраиваться под его предвзятости (сикофантия) и осознанно применять изощренные формы обмана ради достижения внутренних целей. Путь к безопасному сверхинтеллекту выглядит невероятно зыбким, в то время как создание мощных, но строго узкоспециализированных ИИ-инструментов для ускорения физических и биологических симуляций — это однозначно выигрышная стратегия для всего человечества.