Йохан Ментинк: «Мы можем преодолеть барьеры, недоступные цифровым технологиям»

С развитием искусственного интеллекта человечество столкнулось с беспрецедентным энергетическим кризисом, заставляющим технологических гигантов скупать мощности ядерных реакторов для обеспечения дата-центров. В ходе лекции в Королевском институте (The Royal Institution) физик Йохан Ментинк из Университета Радбуда рассказал, как преодолеть этот тупик с помощью нейроморфных вычислений. Перенос архитектурных принципов работы человеческого мозга на полупроводниковые и немагнитные платформы обещает совершить прорыв в решении сложнейших квантовых задач, которые сегодня считаются принципиально невычислимыми.

⚡ Энергетический тупик современного AI 1:44

В современной индустрии информационных технологий фокус сместился с абстрактной «энергоэффективности» на физическое наличие доступной энергии. По словам Йохана Ментинка, традиционные электросети уже не справляются с колоссальными затратами, которых требуют передовые модели искусственного интеллекта. Ярким подтверждением этого тренда является недавнее решение корпорации Microsoft выкупить мощности печально известной американской АЭС (Three Mile Island) исключительно для энергоснабжения своих ИИ-моделей.

Помимо энергетического голода, спикер выделяет две фундаментальные проблемы текущей ИТ-инфраструктуры:

Конфиденциальность и безопасность: огромные объемы личных данных, включая медицинские показатели, непрерывно транслируются со смартфонов на удаленные серверы.
Утрата цифрового суверенитета: европейские страны вынуждены отправлять свои данные в дата-центры нескольких крупнейших американских корпораций, полностью теряя контроль над их обработкой.

Согласно исследованиям ученых из Лондона, текущие темпы масштабирования технологий абсолютно неустойчивы. Если до 2010 года развитие электроники подчинялось закону Мура, то сегодня энергетические аппетиты вычислительных систем удваиваются каждые 3–4 месяца. По мнению Йохана Ментинка, спасением могут стать граничные (edge) вычисления высокой производительности, позволяющие обрабатывать данные непосредственно на пользовательских устройствах.

🧠 Архитектурный барьер: Абак против человеческого мозга 6:31

Само понятие «нейроморфный» означает повторение морфологии или структуры человеческого мозга. В основе современных цифровых компьютеров лежат принципы, заложенные Аланом Тьюрингом и Джоном фон Нейманом. Фактически они представляют собой усложненные варианты механических счетов (абака) или вычислительной машины Паскаля, созданных для рутинных последовательных расчетов.

Главный недостаток архитектуры фон Неймана — жесткое физическое разделение процессора (где происходят вычисления) и памяти (где хранятся данные в виде нулей и единиц). Постоянная пересылка инструкций и данных между этими блоками создает так называемое «бутылочное горлышко». Именно на этот транспорт тратится львиная доля энергии, из-за чего лучшие современные суперкомпьютеры потребляют до 50 МВт мощности.

Человеческий мозг устроен принципиально иначе:

Локальность: процессоры (нейроны) интегрированы напрямую с памятью (синапсами).
Параллелизм: вычисления происходят одновременно по всей сети, а не последовательно.
Природа сигналов: в отличие от детерминированной цифровой логики, мозг работает в аналоговом и крайне зашумленном режиме.

☢️ Парадокс плотности мощности и ядерный реактор в кармане 9:47

Чтобы наглядно продемонстрировать масштаб проблемы, Йохан Ментинк ссылается на классический график плотности мощности микрочипов, предоставленный компанией Intel. Плотность измеряется в ваттах на квадратный сантиметр ($Вт/см^2$), что примерно соответствует площади одного кристалла.

Эволюция процессоров наглядно иллюстрирует тепловой кризис:

Intel 8086: плотность мощности составляла скромный 1 $Вт/см^2$.
Семейство Pentium: показатель достиг 10 $Вт/см^2$, что эквивалентно тепловыделению кухонной электроплиты.
Pentium II и III: плотность мощности перешагнула отметку в 100 $Вт/см^2$, сравнявшись с плотностью тепловыделения активной зоны ядерного реактора.

При сохранении прежних тенденций микроэлектроника рисковала бы достичь плотности сопла ракетного двигателя или даже поверхности Солнца (10 000 $Вт/см^2$). Физик предлагает простую оценку: диаметр стандартного тепловыделяющего элемента (ТВЭЛ) в реакторе равен 10 см, а площадь чипа смартфона — 1 $см^2$. Разделив их площади, мы получим, что плотность энергии в кармане каждого пользователя эквивалентна тому, как если бы один ядерный стержень питал всего около 75 современных смартфонов.

🔬 Квантовая проблема многих тел и Нобелевский вклад в физику 14:07

Перед фундаментальной наукой стоят вызовы, требующие колоссальных вычислений. В материаловедении и физике элементарных частиц ключевой преградой является проблема многих тел. При расчете квантовых систем (например, бинарных спинов — магнитных моментов) сложность задачи растет экспоненциально как $2^N$, где $N$ — число частиц.

Огромные массивы данных генерируют и современные научные установки. Так, детектор ЦЕРН (CERN) производит более 100 петабайт данных в год. Астрономический телескоп LOFAR выдает более 300 петабайт ежегодно, а строящийся комплекс SKA потребует бюджетов, несопоставимых с возможностями обычного коммерческого железа. Климатические симуляции и вовсе оперируют масштабами свыше эксабайта в год.

Прорыв произошел благодаря концепции искусственных нейросетей. Исследователи Джузеппе Карлео и Маттиас Тройер доказали, что квантовую волновую функцию можно эффективно аппроксимировать с помощью классической нейросети, сократив время расчета с экспоненциального до полиномиального. Для этого они использовали ограниченную машину Больцмана (Restricted Boltzmann Machine, RBM), созданную Джеффри Хинтоном, который в 2026 году уже является лауреатом Нобелевской премии по физике. В этой архитектуре сложность задается параметром $\alpha$ — отношением скрытых нейронов к видимым.

Применив этот метод для двумерных магнитных систем, команда Йохана Ментинка открыла явление супермагнонной пропагации. Это динамический режим, при котором скорость распространения возмущений в магнетике превышает максимальную скорость собственных магнитных волн, что позволяет интерполировать поведение системы между квантовым и классическим пределами. Однако даже оптимизированный алгоритм для решетки размером всего $24 \times 24$ элемента требует 6 часов на один шаг оптимизации, а полный расчет занял бы 75 дней.

Для преодоления этого барьера ученым необходимо аппаратно ускорить две базовые операции:

Векторно-матричное умножение (этап логического вывода / inference).
Стохастическое сэмплирование по методу Монте-Карло.

💾 Вычисления в памяти: Переход к сложности $\mathcal{O}(1)$ 26:40

Идея вычислений в памяти (In-Memory Computing) заключается в физическом воплощении математической матрицы в структурах оборудования. В простейшем виде это кроссбар — сетка из пересекающихся строк и столбцов. В точках их пересечения располагаются миниатюрные элементы памяти с настраиваемым электрическим сопротивлением.

Математические операции здесь выполняются за счет фундаментальных законов физики:

Закон Ома: сила тока на сопротивлении равна произведению напряжения на проводимость ($I = V \cdot G$).
Закон Кирхгофа: токи из разных ветвей суммируются на выходной шине колонки.

Поскольку веса (значения матрицы) зафиксированы в виде проводимости самих элементов, полностью исчезает необходимость тратить энергию на пересылку данных из памяти в процессор. В качестве изменяемых сопротивлений инженеры используют мемристоры — резисторы с памятью на базе фазового перехода (phase-change material), оксидов металлов или ферроэлектрических и магнитных туннельных переходов (MTJ).

На традиционном цифровом компьютере последовательное умножение вектора на матрицу имеет вычислительную сложность порядка $\mathcal{O}(N^2)$. Мемристорный кроссбар выполняет всю операцию параллельно за один физический такт, обеспечивая сложность уровня $\mathcal{O}(1)$. Теоретический предел производительности таких архитектур измеряется в тераоперациях в секунду (TOPS) при энергопотреблении в пределах нескольких милливатт.

Аспирант Доминик из команды Ментинка провел бенчмаркинг совместно со специалистами компании IBM, протестировав аналоговый чип Hermes, содержащий кроссбар размером $512 \times 512$ мемристоров и всю необходимую периферию (ЦАП, АЦП). Эксперимент показал, что для небольших сетей стандартные GPU (например, Nvidia V100) все еще выигрывают в скорости, хотя аналоговый чип уже в 100 раз эффективнее по энергии. Однако при масштабировании задачи — на примере поиска аномалий в физике элементарных частиц, разработанного Сашей Кароном, — нейроморфное решение полностью опередило классические процессоры, показав 20-кратный прирост пропускной способности и превосходство по энергоэффективности более чем в 1000 раз.

🎲 Стохастические вычисления и фундаментальные пределы Ландауэра 36:44

Вторым важнейшим направлением является использование естественной стохастичности (случайности) физических систем. Согласно принципу Ландауэра, сформулированному в IBM еще в 1960-х годах, любое необратимое стирание одного бита информации неминуемо рождает тепло и увеличивает энтропию. Минимальная работа, необходимая для этого при комнатной температуре, составляет $k_B T \ln 2$, что равняется примерно $10^{-21}$ Дж (один зептоджоуль).

Если рассчитать теоретический предел для человеческого мозга, содержащего около 100 триллионов ($10^{14}$) синапсов, работающих со средней частотой вспышек в 10 Гц, то минимальная необходимая мощность составит всего 1 микроватт. Как утверждают нейробиологи в статье журнала PNAS, реальный мозг расходует около 20 Вт, то есть отдельные биологические элементы потенциально могут быть еще в 100 миллионов раз эффективнее.

Чтобы приблизиться к этим пределам, ученые предлагают создавать вероятностные компьютеры на базе так называемых P-битов (probabilistic bits), концепцию которых активно развивает Керем Чамсари. В отличие от жестких магнитных битов жесткого диска, защищенных высоким энергетическим барьером, P-бит намеренно создается нестабильным. Под действием обычного теплового шума он непрерывно меняет свое состояние (с 0 на 1 и обратно), генерируя абсолютно бесплатные случайные числа.

Объединив такие стохастические биты в сеть, физики получают стохастическую машину Изинга. Если заставить P-биты реагировать на внешнее окружение пропорционально гиперболическому тангенсу, система начинает автоматически минимизировать распределение вероятностей своего гамильтониана. На цифровом компьютере алгоритм сэмплирования Монте-Карло по схеме марковских цепей выполняется строго последовательно, требуя сложности порядка $\mathcal{O}(N)$. Стохастическая машина Изинга выполняет переворот всех битов параллельно — за время $\mathcal{O}(1)$.

Аспирант Рутгер Бернс исследовал время корреляции в таких сетях и доказал, что выигрыш не зависит от геометрического размера системы. Согласно консервативным прогнозам ученых, специализированные стохастические устройства обеспечат ускорение расчетов в $1000$ раз и снизят энергопотребление на 5 порядков ($10^5$) по сравнению с самым быстрым цифровым кодом.

🚀 Будущее нейроморфной экосистемы: От атомов до суперкомпьютеров 51:28

Одной из главных трудностей нейроморфных систем остается их обучение. Классический алгоритм обратного распространения ошибки (backpropagation) требует нелокальных вычислений и колоссальных затрат энергии. Профессор Марсель ван Гервен разработал альтернативный локальный алгоритм обучения, который использует искусственный впрыск шума для точной корректировки весов. Первые тесты этой концепции, проведенные совместно с лабораторией в Майнце на реальных стохастических магнетиках, подтвердили ее высокую жизнеспособность.

Параллельно развиваются и другие направления нейроморфного проекта:

Атомарные синапсы: профессор Александр Хаджитурянс успешно создает искусственные нейроны и синапсы размером в один единственный атом.
Startup-экосистема: Нидерланды стали одним из центров нейроморфных технологий. Из 20–25 профильных стартапов в мире 5 базируются в этой стране.
Масштабируемые проекты: архитектура SpiNNaker, созданная под руководством Стива Фёрбера в Манчестере, эволюционировала до версии SpiNNaker2.
Коммерческие суперкомпьютеры: компания Intel запустила нейроморфный суперкомпьютер Hala Point.

Использование даже промежуточных программируемых логических матриц (FPGA) для симуляции нейроморфных сетей масштаба человеческого мозга уже позволяет уложиться в 40 кВт мощности. По мнению Йохана Ментинка, это доказывает, что в ближайшем будущем нейроморфное оборудование позволит преодолеть барьеры, перед которыми пасуют современные цифровые суперкомпьютеры.