# Perimeter Institute: как искусственный интеллект совершает революцию в физике и математике

Источник: https://www.youtube.com/watch?v=Mw60FH5iflI
Канал: Perimeter Institute
Опубликовано: 04.06.2026

---

Человечество совершило невероятный технологический скачок, научившись превращать очищенный песок в кремниевые чипы, объединять их в нейросети и обучать эти искусственные структуры мыслить. В лекции, представленной на канале Perimeter Institute, физик-теоретик и разработчик ИИ делится своим видением того, как большие языковые модели (LLM) меняют ландшафт фундаментальной науки. Спикер объясняет, почему он оставил написание теоретических статей ради создания «машин по производству знаний», и описывает путь искусственного интеллекта от решения школьных задач до доказательства нерешенных математических гипотез.

## 🖥️ От кремния к искусственному интеллекту: почему физики уходят в IT
[[JUMP:0:01]]

Спикер лекции рассказывает, что за свою научную карьеру написал около 40 статей по теоретической физике, однако принял решение прекратить эту деятельность [0:29]. По его признанию, ручное написание научных работ казалось ему эгоистичным удовольствием на фоне глобальной технологической революции: гораздо важнее внести непосредственный вклад в создание машины, которая сможет генерировать новые знания в промышленных масштабах [0:42]. 

На протяжении десятилетий ученые использовали компьютеры как вспомогательные инструменты — от карманных калькуляторов до систем компьютерной алгебры [0:56]. Однако большие языковые модели принципиально отличаются от них: они способны выполнять абсолютно любую часть работы физика-теоретика, становясь субстратом для создания сильного искусственного интеллекта (AGI) [1:35].

В основе современных LLM лежат нейросети, структура которых вдохновлена человеческим мозгом [2:42]. В начале текущего десятилетия крупнейшие модели содержали около 1 миллиарда параметров [3:07]. Сегодня этот показатель вырос до нескольких триллионов [3:20]. Хотя это все еще меньше 100 триллионов синапсов в человеческом мозге, этого объема параметров уже достаточно для сложной интеллектуальной деятельности [3:20].

Спикер подчеркивает ключевую особенность нейросетей: их не программируют в традиционном смысле, а выращивают [3:33]. Процесс обучения строится на предсказании следующего слова в тексте [4:12]. На начальном этапе модель выдает бессмысленный набор слов, но при каждой верной догадке синаптические связи укрепляются, а при ошибках — ослабляются [4:39]. Пройдя стадию предварительного обучения (pre-training) на триллионах слов из интернета [5:30] и последующую «полировку» (post-training) для обеспечения вежливости и полезности [5:57], модель приобретает способность вести осмысленный диалог на любые темы.

## 📈 Законы масштабирования и три драйвера прогресса
[[JUMP:6:48]]

Участие физиков в развитии искусственного интеллекта началось задолго до нынешнего бума, и одним из главных их вкладов стало открытие законов масштабирования (scaling laws) для нейросетей [6:48]. В физике законы масштабирования играют ключевую роль — от простого анализа размерностей до сложных биологических закономерностей, таких как закон Клайбера, связывающий массу животного со скоростью его метаболизма [7:27].

В 2020 году группа физиков эмпирически обнаружила закон масштабирования для LLM: зависимость между затраченной вычислительной мощностью (compute) и точностью предсказания следующего слова на логарифмическом графике представляет собой прямую линию [9:13]. По ироничному замечанию спикера, этот график оказался настолько простым, что его смогли понять даже венчурные капиталисты, что и спровоцировало лавинообразный приток инвестиций в индустрию [9:40].

По оценке спикера, развитие ИИ в последние годы определяют три основных фактора:

*   **Рост вычислительных мощностей:** количество операций с плавающей запятой (flops), затрачиваемых на обучение передовых моделей, увеличивается в 4 раза каждый год начиная с 2010 года [12:01].
*   **Финансовые вливания:** объем средств, направляемых на обучение ИИ, растет примерно на 2.7x в год [12:27]. Затраты на одну крупную тренировочную сессию выросли с $500 тысяч в 2020 году до $330 миллионов в прошлом году [13:46].
*   **Алгоритмический прогресс:** оптимизация архитектур и методов обучения силами инженеров и исследователей [12:53]. Именно этот фактор спикер называет главным драйвером качественного роста систем.

Спикер убежден, что экономический лимит масштабирования еще далеко не исчерпан: при мировом ВВП в десятки триллионов долларов затраты на вычисления могут расти еще на протяжении нескольких десятилетий, если это будет оправдано ростом производительности моделей [14:15].

## 📊 Смерть бенчмарков: от дошкольника до уровня PhD
[[JUMP:14:46]]

Развитие способностей ИИ происходит с невероятной скоростью. Если в 2019 году возможности моделей в области науки находились на уровне дошкольника [14:58], то затем начался стремительный подъем. Спикер приводит эмпирическое правило: развитие ИИ в среднем идет в 4 раза быстрее, чем обучение человека (один календарный год равен четырем годам академического прогресса) [20:05].

В качестве примера приводится история математического теста MATH, составленного из школьных задач различного уровня сложности [15:27]. Для сравнения: аспиранты компьютерных наук, не специализирующиеся на математике, решают его в среднем на 40%, а золотые медалисты Международной математической олимпиады (IMO) — на 90% [16:22]. Четыре года назад лучшие ИИ-модели набирали на этом тесте всего 6% [16:48], главным образом из-за неспособности правильно интерпретировать текстовые условия задач [17:00]. Создатели теста прогнозировали, что планка в 50% будет преодолена к 2025 году, выражая крайний скептицизм по поводу более быстрых темпов [18:07]. Однако система Minerva достигла этого результата почти сразу, а к середине 2024 года модель Max Math преодолела отметку в 90% [18:47]. На сегодняшний день стандартные коммерческие модели решают этот тест практически безошибочно, что делает его бесполезным для оценки дальнейшего прогресса [19:26].

Аналогичная судьба постигла и бенчмарк GPQA, состоящий из вопросов уровня первого курса аспирантуры (PhD) по физике, химии и биологии [26:26]. Эксперты с ученой степенью PhD набирают в нем около 70% [26:40]. Модели ИИ совершили скачок от случайного угадывания в начале 2024 года до фактически идеального прохождения теста к 2026 году [27:33].

Чтобы исключить подозрения в простом зазубривании ответов из интернета, разработчики проводят тесты на измененных задачах из закрытых выборок (held out test sets), где модели демонстрируют аналогичные высокие результаты [28:39]. Спикер подтверждает это личным опытом: он протестировал ИИ на собственных экзаменационных вопросах по общей теории относительности и квантовой механике для студентов Стэнфорда, которых никогда не было в открытом доступе. За 18 месяцев, начиная с конца 2023 года, точность ответов ИИ поднялась до 100% [29:07].

Наконец, ИИ преодолел барьер Международной математической олимпиады (IMO), которая считается вершиной школьной математики и требует нестандартного творческого мышления [31:19]. Летом прошлого года модель от Google DeepMind завоевала условную золотую медаль, решив 5 из 6 задач [32:11]. При этом президент IMO подтвердил, что решения ИИ были ясными, точными и легко читаемыми для экспертов-людей [32:51].

## 🛠️ Инструменты мышления: как заставить ИИ думать лучше
[[JUMP:20:45]]

Успехи ИИ в математике — это не магия, а результат применения набора логичных инженерных подходов. Спикер подробно останавливается на нескольких ключевых методах:

*   **«Горький урок» (The Bitter Lesson):** гипотеза Ричарда Саттона о том, что простое увеличение масштаба вычислений со временем всегда побеждает любые сложные эвристики и правила, заложенные в модель человеком [21:50]. Все уникальные человеческие ухищрения, созданные для улучшения работы моделей, быстро нивелируются следующим поколением более масштабных нейросетей [22:28].
*   **Цепочка рассуждений (Chain of Thought):** удивительный феномен, при котором добавление фразы «думай шаг за шагом» перед отправкой запроса существенно повышает точность ответа [22:55]. Модели ИИ представляют собой гибкую диалоговую среду, на которую можно влиять текстовым внушением [23:34]. При этом фразы-стимулы вроде «Давай, парень, ты сможешь, просто делай!» ухудшают результат на 20% [23:59].
*   **Долгое размышление:** обучение моделей рассуждать на протяжении тысяч слов (как в проекте Strawberry в конце 2024 года) вместо моментальной выдачи наиболее вероятного ответа [24:13].
*   **Мультиагентные системы:** организация автоматического диалога между несколькими экземплярами ИИ, где каждому назначается своя роль — критик, планировщик, генератор идей или скептик [25:06].

Тем не менее, у моделей остаются специфические слабости, обусловленные методами их обучения. В качестве примера спикер приводит классическую загадку об автокатастрофе, где отец погибает, а хирург в больнице отказывается оперировать мальчика, говоря: «Это мой сын» [33:43]. В стандартном сценарии ИИ мгновенно дает правильный ответ (хирург — мать мальчика) [34:08]. Однако если изменить условие задачи и прямо написать в скобках «хирург, который является отцом мальчика, восклицает...», модель все равно шаблонно отвечает, что хирург — это мать, демонстрируя слепое следование паттернам из обучающей выборки [34:46].

## 🔬 Кентавры в действии: первые научные открытия
[[JUMP:35:39]]

Переломным моментом стало использование ИИ для получения принципиально новых научных результатов. До недавнего времени модели лишь воспроизводили уже известные решения. Теперь же речь идет о формате «кентавра» — совместной работе ученого и искусственного интеллекта [36:16].

В рамках совместного проекта с участием профессора Стэнфордского университета и президента Американского математического общества, запущенного осенью 2024 года, модель Gemini была использована для поиска новых математических доказательств [36:42]. По отзыву одного из соавторов, аргументация ИИ не была простой перепаковкой известных доказательств, а представляла собой глубокое оригинальное прозрение, которым мог бы гордиться любой математик [37:23]. Роль людей сводилась к ведению диалога, оценке промежуточных вариантов и направлению фокуса ИИ на перспективные идеи [37:48].

В начале 2026 года произошло еще более значимое событие: модель от OpenAI фактически автономно доказала гипотезу Эрдеша о единичных расстояниях — известную и сложную открытую проблему комбинаторной геометрии [47:37]. Математик Тим Гауэрс, обладатель Филдсовской премии, заявил, что это решение является исторической вехой для ИИ-математики [48:04]. По его мнению, если бы эта работа была представлена человеком в престижный журнал Annals of Mathematics, ее следовало бы принять к публикации без колебаний [48:28].

## 🔮 Взгляд в будущее: от инструментов к автономным ученым
[[JUMP:38:15]]

Спикер выделяет несколько направлений, где ИИ уже сегодня кардинально меняет работу ученых:

*   **Терпеливый репетитор:** ИИ изучил все учебники мира и готов без устали объяснять сложные концепции в 3 часа ночи, не выказывая раздражения или осуждения [41:46].
*   **Автономный программист:** ИИ превращает написание кода в условно «бесплатный» ресурс, позволяя переводить чисто физические задачи на язык программирования [42:52].
*   **Интеллектуальный поиск по литературе:** способность мгновенно сопоставлять новые идеи с миллионами опубликованных научных статей [43:05].

Проводя аналогию с развитием шахматных компьютеров, спикер отмечает, что они прошли четыре стадии: игрушка, инструмент, совместная игра (кентавр) и суперчеловеческий уровень [49:32]. Шахматные программы обучаются гораздо дольше людей (потребовались миллионы партий), но делают это за считанные дни календарного времени благодаря методу обучения с подкреплением [51:42]. Кроме того, появление сильного компьютерного соперника сделало сильнее и самих людей, которые стали учиться у машин [52:21].

По словам спикера, вопреки скептическим заявлениям о том, что LLM способны лишь на интерполяцию данных и простое сопоставление шаблонов, в Кремниевой долине доминирует мнение о достаточности текущей архитектуры нейросетей для достижения сильного ИИ (AGI) [45:41]. Масштабирование существующих систем и их алгоритмическая доработка неизбежно приведут к созданию автономного ИИ-ученого [45:54]. Учитывая, что стоимость запуска готовых моделей стремительно падает, человечество сможет запустить миллиарды виртуальных «ИИ-Эйнштейнов» одновременно [53:39]. Это откроет невиданный ранее золотой век для физики и математики, обещая ответы на фундаментальные вопросы вселенной уже в ближайшие годы [54:19].