Анил Анантасвами: «Математика скрывает правду об ИИ»

Brian Keating 16,4 тыс. 1 ч 6 мин 3 мин 23.01.2026
Главное

Загадка машинного обучения: почему алгоритмы работают и чего нам стоит опасаться 0:00

Натанные темпы развития искусственного интеллекта заставляют нас задаться фундаментальным вопросом: понимаем ли мы, на чём на самом деле основан успех современных моделей, или мы просто движемся в сторону будущего, переполненного «цифровым мусором»? Научный журналист Анил Анантасвами, автор книги «Почему машины учатся» (Why Machines Learn), в беседе с физиком Брайаном Китингом анализирует математические основы машинного обучения и размышляет, не стали ли мы заложниками «технологической ловушки».

Математика как ключ к пониманию ИИ 1:17

Несмотря на физическое образование, где принято избегать вопросов «почему», Анантасвами выбрал именно это слово для заголовка своей книги. По его мнению, математика предоставляет рациональное обоснование работы алгоритмов. Важной вехой в этом понимании стала история создания первого искусственного нейрона — перцептрона.

Однако в 1960-х годах Марвин Минский и Сеймур Пейперт доказали, что перцептроны не могут решать нелинейные задачи. Это открытие, подкреплённое сомнительными инсинуациями относительно многослойных сетей, привело к первой «зиме ИИ» и резкому сокращению финансирования исследований.

Инфраструктурный «плен» и ограничения данных 15:31

Брайан Китинг проводит аналогию между нынешним доминированием LLM (больших языковых моделей) на базе графических процессоров (GPU) и классическими примерами технологической «ловушки» (lock-in), когда ранняя технология доминирует, вытесняя потенциально более эффективные альтернативы.

Собеседники сходятся во мнении, что текущая модель обучения, основанная на поглощении всего интернета, может упереться в потолок. Анантасвами отмечает, что человеческое обучение работает иначе: мы учимся на основе структуры среды, а не просто копируем огромные массивы данных.

Будущее: нейроморфные чипы и модели мира 36:05

В качестве альтернативы существующим архитектурам гость выделяет несколько перспективных направлений:

  1. Спайковые нейронные сети: В отличие от стандартных искусственных нейронов, которые потребляют энергию постоянно, биологические нейроны «молчат» большую часть времени и реагируют только импульсами (спайками), что делает их невероятно энергоэффективными. Реализация таких сетей на нейроморфных чипах могла бы снизить энергопотребление на несколько порядков.
  2. Модели мира (World Models): Анантасвами считает, что ИИ будущего должен не просто предсказывать следующий токен, а строить абстрактные модели окружающего мира и самого себя в нем, подобно человеческому мозгу. Это позволит моделям эффективнее работать с данными и проводить внутренние симуляции («контрфактуалы»), вместо ожидания новых сенсорных сигналов.

Ошибка или особенность: природа галлюцинаций 58:32

Обсуждая феномен галлюцинаций в нейросетях, Анантасвами утверждает, что они были неизбежны и предсказуемы для любого, кто понимает математику этих систем.

В заключение Анантасвами проводит параллель между «малазиями самости» — нарушениями восприятия, описанными в его предыдущей книге, — и текущим развитием ИИ. Он опасается, что создание машин, пытающихся моделировать собственное состояние, приведет к появлению цифровых систем, склонных к своего рода психозам, когда внутренние предсказания модели будут расходиться с реальностью.

💬 Цитаты

«Процедура, которая генерирует правильные ответы, в точности та же, что приводит к галлюцинациям.»

Анил Анантасвами 1:00:38

«Мы можем оказаться в фазе блокировки из-за текущего тренда.»

Анил Анантасвами 20:58
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Перцептрон
Простейшая искусственная нейронная сеть, выполняющая линейную классификацию.
Стохастический градиентный спуск
Алгоритм, который с помощью случайных шагов помогает нейросетям находить минимумы функции потерь, избегая «застревания».
Спайковые нейроны
Искусственные нейроны, имитирующие биологические, которые общаются с помощью редких электрических импульсов-спайков.
Оверпараметризация
Ситуация, когда количество параметров модели избыточно, что в классической статистике приводит к переобучению, но в глубоком обучении — к успешному обобщению.
📊 Цифры
🗓 Хронология
  1. 1950-е Разработка перцептрона Фрэнком Розенблаттом.
  2. 1960-е Книга Минского и Пейперта, приведшая к стагнации исследований нейросетей.
  3. 1980-е Революция обратного распространения ошибки и возрождение интереса к глубоким сетям.
⚖️ Другая сторона
Искусственный интеллект Anil Ananthaswamy Brian Keating Large Language Models Machine Learning