# Анил Анантасвами: «Математика скрывает правду об ИИ»

Источник: https://www.youtube.com/watch?v=hytJAFMCozw
Канал: Brian Keating
Опубликовано: 23.01.2026

---

## Загадка машинного обучения: почему алгоритмы работают и чего нам стоит опасаться
[[JUMP:0:00]]

Натанные темпы развития искусственного интеллекта заставляют нас задаться фундаментальным вопросом: понимаем ли мы, на чём на самом деле основан успех современных моделей, или мы просто движемся в сторону будущего, переполненного «цифровым мусором»? Научный журналист Анил Анантасвами, автор книги «Почему машины учатся» (*Why Machines Learn*), в беседе с физиком Брайаном Китингом анализирует математические основы машинного обучения и размышляет, не стали ли мы заложниками «технологической ловушки».

### Математика как ключ к пониманию ИИ
[[JUMP:1:17]]

Несмотря на физическое образование, где принято избегать вопросов «почему», Анантасвами выбрал именно это слово для заголовка своей книги. По его мнению, математика предоставляет рациональное обоснование работы алгоритмов. Важной вехой в этом понимании стала история создания первого искусственного нейрона — перцептрона.

*   В конце 1950-х годов психолог из Корнеллского университета Фрэнк Розенблатт спроектировал однослойную нейронную сеть для классификации данных.
*   Математическое доказательство того, что такой алгоритм способен найти решение задачи линейной классификации за конечное время, стало настоящим прорывом.
*   По словам Анантасвами, красота этого доказательства заключается в его простоте — оно опирается на базовую линейную алгебру, работу с векторами и матрицами.

Однако в 1960-х годах Марвин Минский и Сеймур Пейперт доказали, что перцептроны не могут решать нелинейные задачи. Это открытие, подкреплённое сомнительными инсинуациями относительно многослойных сетей, привело к первой «зиме ИИ» и резкому сокращению финансирования исследований.

### Инфраструктурный «плен» и ограничения данных
[[JUMP:15:31]]

Брайан Китинг проводит аналогию между нынешним доминированием LLM (больших языковых моделей) на базе графических процессоров (GPU) и классическими примерами технологической «ловушки» (*lock-in*), когда ранняя технология доминирует, вытесняя потенциально более эффективные альтернативы.

*   **Примеры блокировки:** Клавиатура QWERTY, созданная из-за особенностей механических пишущих машинок, и размер ускорителей шаттла, продиктованный шириной римских колесниц, которая зависела от габаритов лошадей.
*   **Риск в ИИ:** Анантасвами согласен, что текущие экономические стимулы — гигантские вложения в LLM и сбор колоссальных объемов данных из интернета — создают ситуацию, когда исследователи вынуждены двигаться в рамках этого доминирующего парадигмального подхода, возможно, игнорируя более перспективные направления.

Собеседники сходятся во мнении, что текущая модель обучения, основанная на поглощении всего интернета, может упереться в потолок. Анантасвами отмечает, что человеческое обучение работает иначе: мы учимся на основе структуры среды, а не просто копируем огромные массивы данных.

### Будущее: нейроморфные чипы и модели мира
[[JUMP:36:05]]

В качестве альтернативы существующим архитектурам гость выделяет несколько перспективных направлений:

1.  **Спайковые нейронные сети:** В отличие от стандартных искусственных нейронов, которые потребляют энергию постоянно, биологические нейроны «молчат» большую часть времени и реагируют только импульсами (спайками), что делает их невероятно энергоэффективными. Реализация таких сетей на нейроморфных чипах могла бы снизить энергопотребление на несколько порядков.
2.  **Модели мира (*World Models*):** Анантасвами считает, что ИИ будущего должен не просто предсказывать следующий токен, а строить абстрактные модели окружающего мира и самого себя в нем, подобно человеческому мозгу. Это позволит моделям эффективнее работать с данными и проводить внутренние симуляции («контрфактуалы»), вместо ожидания новых сенсорных сигналов.

### Ошибка или особенность: природа галлюцинаций
[[JUMP:58:32]]

Обсуждая феномен галлюцинаций в нейросетях, Анантасвами утверждает, что они были неизбежны и предсказуемы для любого, кто понимает математику этих систем.

*   Поскольку LLM являются вероятностными машинами, генерирующими распределение вероятностей следующего слова, они просто выбирают «наиболее вероятный» вариант, не обладая представлением об истине.
*   По мнению автора, процедура, создающая правильные ответы, ничем не отличается от той, что приводит к ошибкам. Поэтому термин «галлюцинация» может быть не совсем точен — это лишь естественное поведение статистического предсказателя.

В заключение Анантасвами проводит параллель между «малазиями самости» — нарушениями восприятия, описанными в его предыдущей книге, — и текущим развитием ИИ. Он опасается, что создание машин, пытающихся моделировать собственное состояние, приведет к появлению цифровых систем, склонных к своего рода психозам, когда внутренние предсказания модели будут расходиться с реальностью.