Анил Анантасвами: «Математика скрывает правду об ИИ»

Загадка машинного обучения: почему алгоритмы работают и чего нам стоит опасаться 0:00

Натанные темпы развития искусственного интеллекта заставляют нас задаться фундаментальным вопросом: понимаем ли мы, на чём на самом деле основан успех современных моделей, или мы просто движемся в сторону будущего, переполненного «цифровым мусором»? Научный журналист Анил Анантасвами, автор книги «Почему машины учатся» (Why Machines Learn), в беседе с физиком Брайаном Китингом анализирует математические основы машинного обучения и размышляет, не стали ли мы заложниками «технологической ловушки».

Математика как ключ к пониманию ИИ 1:17

Несмотря на физическое образование, где принято избегать вопросов «почему», Анантасвами выбрал именно это слово для заголовка своей книги. По его мнению, математика предоставляет рациональное обоснование работы алгоритмов. Важной вехой в этом понимании стала история создания первого искусственного нейрона — перцептрона.

В конце 1950-х годов психолог из Корнеллского университета Фрэнк Розенблатт спроектировал однослойную нейронную сеть для классификации данных.
Математическое доказательство того, что такой алгоритм способен найти решение задачи линейной классификации за конечное время, стало настоящим прорывом.
По словам Анантасвами, красота этого доказательства заключается в его простоте — оно опирается на базовую линейную алгебру, работу с векторами и матрицами.

Однако в 1960-х годах Марвин Минский и Сеймур Пейперт доказали, что перцептроны не могут решать нелинейные задачи. Это открытие, подкреплённое сомнительными инсинуациями относительно многослойных сетей, привело к первой «зиме ИИ» и резкому сокращению финансирования исследований.

Инфраструктурный «плен» и ограничения данных 15:31

Брайан Китинг проводит аналогию между нынешним доминированием LLM (больших языковых моделей) на базе графических процессоров (GPU) и классическими примерами технологической «ловушки» (lock-in), когда ранняя технология доминирует, вытесняя потенциально более эффективные альтернативы.

Примеры блокировки: Клавиатура QWERTY, созданная из-за особенностей механических пишущих машинок, и размер ускорителей шаттла, продиктованный шириной римских колесниц, которая зависела от габаритов лошадей.
Риск в ИИ: Анантасвами согласен, что текущие экономические стимулы — гигантские вложения в LLM и сбор колоссальных объемов данных из интернета — создают ситуацию, когда исследователи вынуждены двигаться в рамках этого доминирующего парадигмального подхода, возможно, игнорируя более перспективные направления.

Собеседники сходятся во мнении, что текущая модель обучения, основанная на поглощении всего интернета, может упереться в потолок. Анантасвами отмечает, что человеческое обучение работает иначе: мы учимся на основе структуры среды, а не просто копируем огромные массивы данных.

Будущее: нейроморфные чипы и модели мира 36:05

В качестве альтернативы существующим архитектурам гость выделяет несколько перспективных направлений:

Спайковые нейронные сети: В отличие от стандартных искусственных нейронов, которые потребляют энергию постоянно, биологические нейроны «молчат» большую часть времени и реагируют только импульсами (спайками), что делает их невероятно энергоэффективными. Реализация таких сетей на нейроморфных чипах могла бы снизить энергопотребление на несколько порядков.
Модели мира (World Models): Анантасвами считает, что ИИ будущего должен не просто предсказывать следующий токен, а строить абстрактные модели окружающего мира и самого себя в нем, подобно человеческому мозгу. Это позволит моделям эффективнее работать с данными и проводить внутренние симуляции («контрфактуалы»), вместо ожидания новых сенсорных сигналов.

Ошибка или особенность: природа галлюцинаций 58:32

Обсуждая феномен галлюцинаций в нейросетях, Анантасвами утверждает, что они были неизбежны и предсказуемы для любого, кто понимает математику этих систем.

Поскольку LLM являются вероятностными машинами, генерирующими распределение вероятностей следующего слова, они просто выбирают «наиболее вероятный» вариант, не обладая представлением об истине.
По мнению автора, процедура, создающая правильные ответы, ничем не отличается от той, что приводит к ошибкам. Поэтому термин «галлюцинация» может быть не совсем точен — это лишь естественное поведение статистического предсказателя.

В заключение Анантасвами проводит параллель между «малазиями самости» — нарушениями восприятия, описанными в его предыдущей книге, — и текущим развитием ИИ. Он опасается, что создание машин, пытающихся моделировать собственное состояние, приведет к появлению цифровых систем, склонных к своего рода психозам, когда внутренние предсказания модели будут расходиться с реальностью.