Майкл Вулдридж: «Нейросети — это прославленный автозаполнитель, а не разум»

В стенах Королевского института (The Royal Institution) профессор Майкл Вулдридж представил глубокий анализ эволюции и будущего генеративного искусственного интеллекта. Исследователь объяснил, почему современный успех технологий — это результат сочетания масштаба данных и вычислительной мощности, а не внезапного обретения машинами человеческого разума.

🕰️ От застоя к прорыву: краткая история ИИ 0:18

Развитие искусственного интеллекта как научной дисциплины началось сразу после Второй мировой войны с появлением первых цифровых компьютеров. Однако, по словам Майкла Вулдриджа, на протяжении десятилетий прогресс в этой области оставался «ледниково медленным». Ситуация начала меняться только в текущем столетии, когда на первый план вышел машинное обучение — класс техник, ставших по-настоящему практически полезными примерно с 2005 года.

Обучение с учителем и лицо Тьюринга 1:34

Для объяснения принципов работы ИИ профессор Вулдридж обратился к наследию Алана Тьюринга. Классическая задача ИИ — распознавание лиц — решается через «обучение с учителем» (supervised learning).

Механизм обучения выглядит следующим образом:

Обучающие данные: Набор пар «вход-выход» (например, фотография лица и подпись «Алан Тьюринг»).
Задача классификации: Компьютер учится соотносить входное изображение с правильной категорией или именем.
Практическое применение: Эта же технология используется для поиска опухолей на рентгеновских снимках или управления беспилотными автомобилями Tesla, которые должны распознавать знаки «Стоп» и пешеходов.

🧠 Биологическая метафора и программная реальность 6:07

Нейронные сети вдохновлены устройством мозга животных. По оценкам ученых, человеческий мозг содержит около 86 миллиардов нейронов. Каждый нейрон может быть соединен с 8 000 других клеток и выполняет простейшую задачу по распознаванию паттернов.

[Image of biological neurons vs artificial neural network]

Программная реализация этой идеи, по данным профессора, восходит к 1940-м годам и работам Мак-Каллока и Питтса. Однако реализовать концепцию в полной мере удалось только в XXI веке благодаря трем факторам:

Научные достижения в области глубокого обучения (deep learning).
Доступность больших данных (Big Data).
Дешевая вычислительная мощность.

Особую роль в «суперзаряде» технологий в 2012 году сыграли графические процессоры (GPU). Профессор отметил, что именно ИИ, а не видеоигры, превратил компанию NVIDIA в корпорацию с триллионной капитализацией.

⚡ Революция трансформеров и эпоха больших ИИ 14:43

Переломным моментом для отрасли стала публикация статьи «Attention is All You Need» («Внимание — это всё, что вам нужно») в 2017 году. Группа из семи исследователей Google Brain предложила архитектуру «Трансформер».

Ключевой инновацией стал «механизм внимания», который позволил моделям гораздо эффективнее обрабатывать контекст. Это привело к появлению больших языковых моделей (LLM), флагманом которых стала GPT-3 от OpenAI, представленная в июне 2020 года.

Масштабы GPT-3 поражают воображение:

Параметры: 175 миллиардов.
Обучающие данные: Около 500 миллиардов слов, включая весь архив Common Crawl (копия всего интернета).
Стоимость: Десятки миллионов долларов на оборудование и миллионы на электричество для одного цикла обучения.

✍️ Прославленный автозаполнитель: как работают LLM 20:04

Несмотря на кажущуюся сложность, Майкл Вулдридж утверждает: любая большая языковая модель — это лишь «очень мощный автозаполнитель». Подобно тому, как смартфон предлагает слово «паб» после фразы «Я иду в...», GPT-3 предсказывает наиболее вероятное следующее слово на основе гигантского массива прочитанных текстов.

«В этих нейронных сетях нет никакой внутренней ментальной беседы. Там нет разума, нет процесса рассуждения. Это лишь прославленная версия вашего автозаполнения», — подчеркивает Майкл Вулдридж.

Феномен эмерджентных способностей 29:50

Самым удивительным для ученых стало появление «эмерджентных способностей» — навыков, которым систему не обучали специально. В качестве примера приводится тест на здравый смысл (common sense reasoning):

Успех: Модель правильно вычисляет, что если Том на 3 дюйма выше Дика, а Дик на 2 дюйма выше Гарри, то Том на 5 дюймов выше Гарри.
Провал: Система может ошибиться в простых вопросах о том, что находится слева на карте или в каком порядке были изобретены автомобили и корабли.

⚠️ Темная сторона технологий: галлюцинации и токсичность 31:13

Вулдридж выделил несколько критических проблем современных ИИ-систем:

Недостоверность: Модели склонны «галлюцинировать», выдавая ложь за факт в очень правдоподобной форме. Пример — утверждение модели, что сам Вулдридж учился в Кембридже (на самом деле нет).
Токсичность и предвзятость: Поскольку модели обучались на данных из Reddit, они впитали в себя расизм и мизогинию.
Хрупкость «гарнитуры»: По мнению профессора, современные «фильтры безопасности» (guardrails) — это технологический эквивалент клейкой ленты на двигателе, а не глубокое решение проблемы.
Авторское право и GDPR: Модели поглощают пиратский контент и персональные данные, которые невозможно «удалить» из нейронной сети, не переучивая её полностью.

Для иллюстрации ограниченности машинного интеллекта профессор показал видео с Tesla: бортовой компьютер принимал грузовик, перевозящий светофоры, за серию настоящих светофоров, «летящих» навстречу машине. Система никогда не видела такого в обучающих данных и не смогла логически осмыслить ситуацию.

🤖 Будущее: Общий ИИ и вопрос сознания 46:30

Майкл Вулдридж выделяет четыре версии «общего искусственного интеллекта» (AGI) в зависимости от амбициозности целей:

Полная человекоподобность: Машина, способная делать все, что делает человек, включая физические задачи. Профессор считает, что создание робота, способного безопасно загрузить посудомоечную машину, сделает компанию триллионером, но это случится не скоро.
Когнитивное превосходство: Способность решать любые интеллектуальные задачи. Мы приближаемся к этому с выходом мультимодальных моделей вроде Gemini от Google.
Языковое совершенство: Выполнение любых текстовых задач.
Дополненные LLM: Системы, которые вызывают специализированные подпрограммы для решения конкретных задач (наиболее вероятный путь в ближайшие 2 года).

Машины не чувствуют боли 56:07

В завершение лекции Вулдридж прокомментировал скандал с инженером Google Блейком Лемойном, который в 2022 году заявил о «разумности» (sentience) модели LaMDA.

Профессор категорически не согласен с этой оценкой:

У ИИ нет субъективного опыта (тест Нагеля «Каково это — быть чем-то?»).
У ИИ нет непрерывного существования: когда вы уходите в отпуск, модель просто перестает работать, она не «скучает» и не «думает» в ожидании.
Нет никакой эволюционной или практической причины стремиться к созданию сознательных машин.