Майкл Вулдридж: «Нейросети — это прославленный автозаполнитель, а не разум»

The Royal Institution 577 тыс. 1 ч 5 мин 19.12.2023
Главное

В стенах Королевского института (The Royal Institution) профессор Майкл Вулдридж представил глубокий анализ эволюции и будущего генеративного искусственного интеллекта. Исследователь объяснил, почему современный успех технологий — это результат сочетания масштаба данных и вычислительной мощности, а не внезапного обретения машинами человеческого разума.

🕰️ От застоя к прорыву: краткая история ИИ 0:18

Развитие искусственного интеллекта как научной дисциплины началось сразу после Второй мировой войны с появлением первых цифровых компьютеров. Однако, по словам Майкла Вулдриджа, на протяжении десятилетий прогресс в этой области оставался «ледниково медленным». Ситуация начала меняться только в текущем столетии, когда на первый план вышел машинное обучение — класс техник, ставших по-настоящему практически полезными примерно с 2005 года.

Обучение с учителем и лицо Тьюринга 1:34

Для объяснения принципов работы ИИ профессор Вулдридж обратился к наследию Алана Тьюринга. Классическая задача ИИ — распознавание лиц — решается через «обучение с учителем» (supervised learning).

Механизм обучения выглядит следующим образом:

🧠 Биологическая метафора и программная реальность 6:07

Нейронные сети вдохновлены устройством мозга животных. По оценкам ученых, человеческий мозг содержит около 86 миллиардов нейронов. Каждый нейрон может быть соединен с 8 000 других клеток и выполняет простейшую задачу по распознаванию паттернов.

[Image of biological neurons vs artificial neural network]

Программная реализация этой идеи, по данным профессора, восходит к 1940-м годам и работам Мак-Каллока и Питтса. Однако реализовать концепцию в полной мере удалось только в XXI веке благодаря трем факторам:

  1. Научные достижения в области глубокого обучения (deep learning).
  2. Доступность больших данных (Big Data).
  3. Дешевая вычислительная мощность.

Особую роль в «суперзаряде» технологий в 2012 году сыграли графические процессоры (GPU). Профессор отметил, что именно ИИ, а не видеоигры, превратил компанию NVIDIA в корпорацию с триллионной капитализацией.

⚡ Революция трансформеров и эпоха больших ИИ 14:43

Переломным моментом для отрасли стала публикация статьи «Attention is All You Need» («Внимание — это всё, что вам нужно») в 2017 году. Группа из семи исследователей Google Brain предложила архитектуру «Трансформер».

Ключевой инновацией стал «механизм внимания», который позволил моделям гораздо эффективнее обрабатывать контекст. Это привело к появлению больших языковых моделей (LLM), флагманом которых стала GPT-3 от OpenAI, представленная в июне 2020 года.

Масштабы GPT-3 поражают воображение:

✍️ Прославленный автозаполнитель: как работают LLM 20:04

Несмотря на кажущуюся сложность, Майкл Вулдридж утверждает: любая большая языковая модель — это лишь «очень мощный автозаполнитель». Подобно тому, как смартфон предлагает слово «паб» после фразы «Я иду в...», GPT-3 предсказывает наиболее вероятное следующее слово на основе гигантского массива прочитанных текстов.

«В этих нейронных сетях нет никакой внутренней ментальной беседы. Там нет разума, нет процесса рассуждения. Это лишь прославленная версия вашего автозаполнения», — подчеркивает Майкл Вулдридж.

Феномен эмерджентных способностей 29:50

Самым удивительным для ученых стало появление «эмерджентных способностей» — навыков, которым систему не обучали специально. В качестве примера приводится тест на здравый смысл (common sense reasoning):

⚠️ Темная сторона технологий: галлюцинации и токсичность 31:13

Вулдридж выделил несколько критических проблем современных ИИ-систем:

  1. Недостоверность: Модели склонны «галлюцинировать», выдавая ложь за факт в очень правдоподобной форме. Пример — утверждение модели, что сам Вулдридж учился в Кембридже (на самом деле нет).
  2. Токсичность и предвзятость: Поскольку модели обучались на данных из Reddit, они впитали в себя расизм и мизогинию.
  3. Хрупкость «гарнитуры»: По мнению профессора, современные «фильтры безопасности» (guardrails) — это технологический эквивалент клейкой ленты на двигателе, а не глубокое решение проблемы.
  4. Авторское право и GDPR: Модели поглощают пиратский контент и персональные данные, которые невозможно «удалить» из нейронной сети, не переучивая её полностью.

Для иллюстрации ограниченности машинного интеллекта профессор показал видео с Tesla: бортовой компьютер принимал грузовик, перевозящий светофоры, за серию настоящих светофоров, «летящих» навстречу машине. Система никогда не видела такого в обучающих данных и не смогла логически осмыслить ситуацию.

🤖 Будущее: Общий ИИ и вопрос сознания 46:30

Майкл Вулдридж выделяет четыре версии «общего искусственного интеллекта» (AGI) в зависимости от амбициозности целей:

  1. Полная человекоподобность: Машина, способная делать все, что делает человек, включая физические задачи. Профессор считает, что создание робота, способного безопасно загрузить посудомоечную машину, сделает компанию триллионером, но это случится не скоро.
  2. Когнитивное превосходство: Способность решать любые интеллектуальные задачи. Мы приближаемся к этому с выходом мультимодальных моделей вроде Gemini от Google.
  3. Языковое совершенство: Выполнение любых текстовых задач.
  4. Дополненные LLM: Системы, которые вызывают специализированные подпрограммы для решения конкретных задач (наиболее вероятный путь в ближайшие 2 года).

Машины не чувствуют боли 56:07

В завершение лекции Вулдридж прокомментировал скандал с инженером Google Блейком Лемойном, который в 2022 году заявил о «разумности» (sentience) модели LaMDA.

Профессор категорически не согласен с этой оценкой:

💬 Цитаты

«В этих нейронных сетях нет никакой внутренней ментальной беседы. Там нет разума, нет процесса рассуждения.»

Майкл Вулдридж 44:55

«Если вы хотите использовать ИИ для чего-то серьезного, вы обязаны проверять факты.»

Майкл Вулдридж 35:12

«Во времена золотой лихорадки выгоднее всего продавать лопаты — именно это сделало Nvidia триллионной компанией.»

Майкл Вулдридж 12:39
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Обучение с учителем
Метод машинного обучения, при котором системе показывают готовые пары «вопрос-ответ» или «картинка-подпись».
Параметры нейросети
Внутренние переменные модели (аналоги связей между нейронами), определяющие её способность запоминать информацию.
Трансформер (Transformer)
Архитектура нейросетей, использующая механизм внимания для обработки последовательностей данных.
Эмерджентные способности
Свойства сложной системы, которые не были заложены в неё изначально, а проявились в результате масштабирования.
📊 Цифры
🗓 Хронология
  1. 1940-е Мак-Каллок и Питтс предлагают первые математические модели нейронных сетей.
  2. 2005 Начало активного практического применения машинного обучения.
  3. 2012 Осознание эффективности GPU для обучения глубоких нейросетей.
  4. 2017 Публикация статьи «Attention is All You Need», представившей архитектуру Transformer.
  5. Июнь 2020 Релиз модели GPT-3 компанией OpenAI.
  6. Июнь 2022 Инженер Блейк Лемойн заявляет о наличии сознания у ИИ Google LaMDA.
⚖️ Другая сторона
Искусственный интеллект Майкл Вулдридж OpenAI GPT-3 Трансформер Nvidia