Крис Саммерфилд: «ИИ страдает от эффекта швейцарского сыра»

Machine Learning Street Talk 23,7 тыс. 1 ч 28 мин 5 мин 22.02.2023
Главное

Профессор когнитивной нейробиологии Оксфордского университета и штатный научный сотрудник DeepMind Крис Саммерфилд в интервью для Machine Learning Street Talk представляет глубокий анализ природы интеллекта. Объединяя биологические инсайты с теорией машинного обучения, он исследует, почему современные ИИ-системы, несмотря на их мощь, всё еще сталкиваются с фундаментальными пробелами в понимании реальности.

👽 Мышление против Знания: урок инопланетянина 0:00

Крис Саммерфилд начинает обсуждение с мысленного эксперимента: что, если бы вам пришлось объяснять всё, что вы знаете, инопланетянину с другой планеты? . Этот пример подчеркивает разницу между двумя подходами к интеллекту: ориентированными на «мышление» (процессы обработки) и на «знание» (содержимое и структуру памяти).

По мнению профессора, революция глубокого обучения была подпитана скрытой предпосылкой о том, что для создания интеллектуальных систем знание столь же важно (или даже важнее), чем само мышление . Нейронные сети стали прорывом, потому что они научились не просто «думать», а заземлять и представлять знания о мире через настраиваемые веса, которые находят сходства и абстрактные отношения в данных .

Ключевые тезисы о структуре знаний:

🧠 Загадка общей гениальности: случай Джона фон Неймана 6:03

История Джона фон Неймана, вундеркинда из Будапешта, служит для профессора эталоном универсального интеллекта. В 8 лет он освоил исчисление, в 19 — опубликовал теорию ординалов, а позже внес вклад в теорию игр и квантовую физику . Однако попытки формализовать такую «универсальность» (AGI) сталкиваются с трудностями.

Проблемы определения общего интеллекта:

  1. Антропоцентризм: Наше понимание интеллекта основано на человеческой гибкости и способности справляться с разнообразными задачами .
  2. Определение Шейна Легга (2007): Интеллект как способность агента достигать целей в широком диапазоне сред .
  3. Закон Гудхарта: Крис Саммерфилд напоминает, что когда мера (тест) становится целью, она перестает быть хорошей мерой. Если мы создадим фиксированный набор тестов для AGI, исследователи сосредоточатся на «взломе» именно этих тестов, а не на реальной универсальности .

📊 Ловушка IQ: культурная предвзятость и «положительное многообразие» 10:46

В психологии ведутся споры между сторонниками «G-фактора» Чарльза Спирмена (единый фактор интеллекта) и теорией множественного интеллекта Говарда Гарднера . Профессор Саммерфилд критикует традиционные тесты на IQ, называя их «зеркалом теоретических предубеждений их создателей» .

Аргументы против универсальности стандартных тестов:

🧀 Эффект «Швейцарского сыра» в искусственном интеллекте 15:38

Профессор вводит метафору «швейцарского сыра» для описания современных нейросетей: они демонстрируют сверхчеловеческую производительность в одних областях, но имеют катастрофические «дыры» в других .

Примеры «дыр» в ИИ:

⚔️ «Горький урок» и спор о «чистоте» (Neats vs. Scruffies) 21:48

Крис Саммерфилд анализирует знаменитый пост Ричарда Саттона «Горький урок» (The Bitter Lesson). Саттон утверждает, что попытки заложить в ИИ человеческие знания о пространстве или объектах контрпродуктивны — в долгосрочной перспективе всегда побеждают общие методы, использующие огромные вычислительные мощности .

Профессор делит исследователей на две группы (по классификации Роджера Шенка 1970-х):

  1. Neats («Чистюли»): Ищут минималистичные, математически доказуемые решения и элегантные алгоритмы (например, символьный ИИ или чистые методы поиска) .
  2. Scruffies («Неряхи»): Считают интеллект набором разрозненных «хаков» и механизмов, работающих с гетерогенным миром. Крис Саммерфилд относит себя именно к этой группе .

Контраргументы Саммерфилда против чисто вычислительного подхода:

🍎 Критика гипотезы «Вознаграждения достаточно» 1:02:54

Популярная в DeepMind гипотеза «Reward is Enough» предполагает, что интеллект можно свести к максимизации вознаграждения в рамках марковского процесса принятия решений (MDP). Саммерфилд выражает скепсис .

Его возражения:

  1. Экзогенность vs Эндогенность: В ИИ награду дает исследователь («голос с неба»). В биологии награда (удовольствие от яблока) генерируется самим агентом внутри него .
  2. Проблема взлома: Если дать агенту полную свободу генерировать свои награды, он просто признает всё вознаграждением и перестанет развиваться. Биологических агентов сдерживает инстинкт выживания .
  3. Отсутствие «аннотатора» в реальности: В мире нет вселенского судьи, который выставляет баллы за каждое действие человека .

📚 Понимание как социальная игра в «Шарады» 1:21:48

Обсуждая природу понимания, Саммерфилд ссылается на философию и лингвистику. Он противопоставляет взгляд Хомского (язык как кодификация реальности) социальному взгляду на язык как на инструмент конструирования общих смыслов .

По мнению профессора, мы должны воспринимать язык не как систему поиска истины, а как игру в «шарады» (метафора из книги Ника Чейтера и Мортона Кристиансена «The Language Game») . В этой модели понимание возникает из способности ментально моделировать собеседника и адаптировать свои сигналы под его убеждения и предпочтения .

В завершение Крис Саммерфилд подчеркивает: если мы хотим построить системы, которые будут нам полезны, мы не можем игнорировать биологическое и социальное измерение интеллекта. Истинный прогресс в AGI лежит не только в «штурме вычислительных небес», но и в глубоком понимании того, как люди создают смыслы .

💬 Цитаты

«Интеллект — это не только объем знаний, но и то, как они структурированы.»

Крис Саммерфилд 03:00

«Когда мера становится целью, она перестает быть хорошей мерой.»

Крис Саммерфилд 09:26

«В реальном мире вознаграждения — это наблюдения, а наблюдения — это вознаграждения.»

Крис Саммерфилд 1:04:56
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
AGI
Искусственный общий интеллект, способный решать любые интеллектуальные задачи наравне с человеком.
RLHF
Обучение с подкреплением на основе отзывов людей, метод настройки моделей типа ChatGPT.
MDP
Марковский процесс принятия решений, математическая основа обучения с подкреплением.
G-фактор
Гипотеза о существовании единого общего фактора интеллекта у человека.
📊 Цифры
🗓 Хронология
  1. 1903 Рождение Джона фон Неймана.
  2. 1904 Чарльз Спирмен предложил G-фактор интеллекта.
  3. 1954 Дартмутский семинар, заложивший основы ИИ.
  4. 2016 Матч AlphaGo против Ли Седоля.
  5. 2019 Ричард Саттон опубликовал «Горький урок».
⚖️ Другая сторона
Искусственный интеллект Крис Саммерфилд DeepMind AlphaGo ChatGPT нейробиология