«Подъем по дереву не приведет на Луну»: эксперты о пределах статистического ИИ

На канале Machine Learning Street Talk состоялась масштабная панель с участием ведущих экспертов индустрии ИИ. Темой дискуссии стали фундаментальные ограничения статистических методов и потребность в переходе к «третьей волне» искусственного интеллекта — гибридным когнитивным системам.

📉 Тупик эмпирического ИИ: почему данные — это еще не всё 0:21

Спустя десятилетие после начала бума глубокого обучения (Deep Learning) стало очевидно, что прогресс в области беспилотных автомобилей и понимания естественного языка (NLU) не оправдал завышенных ожиданий . По мнению участников дискуссии, доминирующий сегодня эмпирический подход, основанный исключительно на данных, сталкивается с непреодолимым барьером.

Валид Саба утверждает, что главная проблема современного ИИ заключается в ошибочном отождествлении искусственного интеллекта с машинным обучением . По его словам, системы «старого доброго ИИ» (GOFAI) были хрупкими из-за отсутствия компонента обучения, но нынешний «зенит» статистических методов завел индустрию в другую крайность — попытку аппроксимировать бесконечное число человеческих мыслей через огромные языковые модели .

Гади Зингер отмечает, что хотя методы на основе статистических корреляций крайне эффективны в распознавании образов, они обладают фундаментальными ограничениями . Для создания сильного ИИ необходимы системы, способные:

Понимать смысл языка, а не просто предсказывать следующее слово ;
Интегрировать здравый смысл и причинно-следственные связи ;
Объяснять свои выводы и адаптироваться к новым задачам .

🧠 «Человеческий разрыв»: почему вычисления не равны сознанию 12:25

Марк Бишоп вводит понятие «humanity gap» (человеческий разрыв) — пропасть между тем, что могут вычислительные процессы, и тем, на что способен человек . Он напоминает о несбывшихся прогнозах: Джефф Хинтон в 2016 году предсказывал, что к 2021 году ИИ заменит радиологов, а Илон Маск регулярно обещает полную автономность вождения «уже в следующем году» .

Аргументы Бишопа против возможности создания сознания через вычисления:

Проблема воплощения (Embodiment): Для возникновения интеллекта необходимы автономия, физическое тело и социальная среда .
Аргумент «Танцев с пикси» (Dancing with Pixies): Бишоп считает, что если бы вычисления могли порождать сознание, то мы находили бы его повсюду — в кирпичах здания или одежде, так как любые переходы состояний можно спроецировать на физические объекты .
Отсутствие телеологии: Без феноменальных состояний (чувств) для машины ничто не имеет значения, поэтому она не может обладать подлинной автономией; её цели всегда заданы инженерами извне .

🍌 Проблема банана: концептуализация против корреляции 19:51

Участники обсудили, как люди и ИИ воспринимают объекты. Гади Зингер подчеркивает разницу между способностью системы идентифицировать банан на картинке и пониманием концепции банана в рамках онтологии (фрукт, еда, желтый объект) .

Валид Саба приводит пример из теории сложности: алгоритм невозможно научить сортировке списка простым показом миллионов примеров — понимание сложности $O(n \log n)$ должно быть выведено дедуктивно, а не статистически .

Он также выделяет два типа приобретения знаний :

Сенсорное обучение: Увидеть буйвола и запомнить его вид (здесь ИИ справляется неплохо).
Аналитическое рассуждение: Понять логику, исчисление или транзитивность (если A > B и B > C, то A > C). По мнению Сабы, эти фундаментальные человеческие способности принципиально невыводимы из данных .

🖼️ Контекст и «невинность» данных 24:13

Разгорелся спор о природе смысла. Марк Бишоп привел пример из области компьютерного зрения: если показать фото лошади у забора фермеру, он заметит породу; метеоролог увидит кучево-дождевые облака. Смысл всегда зависит от использования и культурного контекста . Он проиллюстрировал это песней «Hurt» группы Nine Inch Nails: оригинал Трента Резнора — о героиновой зависимости, а кавер Джонни Кэша с теми же словами — о глубоком раскаянии старика. Синтаксис одинаков, смысл — диаметрально противоположен .

Валид Саба не согласился, утверждая, что структура (будь то текст или картина) «невинна» и несет в себе объективное содержание, а интерпретация — это лишь психологическое состояние субъекта . По его мнению, если бы смысл был полностью двусмысленным, люди бы никогда не понимали друг друга .

🧩 Гибридный путь: нейросимволический ИИ 47:28

Будущее ИИ участники видят в «третьей волне» или когнитивном ИИ. Гади Зингер предлагает модульную архитектуру, подобную объектно-ориентированному ПО . В такой системе:

Нейронные сети отвечают за восприятие и работу с многомерными пространствами данных.
Символические модули обеспечивают структурированное знание, иерархии и логический вывод.

Саба добавляет, что мозг также модулен: есть отделы для цвета, звука и счета . Однако он предупреждает, что пока ИИ находится на стадии «алхимии», и мы не знаем, как эти модули должны общаться между собой, чтобы возникло подлинное понимание .

🚀 Прогнозы на 10 лет: когнитивные машины или «алхимия»? 1:06:53

Мнения о будущем разошлись:

Гади Зингер настроен оптимистично: он предсказывает появление по-настоящему когнитивных машин к 2031 году . Эти системы будут обладать глубокой моделью мира, смогут генерировать идеи на основе концептов и объяснять свои действия человеку.
Марк Бишоп настроен скептически. По его мнению, нынешний прогресс в ИИ — это как попытка добраться до Луны, забираясь всё выше на дерево. Вы становитесь выше, но Луна не становится ближе .
Валид Саба считает, что индустрия близка к коллапсу ожиданий. Пока ИИ не решит проблему «фреймов» (понимания контекста и того, что меняется в мире при действии), он останется на уровне «высокоразвитой крысы», но не человека .