Гэри Маркус, известный ученый в области когнитивных наук и критик современных подходов к искусственному интеллекту, выступил на конференции по AGI с программной речью. В своем докладе он проанализировал прогресс индустрии за последние три года, придя к выводу, что, несмотря на триллионные инвестиции, фундаментальные проблемы понимания и надежности ИИ остаются нерешенными.
🔄 Ретроспектива: три года в одной точке 5:35
Гэри Маркус начал свое выступление на Machine Learning Street Talk с обращения к своему докладу 2021 года. Он отметил, что три года назад термин «базовые модели» (Foundation Models) только входил в обиход после публикации 150-страничной работы Стэнфордского университета . Тогда Маркус утверждал, что эти системы нельзя называть «фундаментом», так как на них невозможно положиться из-за отсутствия здравого смысла и логики .
По мнению эксперта, за прошедшее время ситуация не изменилась качественно:
- Системы все еще не понимают отрицание (эксперименты Элисон Эттингер с моделью BERT показали, что ИИ не видит разницы между «малиновка — это птица» и «малиновка — это НЕ птица») .
- Глубокое обучение (Deep Learning) по-прежнему относится к количеству слоев нейросети, а не к глубине понимания .
- Индустрия подменила поиск AGI (общего искусственного интеллекта) концепцией «масштабирование — это всё, что вам нужно» (Scaling is all you need) .
Маркус подчеркивает, что обещания лидеров мнений, таких как Джефф Хинтон (о замене радиологов) или Илон Маск (о полном автопилоте к 2020 году), оказались несостоятельными . Несмотря на сотни стартапов, ни один радиолог не был полностью заменен ИИ, а дефицит специалистов в этой области только вырос .
📉 Тупик масштабирования и «лучшая графика» 14:05
Гэри Маркус утверждает, что современные модели — это лишь «те же проблемы, но с лучшей графикой» . Он привел ряд примеров, демонстрирующих отсутствие реального понимания мира у топовых моделей (GPT-4, Grok и др.):
- Проблема отрицания: При запросе «нарисуй пляж без слона» модели продолжают рисовать слонов, так как реагируют на частотность токенов, а не на семантику запрета .
- Географический абсурд: Карта достопримечательностей США от ChatGPT может поместить Гранд-Каньон в произвольные штаты, а Флориду — в центр страны .
- Временная слепота: Модель Grok от Илона Маска при запросе изображения нынешнего премьер-министра Италии выдает портреты бывших лидеров США или случайных людей, хотя в текстовом режиме знает имя Джорджи Мелони .
По мнению Маркуса, мы наблюдаем фазу убывающей отдачи (diminishing returns) . GPT-4 была обучена еще в августе 2022 года, и за прошедшие два года ни одна модель (включая Claude и Gemini) не показала значительного качественного скачка . Эксперт отмечает, что график прогресса, который раньше казался экспоненциальным, заметно выравнивается .
Причины замедления, по словам Маркуса:
- Дефицит данных: ИИ уже поглотил значительную часть интернета, и увеличивать объем обучающей выборки в 100 раз больше не за счет чего .
- Архитектурные ограничения: Трансформеры не имеют внутренних моделей мира и не способны к абстрактному обобщению вне тренировочного пространства .
🏗️ Путь к надежному ИИ: гибридные системы 31:44
Гэри Маркус настаивает на необходимости перехода к нейросимволическому ИИ (Neuro-symbolic AI). Он утверждает, что глубокое обучение хорошо справляется с восприятием, но беспомощно в вопросах планирования, рассуждения и аналогии .
Основные тезисы Маркуса о необходимых изменениях:
- Гибридизация: Объединение способности нейросетей к обучению на данных с жесткими символическими правилами классического ИИ .
- Врожденные знания: Системы должны иметь базовое понимание пространства, времени и причинности (как предлагал Иммануил Кант) .
- Когнитивные модели: ИИ должен оперировать сущностями и их отношениями (World Models), а не просто предсказывать следующий вероятный токен .
В качестве успешных примеров гибридных систем ученый привел AlphaFold и AlphaGeometry от DeepMind, которые встраивают доменные знания в архитектуру .
⚠️ Этический упадок и риски Кремниевой долины 39:22
Значительную часть доклада Гэри Маркус посвятил «моральному упадку Кремниевой долины» . Он выразил глубокое недоверие к руководству ведущих ИИ-компаний, особенно к Сэму Альтману (OpenAI).
Ключевые претензии Маркуса:
- Закрытость: Компания OpenAI, вопреки названию, скрывает данные, на которых обучаются модели, используя расплывчатые формулировки о «публичных и частных источниках» .
- Риски наблюдения: Маркус опасается, что OpenAI может превратиться в крупнейшую в мире систему наблюдения (Big Brother), учитывая их доступ к данным пользователей и камерам .
- Плагиат: Модели обучаются на защищенном авторским правом контенте, что Маркус называет нарушением прав художников и творцов .
По мнению гостя, современный генеративный ИИ — это «генеральная репетиция» перед созданием AGI, и сейчас эта репетиция проваливается с точки зрения безопасности и ответственности .
🏛️ Регулирование и «FDA для алгоритмов» 45:40
Для предотвращения катастрофических последствий Гэри Маркус предлагает внедрить жесткое государственное регулирование, аналогичное контролю в авиации или медицине.
Предложенные меры:
- Процесс одобрения типа FDA: Перед развертыванием модели на миллионы пользователей компания должна доказать, что выгоды превышают риски .
- Пострелизный аудит: Независимые ученые должны иметь доступ к данным, чтобы проверять системы на наличие скрытого расизма в алгоритмах найма или других форм дискриминации .
- Многоуровневый надзор: Регулирование дизайна, тестирования и обслуживания ИИ-систем .
- Глобальные агентства: Создание национальных и международных органов по надзору за ИИ .
Маркус предостерегает от «регуляторного захвата» (regulatory capture), когда крупные корпорации сами пишут правила для себя, отсекая мелких конкурентов и игнорируя интересы общества .
❄️ Грядет ли новая «зима ИИ»? 55:42
В ходе дискуссии с ведущим и Беном Гертцелем возник вопрос о неизбежности лопания «пузыря ИИ». Маркус считает, что индустрия близка к критической точке из-за несоответствия затрат и доходов.
Экономические факторы риска:
- Огромные убытки: Операционный убыток OpenAI в прошлом году составил около 5 млрд долларов .
- Спекуляции VC: Венчурные капиталисты часто мотивированы комиссиями за управление (модель «2 и 20»), что заставляет их инвестировать в переоцененные, но «хайповые» проекты .
- Проблема «Вилли Койота»: Индустрия уже выбежала за край обрыва (затраты на чипы в 50 млрд долларов не окупаются выручкой), но пока просто не посмотрела вниз .
Бен Гертцель выразил альтернативную точку зрения, предположив, что «зимы» не будет, так как вертикальные рыночные приложения (в биологии, финансах, музыке) уже приносят пользу и будут поддерживать инвестиционный поток, пока AGI-лаборатории готовят новые демо-версии . Маркус, в свою очередь, парировал, что если узкие приложения принесут миллионы, а инвесторы ожидали триллионы, «вайб» рынка все равно может привести к коллапсу .
В завершение Гэри Маркус призвал научное сообщество перестать фокусироваться только на одной архитектуре (трансформерах) и вернуться к междисциплинарным исследованиям, включающим когнитивную психологию и лингвистику .