Гэри Маркус: «Индустрия ИИ — это огромный эксперимент, который терпит крах из-за слепой веры в масштабирование»

Machine Learning Street Talk 34,5 тыс. 1 ч 12 мин 5 мин 17.08.2024
Главное

Гэри Маркус, известный ученый в области когнитивных наук и критик современных подходов к искусственному интеллекту, выступил на конференции по AGI с программной речью. В своем докладе он проанализировал прогресс индустрии за последние три года, придя к выводу, что, несмотря на триллионные инвестиции, фундаментальные проблемы понимания и надежности ИИ остаются нерешенными.

🔄 Ретроспектива: три года в одной точке 5:35

Гэри Маркус начал свое выступление на Machine Learning Street Talk с обращения к своему докладу 2021 года. Он отметил, что три года назад термин «базовые модели» (Foundation Models) только входил в обиход после публикации 150-страничной работы Стэнфордского университета . Тогда Маркус утверждал, что эти системы нельзя называть «фундаментом», так как на них невозможно положиться из-за отсутствия здравого смысла и логики .

По мнению эксперта, за прошедшее время ситуация не изменилась качественно:

Маркус подчеркивает, что обещания лидеров мнений, таких как Джефф Хинтон (о замене радиологов) или Илон Маск (о полном автопилоте к 2020 году), оказались несостоятельными . Несмотря на сотни стартапов, ни один радиолог не был полностью заменен ИИ, а дефицит специалистов в этой области только вырос .

📉 Тупик масштабирования и «лучшая графика» 14:05

Гэри Маркус утверждает, что современные модели — это лишь «те же проблемы, но с лучшей графикой» . Он привел ряд примеров, демонстрирующих отсутствие реального понимания мира у топовых моделей (GPT-4, Grok и др.):

  1. Проблема отрицания: При запросе «нарисуй пляж без слона» модели продолжают рисовать слонов, так как реагируют на частотность токенов, а не на семантику запрета .
  2. Географический абсурд: Карта достопримечательностей США от ChatGPT может поместить Гранд-Каньон в произвольные штаты, а Флориду — в центр страны .
  3. Временная слепота: Модель Grok от Илона Маска при запросе изображения нынешнего премьер-министра Италии выдает портреты бывших лидеров США или случайных людей, хотя в текстовом режиме знает имя Джорджи Мелони .

По мнению Маркуса, мы наблюдаем фазу убывающей отдачи (diminishing returns) . GPT-4 была обучена еще в августе 2022 года, и за прошедшие два года ни одна модель (включая Claude и Gemini) не показала значительного качественного скачка . Эксперт отмечает, что график прогресса, который раньше казался экспоненциальным, заметно выравнивается .

Причины замедления, по словам Маркуса:

🏗️ Путь к надежному ИИ: гибридные системы 31:44

Гэри Маркус настаивает на необходимости перехода к нейросимволическому ИИ (Neuro-symbolic AI). Он утверждает, что глубокое обучение хорошо справляется с восприятием, но беспомощно в вопросах планирования, рассуждения и аналогии .

Основные тезисы Маркуса о необходимых изменениях:

В качестве успешных примеров гибридных систем ученый привел AlphaFold и AlphaGeometry от DeepMind, которые встраивают доменные знания в архитектуру .

⚠️ Этический упадок и риски Кремниевой долины 39:22

Значительную часть доклада Гэри Маркус посвятил «моральному упадку Кремниевой долины» . Он выразил глубокое недоверие к руководству ведущих ИИ-компаний, особенно к Сэму Альтману (OpenAI).

Ключевые претензии Маркуса:

По мнению гостя, современный генеративный ИИ — это «генеральная репетиция» перед созданием AGI, и сейчас эта репетиция проваливается с точки зрения безопасности и ответственности .

🏛️ Регулирование и «FDA для алгоритмов» 45:40

Для предотвращения катастрофических последствий Гэри Маркус предлагает внедрить жесткое государственное регулирование, аналогичное контролю в авиации или медицине.

Предложенные меры:

  1. Процесс одобрения типа FDA: Перед развертыванием модели на миллионы пользователей компания должна доказать, что выгоды превышают риски .
  2. Пострелизный аудит: Независимые ученые должны иметь доступ к данным, чтобы проверять системы на наличие скрытого расизма в алгоритмах найма или других форм дискриминации .
  3. Многоуровневый надзор: Регулирование дизайна, тестирования и обслуживания ИИ-систем .
  4. Глобальные агентства: Создание национальных и международных органов по надзору за ИИ .

Маркус предостерегает от «регуляторного захвата» (regulatory capture), когда крупные корпорации сами пишут правила для себя, отсекая мелких конкурентов и игнорируя интересы общества .

❄️ Грядет ли новая «зима ИИ»? 55:42

В ходе дискуссии с ведущим и Беном Гертцелем возник вопрос о неизбежности лопания «пузыря ИИ». Маркус считает, что индустрия близка к критической точке из-за несоответствия затрат и доходов.

Экономические факторы риска:

Бен Гертцель выразил альтернативную точку зрения, предположив, что «зимы» не будет, так как вертикальные рыночные приложения (в биологии, финансах, музыке) уже приносят пользу и будут поддерживать инвестиционный поток, пока AGI-лаборатории готовят новые демо-версии . Маркус, в свою очередь, парировал, что если узкие приложения принесут миллионы, а инвесторы ожидали триллионы, «вайб» рынка все равно может привести к коллапсу .

В завершение Гэри Маркус призвал научное сообщество перестать фокусироваться только на одной архитектуре (трансформерах) и вернуться к междисциплинарным исследованиям, включающим когнитивную психологию и лингвистику .

💬 Цитаты

«Глубокое обучение — это лучшая лестница, но лучшая лестница не обязательно доставит вас на Луну.»

Гэри Маркус 12:04

«Я никогда не видел, чтобы эксперимент терпел неудачу столько раз при таких огромных затратах, как гипотеза о том, что AGI можно создать, просто добавляя данные и вычисления.»

Гэри Маркус 27:42

«Мы можем получить крупнейшую в мире компанию по слежке под видом некоммерческой организации под названием OpenAI.»

Гэри Маркус 01:43
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
AGI
Общий искусственный интеллект, способный выполнять любую интеллектуальную задачу на уровне человека.
Нейросимволический ИИ
Подход, сочетающий нейронные сети для восприятия и символическую логику для рассуждений.
Scaling Hypothesis
Убеждение, что увеличение количества данных и вычислительной мощности автоматически приведет к созданию сверхинтеллекта.
LLM
Большие языковые модели, такие как GPT-4, обученные предсказывать следующее слово в тексте.
📊 Цифры
🗓 Хронология
  1. 1998 Гэри Маркус публикует работу о неспособности многослойных перцептронов к абстрактному обобщению.
  2. 2019 Выход книги 'Rebooting AI'.
  3. 2021 Выступление Маркуса на конференции AGI с критикой Foundation Models.
  4. Август 2022 Завершение обучения GPT-4.
  5. Май 2023 Выступление Гэри Маркуса в Сенате США вместе с Сэмом Альтманом.
  6. Сентябрь 2024 Выход книги 'Taming Silicon Valley'.
⚖️ Другая сторона
Искусственный интеллект Гэри Маркус OpenAI Machine Learning Street Talk GPT-4 нейросимволический ИИ