Ян Лекун: «Мы не получим разум человеческого уровня, просто масштабируя LLM»

Будущее искусственного интеллекта лежит за пределами современных языковых моделей, а страхи перед «восстанием машин» сильно преувеличены из-за непонимания механики работы разумных систем. Ян Лекун (Yann LeCun), главный ученый по ИИ в Meta, в интервью для Eye on AI подробно объясняет, почему масштабирование LLM не приведет к человеческому интеллекту, как архитектура JEPA имитирует обучение животных и почему открытый исходный код — единственный способ защитить глобальную культуру от цифровой гегемонии Кремниевой долины.

🌍 Мировые модели: почему предсказывать пиксели бесполезно 2:43

Центральная концепция, которую продвигает Ян Лекун, — это «мировая модель» (world model). По его определению, это способность системы понимать текущее состояние реальности и предсказывать, как оно изменится в результате естественного развития или конкретных действий агента . Если система может предсказать результат последовательности действий, она может планировать их для достижения цели .

Ян Лекун выделяет ключевые особенности эффективных мировых моделей:

Абстракция вместо детализации: Модели не должны предсказывать каждый пиксель видео или каждую ворсинку на дереве. Для сборки мебели неважно, какой именно отверткой вы пользуетесь, если она подходит к винту; важен конечный результат .
Архитектура JEPA (Joint-Embedding Predictive Architecture): В отличие от генеративных моделей, JEPA делает предсказания в пространстве абстрактных представлений . Система кодирует изображение, затем получает «испорченную» версию того же кадра (замаскированную или размытую) и обучается предсказывать признаки полного изображения из признаков поврежденного .
Отказ от генерации пикселей: По мнению Лекуна, попытки предсказывать видео попиксельно обречены на провал, так как мир слишком сложен и вариативен . Это приводит к размытым изображениям и плохим внутренним репрезентациям. Текст в этом плане намного проще, так как язык дискретен .

В качестве примера успешно реализованной концепции Ян Лекун приводит модель Gaia-1 от компании Wayve.AI, которая обучается предсказывать дорожные ситуации в абстрактном пространстве, что критически важно для автономного вождения .

🧠 Ограничения LLM и «парадокс Моравека» 9:15

Ян Лекун категорически не согласен с утверждением, что простое увеличение вычислительных мощностей и объемов данных (scaling) приведет к созданию ИИ человеческого уровня . По его словам, современные большие языковые модели (LLM) лишь создают иллюзию интеллекта за счет свободного владения языком, но лишены базовых способностей, присущих даже животным .

Лекун приводит следующие аргументы в пользу неполноценности LLM:

Отсутствие здравого смысла: Система может сдать экзамен на адвоката, просто заучив огромные массивы текста, но не способна научиться водить машину за 20 часов практики, как 17-летний подросток .
Бытовые задачи: Ни один современный ИИ не может убрать со стола и загрузить посудомоечную машину — задачу, с которой 10-летний ребенок справляется с первого раза .
Логические провалы: По мнению Лекуна, LLM не понимают логики. Если сказать модели, что «A равно B», а затем спросить, «равно ли B значению A», она может ответить «не знаю» .

Это подтверждает «парадокс Моравека»: задачи, которые кажутся сложными для людей (игра в шахматы, вычисление интегралов), легки для компьютеров, а задачи, которые мы считаем самоочевидными (сенсомоторные навыки, планирование), остаются для ИИ почти недостижимыми . Ян Лекун призывает использовать «телесный тест Тьюринга» (embodied Turing test) — создание робота, чье поведение в физическом мире будет неотличимо от поведения кошки или другого животного .

🛡️ Спор о «экзистенциальной угрозе» и демократия 13:54

В сообществе «отцов-основателей» современного ИИ наметился раскол. Если Джеффри Хинтон и Йошуа Бенжио публично предупреждают об угрозах ИИ, то Ян Лекун занимает оптимистичную позицию. Он считает, что опасения его коллег связаны с недавними «эпифаниями» (внезапными прозрениями), которые случились у Хинтона летом 2023 года, а у Бенжио — зимой того же года .

Аргументы Лекуна против страха перед ИИ:

Несовершенство текущих систем: Текущие ИИ не могут изобрести новое биологическое оружие или спланировать сложную атаку, так как они обучаются на публичных данных из интернета. По мнению Лекуна, всё, что может выдать ИИ сегодня, можно найти в поисковике за несколько минут .
Защита превосходит атаку: Лучшие средства борьбы с дезинформацией и кибератаками сами основаны на ИИ. Лекун отмечает, что 5 лет назад ИИ в Meta удалял 20–25% хейтспича, а сегодня — 95% благодаря трансформерам и самообучению .
Доверие к институтам: Лекун утверждает, что страх перед ИИ часто является скрытым страхом перед слабостью демократических институтов. «Я больше доверяю человечеству и демократии, чем они», — заявляет гость .

Лекун напоминает, что занимается вопросами безопасности ИИ с 2014 года. Он был соинициатором создания Partnership on AI — форума для обсуждения этики и рисков технологий еще до того, как они стали мейнстримом .

🚀 Objective-Driven AI: чертеж безопасного будущего 26:19

Чтобы сделать ИИ действительно безопасным и эффективным, Ян Лекун предлагает перейти к «ИИ, управляемому целями» (objective-driven AI) . Это принципиально иная архитектура, отличная от авторегрессионных LLM.

Ключевые принципы этой концепции:

Планирование вместо угадывания: Современные LLM генерируют слова одно за другим, не зная, к чему придут. Objective-driven системы сначала планируют ответ так, чтобы он удовлетворял заданным критериям (целям) .
Жесткие ограничения (Guardrails): В систему закладываются неизменяемые цели. Например: «Твой ответ должен быть понятен 13-летнему ребенку» или «Твои действия как робота-повара не должны задевать людей ножом» .
Иерархия подцелей: Машина может сама определять подцели для выполнения задачи, но они всегда должны оставаться в рамках глобальных целей, заданных человеком .

Ян Лекун уверен, что мы не создадим суперразум мгновенно. Прогресс будет идти от систем уровня мыши к уровню кошки, затем собаки, с постепенным добавлением слоев безопасности — так же, как десятилетиями совершенствовалась надежность турбореактивных двигателей .

👐 Почему Open Source неизбежен 42:05

Ян Лекун и Meta активно поддерживают открытость исследований ИИ. Ведущий Craig Smith задает вопрос: сможет ли открытый код конкурировать с закрытыми моделями (OpenAI, Google), учитывая колоссальные затраты на вычислительные мощности?

Лекун приводит несколько причин, по которым Open Source победит:

Исторический опыт: В 90-е годы Sun Microsystems и Microsoft боролись за инфраструктуру интернета, но в итоге победили открытые Linux, Apache и MySQL. Открытые системы безопаснее, настраиваемы и быстрее исправляют уязвимости .
Отсутствие монополии на идеи: Ни одна компания не обладает монополией на таланты. Академическое сообщество и стартапы могут вносить вклад только в открытые платформы .
Культурный суверенитет: Если ИИ станет посредником во взаимодействии с цифровым миром для каждого жителя планеты, правительства стран (Франции, Сенегала, Индонезии) не захотят, чтобы их «информационная диета» контролировалась парой компаний с Западного побережья США .

«Что важно для фермера в Южной Индии, скорее всего, не будет учтено при тонкой настройке модели специалистами в Калифорнии», — подчеркивает Ян Лекун. Он сравнивает будущее обучение ИИ с Wikipedia, где миллионы людей вносят вклад в общую базу знаний, сохраняя разнообразие языков и культур .

Единственной причиной, по которой Meta может прекратить публикацию открытых моделей (таких как Llama), Лекун называет юридическое давление — законы, запрещающие использование публичных данных для обучения или накладывающие на разработчика ответственность за любые действия пользователей с открытым кодом .