Уэс Рот о Llama 4: «Почти бесконечный» контекст и война с DeepSeek

Wes Roth 26,9 тыс. 11 мин 4 мин 06.04.2025
Главное

Марк Цукерберг и компания Meta представили новое поколение своих языковых моделей — Llama 4. Релиз стал ответом на недавний успех китайской модели DeepSeek, который заставил команду Meta перейти в режим «военного положения», чтобы вернуть себе лидерство в сегменте инструментов с открытым исходным кодом. Главной сенсацией анонса стало внедрение «почти бесконечного» контекстного окна, достигающего 10 миллионов токенов.

🦙 Новая иерархия моделей Llama 4 1:31

Meta представила четыре уровня (тира) моделей, каждый из которых оптимизирован под конкретные задачи. В отличие от предыдущих поколений, здесь впервые массово используется архитектура Mixture of Experts (MoE — смесь экспертов).

По словам ведущего Уэса Рота, эта структура напоминает работу крупной компании: если в штате 1000 сотрудников, для решения конкретной задачи в комнату вызывают только 100 профильных специалистов . Такой подход позволяет активировать лишь часть параметров при каждом запросе, что делает инференс (выполнение модели) значительно быстрее и дешевле.

Линейка включает:

♾️ «Бесконечный» контекст и технологический прорыв 1:05

Самым заметным техническим достижением Meta стало расширение контекстного окна до 10 миллионов токенов в модели Scout . Для сравнения: даже мощные современные модели, такие как Gemini 1.5 Pro, предлагают 1–2 миллиона токенов.

Марк Цукерберг охарактеризовал это окно как «почти бесконечное» . По мнению Уэса Рота, работа с большими окнами контекста меняет само ощущение от использования ИИ — создается впечатление, что у модели «больше пространства для размышлений» .

Чтобы доказать эффективность такого объема памяти, Meta опубликовала результаты теста «Иголка в стоге сена» (Needle-in-a-Haystack). Результаты показывают:

  1. Текст: Модель успешно находит конкретные факты в огромных массивах данных .
  2. Видео: Мультимодальные возможности Scout позволяют эффективно анализировать длинные видеозаписи, удерживая контекст происходящего на протяжении всего хронометража .

🧠 Behemoth как «инопланетная матка» для данных 4:35

Модель Llama 4 Behemoth позиционируется Meta не просто как самый мощный ИИ в их линейке, но и как «учитель» для более слабых версий. По результатам бенчмарков STEM, эта нейросеть превосходит таких гигантов, как GPT-4.5 и Claude 3.7 .

Ведущий описывает роль Behemoth через метафору «королевы чужих», которая «откладывает яйца» в виде синтетических данных . Этот процесс (дистилляция знаний) позволяет тренировать меньшие модели, такие как Maverick, на высококачественных данных, созданных суперкомпьютером. Такой метод обеспечивает Maverick высокую производительность при значительно меньших затратах на вычислительные мощности .

🌏 Геополитика кода: Meta против Китая 5:14

Разработка Llama 4 проходила в условиях жесткой конкуренции с китайскими разработчиками. Ведущий отмечает, что выход DeepSeek заставил Meta создать специальный «штаб» (war room), чтобы удержать статус «короля открытого ПО» .

В статье упоминается мнение инвестора и предпринимателя Баладжи Сринивасана, который считает, что массовый выпуск качественных открытых моделей из Китая — это стратегия борьбы с доминированием американского Big Tech . Наводняя рынок бесплатными и эффективными ИИ-инструментами, Китай подрывает способность американских гигантов (таких как OpenAI или Google) зарабатывать на платных подписках и API. Meta, выпуская Llama 4, вынуждена играть по этим правилам, продвигая открытость как благо для разработчиков и мира .

🇪🇺 Регуляторный барьер Евросоюза 9:43

Острой темой обсуждения стал запрет на использование Llama 4 на территории Европейского Союза. Из-за жестких требований законодательства ЕС (AI Act), Meta ограничила доступ к своим новым моделям для граждан и компаний этого региона .

Основные юридические нюансы:

Уэс Рот подверг резкой критике действия руководства Евросоюза, считая, что стремление стать «первыми в регулировании» привело к тому, что их граждане фактически лишены доступа к ключевой технологии современности . По мнению автора, такая политика грозит Европе технологическим отставанием, хотя в последнее время некоторые лидеры ЕС начинают пересматривать свои взгляды .

📊 Сравнение производительности и стоимости 7:12

Meta делает ставку на коэффициент «производительность на доллар». По данным, представленным в видео:

Несмотря на цифры, Уэс Рот подчеркивает, что реальную ценность моделей определят пользователи в своих специфических сценариях, а не синтетические тесты .

💬 Цитаты

«Llama 4 Scout будет иметь контекстное окно в 10 миллионов. Марк Цукерберг назвал это почти бесконечным окном.»

«Если вы создаете правила, согласно которым ни одна компания не может выпустить продукт в вашей стране, вы просто объявляете этот продукт вне закона.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Mixture of Experts (MoE)
Архитектура нейросети, где для каждого запроса активируется только часть наиболее подходящих параметров (экспертов).
Контекстное окно
Объем данных (текста, кода, видео), который модель может удерживать в оперативной памяти одновременно.
Дистилляция моделей
Процесс обучения компактной нейросети на данных, сгенерированных более мощной моделью-учителем.
Needle-in-a-Haystack
Тест на способность ИИ находить крошечный фрагмент данных внутри огромного массива текста.
📊 Цифры
🗓 Хронология
  1. Март 2025 Релиз моделей семейства Llama 4 от Meta.
  2. 29 апреля 2025 Запланированная конференция Llama Con с новыми анонсами.
⚖️ Другая сторона
Искусственный интеллект Llama 4 Meta Zuckerberg DeepSeek Scout