# Лидеры Meta и NVIDIA о Llama 3.1, ИИ-агентах и конце доминирования смартфонов

Источник: https://www.youtube.com/watch?v=iToQ8jAh--I
Канал: Wes Roth
Опубликовано: 30.07.2024

---

На конференции SIGGRAPH 2024 состоялась знаковая встреча двух лидеров технологической индустрии: основателя Meta Марка Цукерберга и главы NVIDIA Дженсена Хуанга. В ходе дискуссии они обсудили фундаментальный переход от общих вычислений к генеративному ИИ, роль открытого программного обеспечения в новой экономике и будущее носимых устройств, которые должны заменить смартфоны.

## 🧠 Эволюция рекомендаций и генеративный контент
[[JUMP:0:24]]

В начале беседы Дженсен Хуанг отметил, что Meta представила на SIGGRAPH 20 papers (научных работ) на стыке ИИ и симуляции, подчеркнув многолетний вклад компании в фундаментальные исследования через подразделение FAIR [1:06]. Марк Цукерберг пояснил, что хотя сегодня в центре внимания находится генеративный ИИ, основой бизнеса Meta долгое время были сложнейшие рекомендательные системы для Facebook и Instagram.

По словам Цукерберга, эти системы прошли путь от простого ранжирования постов друзей до анализа миллионов единиц публичного контента [4:11]. Основные тезисы развития контента в представлении Meta:

*   **Переход к универсальным моделям:** Ранее для разных типов контента (Reels, длинные видео) использовались разные модели. Теперь Meta переходит к единым мультимодальным моделям, которые лучше распознают паттерны и «слабые сигналы» интересов пользователя [5:43].
*   **Синтетический контент:** Цукерберг прогнозирует, что в будущем большая часть контента в лентах будет либо создаваться ИИ на лету под конкретного пользователя, либо синтезироваться из существующих фрагментов по запросу [4:38].
*   **Рекомендательные системы как суперкомпьютеры:** Хуанг подчеркнул, что системы рекомендаций Meta являются одними из крупнейших вычислительных комплексов, когда-либо созданных человечеством [4:50].

## 🤖 AI Studio: ИИ-агенты для каждого создателя и бизнеса
[[JUMP:10:17]]

Одним из ключевых анонсов стал запуск AI Studio — набора инструментов, позволяющего пользователям и создателям контента создавать собственные ИИ-версии самих себя. Цукерберг считает, что в мире не будет «одного центрального ИИ», с которым общаются все [10:32]. Вместо этого возникнет многообразие агентов.

Ключевые аспекты концепции ИИ-агентов:

1.  **Для создателей:** Авторы контента смогут обучить агента на своих материалах, чтобы тот взаимодействовал с сообществом, отвечая на вопросы в стиле автора. Это решит проблему нехватки времени на личное общение с миллионами подписчиков [11:53].
2.  **Для бизнеса:** По мнению Цукерберга, в будущем у каждого бизнеса будет ИИ-агент, заменяющий (или объединяющий) функции продаж и поддержки. Это позволит клиентам получать мгновенные ответы без разделения на разные департаменты [14:50].
3.  **Для личного пользования:** Цукерберг отметил популярный сценарий использования Meta AI — ролевые игры для отработки сложных социальных ситуаций (просьба о повышении, конфликт с другом) в «безоценочной зоне» [13:03].

Дженсен Хуанг добавил, что каждый ресторан и каждый веб-сайт в будущем обзаведутся собственным ИИ [14:36].

## 🔓 Философия Open Source и успех Llama
[[JUMP:20:07]]

Обсуждая выпуск Llama 3.1, Дженсен Хуанг назвал выход Llama 2 в прошлом году «крупнейшим событием в индустрии ИИ», так как это активировало предприятия во всех отраслях — от здравоохранения до стартапов [20:12]. Цукерберг подробно объяснил, почему Meta придерживается стратегии открытого исходного кода.

Главным аргументом Цукерберга стала борьба с ограничениями закрытых платформ, таких как Apple (iOS). По его мнению:

*   **Опыт мобильной эры:** Цукерберг признал, что Apple «выиграла» мобильное поколение, создав закрытую экосистему и диктуя условия разработчикам приложений [24:22]. Его «злит» ситуация, когда платформа может запретить выпуск определенных функций [26:10].
*   **Возврат к модели ПК:** Глава Meta проводит аналогию с эпохой персональных компьютеров, где более открытая система Windows от Microsoft победила закрытую систему Apple [24:50]. Он надеется, что в поколении ИИ открытая экосистема снова станет лидирующей.
*   **Экономика масштаба:** Открывая Llama, Meta выигрывает от того, что вся индустрия (включая NVIDIA) оптимизирует свое железо и софт под эти модели [29:46]. Хуанг подтвердил, что в NVIDIA сотни инженеров работают исключительно над оптимизацией PyTorch (созданного в Meta) [29:34].

## 🏗️ Инфраструктура и NVIDIA AI Foundry
[[JUMP:30:50]]

Хуанг рассказал о концепции «ИИ-заводов» (AI Factories) и сервисе NVIDIA AI Foundry. Цель — помочь компаниям внедрить Llama в их собственные рабочие процессы.

*   **Дистилляция моделей:** Компании могут использовать огромную модель Llama 3.1 405B для генерации синтетических данных и обучения («дистилляции») своих маленьких, специализированных моделей [28:04].
*   **NIM (NVIDIA Inference Microservices):** Это контейнеризированные сервисы, которые позволяют компаниям «скачать» свой обученный ИИ и запустить его где угодно — от облака до локальных серверов, сохраняя право собственности на данные [31:44].
*   **Внутренний пример NVIDIA:** Хуанг сообщил, что инженеры NVIDIA используют специализированные версии Llama для проектирования чипов, написания кода на Verilog и триажа багов [32:36].

Цукерберг отметил, что инференс (работа) модели 405B обходится примерно в два раза дешевле, чем использование GPT-4o через API [34:33].

## 🕶️ Умные очки и будущее визуального ИИ
[[JUMP:40:37]]

Важной частью дискуссии стало обсуждение носимых устройств. Meta продемонстрировала новую версию модели Segment Anything 2 (SAM 2), которая теперь способна отслеживать объекты в видео в реальном времени («zero-shot») [36:49].

Прогнозы Цукерберга относительно будущего устройств:

*   **Два типа устройств:** По мнению Цукерберга, в будущем будут сосуществовать VR/MR-шлемы (аналог рабочих станций для глубокого погружения) и умные очки (аналог смартфонов для повседневного ношения) [41:03].
*   **Очки как ИИ-интерфейс:** Очки Ray-Ban Meta стали успешными во многом случайно — сенсоры (камеры и микрофоны), предназначенные для съемки, оказались идеальным «телом» для мультимодального ИИ [43:42].
*   **Ценовой сегмент:** Цукерберг ожидает, что ИИ-очки без дисплея за $300 станут массовым продуктом с аудиторией в сотни миллионов человек [45:04].
*   **Голографическое присутствие:** Технология Codec Avatars позволит проводить встречи, где участники будут чувствовать физическое присутствие голограмм друг друга, что радикально изменит удаленную работу [46:10].

## 🥩 Личные истории и «Кулинарный ИИ»
[[JUMP:37:31]]

Беседа не обошлась без личных подробностей. Дженсен Хуанг вспомнил, как Марк Цукерберг приходил к нему в гости готовить филадельфийский чизстейк. Хуанг в шутку назвал Цукерберга своим «су-шефом» [37:31].

Интересной деталью стала «обсессивно-компульсивная» черта Марка: Хуанг рассказал, что когда он попросил Марка нарезать помидоры, тот нарезал их с точностью до миллиметра и разложил на тарелке так, чтобы ни один ломтик не касался другого [38:22]. «Как только ломтик отделяется от помидора, они больше никогда не должны соприкасаться», — иронизировал Хуанг [38:34].

В конце встречи участники провели традиционный для спортсменов обмен «джерси» — Цукерберг подарил Хуангу черную кожаную куртку с меховым воротником, купленную онлайн, а Хуанг в ответ отдал Марку свою новую кожаную куртку, которую он надел всего за два часа до мероприятия специально для SIGGRAPH [55:41].