Амит Сангани: «Эра открытых моделей Llama экономит компаниям миллионы долларов»

DeepLearning.AI 863 28 мин 3 мин 27.03.2025
Главное

На конференции AI Dev 25 Амит Сангани (Amit Sangani), руководитель отдела партнерского инжиниринга Meta, представил комплексный взгляд на экосистему Llama. В своем выступлении он объяснил, почему открытый исходный код является стратегическим выбором для Meta, как компании экономят миллионы долларов за счет тонкой настройки моделей и представил Llama Stack — амбициозный проект по стандартизации разработки приложений на базе ИИ.

🔓 Почему Meta выбирает Open Source: Стратегия и преимущества 1:34

Амит Сангани подчеркивает, что открытость ИИ — это не благотворительность, а прагматичный путь вперед, который выгоден всем участникам рынка. По мнению спикера, подход Open Source несет ключевые преимущества для разработчиков и стартапов:

Сангани также отметил, что открытый код безопаснее благодаря прозрачности и широкому общественному аудиту (scrutiny) .

📈 Эволюция Llama: От исследований к мировому стандарту 4:02

История семейства моделей Llama демонстрирует стремительный переход от чисто научных изысканий к промышленному применению:

  1. Llama 1 (2023): Выпущена исключительно с исследовательской лицензией .
  2. Llama 2: Получила коммерческую лицензию и первые инструменты безопасности.
  3. Llama 3 и 3.1: Появление флагманской модели 405B — крупнейшей в мире опенсорсной модели с 405 млрд параметров, обученной на 16 трлн токенов .
  4. Llama 3.2: Упор на компактность (модели 1B и 3B для мобильных устройств) и мультимодальность (модели 11B и 90B с поддержкой зрения) .
  5. Llama 3.3 (70B): Модель среднего размера, сопоставимая по мощности с гигантом 405B .

С момента запуска количество загрузок Llama достигло 800 миллионов, а экосистема пополнилась 100 000 производных (fine-tuned) моделей .

🛠 Реальные кейсы: От рекламы до производства полупроводников 5:13

Сангани привел конкретные примеры того, как бизнес извлекает выгоду из Llama, не прибегая к гигантским облачным вычислениям.

Smartly: Автоматизация поддержки

Рекламная платформа Smartly, распоряжающаяся бюджетами в $5 млрд, внедрила модель Llama 8B для обработки тикетов техподдержки.

Etched: ИИ-эксперт в микроэлектронике

Компания Etched создала Semicong — первую специализированную языковую модель для полупроводниковой индустрии на базе Llama 70B .

Scribd: Генерация синтетических данных

Платформа Scribd (200 млн пользователей) использует многоуровневую систему. Флагманская модель 405B используется для генерации высококачественных синтетических данных, на которых затем обучается легкая модель 8B . Это позволило повысить точность поиска до 97% при снижении затрат на вычисления на 30% .

🏗 Llama Stack: Единый стандарт разработки 16:52

Одной из главных проблем индустрии Сангани называет фрагментацию: для очистки данных, RAG (поиска в базе знаний) и дообучения используются десятки не связанных друг с другом инструментов. Решением стал Llama Stack — попытка создать стандартизированный слой API для разработки ИИ-приложений .

Основные компоненты Llama Stack:

🛡 Безопасность и экосистема 23:26

Meta уделяет серьезное внимание этике и безопасности, предлагая инструменты серии Llama Guard и Prompt Guard . Эти решения позволяют разработчикам выстраивать фильтры на входе и выходе модели, настраивая уровень жесткости модерации под конкретные нужды проекта.

В завершение Амит Сангани напомнил о важности партнерства. Meta создала AI Alliance, куда входят более 100 организаций (включая IBM, Nvidia и DeepLearning.AI), чтобы гарантировать, что будущее ИИ останется открытым .

💬 Цитаты

«Нужно перемещать модель туда, где находятся данные, а не данные туда, где находится модель.»

Амит Сангани 02:29

«Мы не хотим быть запертыми в закрытых системах наших конкурентов.»

Амит Сангани 03:09
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Fine-tuning
Процесс дообучения предварительно обученной модели на узкоспециализированном наборе данных.
RAG (Retrieval-Augmented Generation)
Технология, позволяющая нейросети искать информацию во внешней базе данных перед генерацией ответа.
Llama Stack
Набор стандартизированных API и инструментов для упрощения вывода ИИ-моделей в продакшн.
Синтетические данные
Данные, созданные одной ИИ-моделью для обучения другой модели.
📊 Цифры
🗓 Хронология
  1. 2023 Запуск Llama 1 под исследовательской лицензией.
  2. 2023 Запуск Llama 2 с коммерческой лицензией.
  3. 2023 Основание AI Alliance совместно с IBM.
  4. 2024 Запуск Llama 3.1 (405B) и Llama 3.2 (мультимодальные и мобильные версии).
⚖️ Другая сторона
Искусственный интеллект Llama Meta Llama Stack Open Source AI Амит Сангани