Уэс Рот о Snowflake Arctic: «Это огромная победа для открытого ИИ»

Wes Roth 50,7 тыс. 26 мин 4 мин 24.04.2024
Главное

Компания Snowflake представила собственную большую языковую модель под названием Arctic, которая претендует на звание наиболее эффективного решения для корпоративного сектора. В отличие от многих конкурентов, ориентированных на широкого потребителя, Arctic сфокусирована исключительно на задачах B2B-сегмента, предлагая компаниям возможность создавать собственные ИИ-инструменты без колоссальных затрат, типичных для лидеров рынка.

❄️ Snowflake Arctic: Новый стандарт корпоративного интеллекта 0:00

Snowflake Arctic позиционируется как «самая интеллектуальная и по-настоящему открытая» модель для предприятий . Главной проблемой, которую стремится решить Snowflake, является высокая стоимость и ресурсоемкость разработки собственных LLM для крупного бизнеса, которые зачастую обходятся в десятки и сотни миллионов долларов . Arctic демонстрирует выдающиеся результаты в специфических корпоративных задачах: генерации SQL-запросов, написании программного кода и следовании сложным инструкциям .

Ключевые особенности запуска:

Snowflake вводит понятие «Enterprise Intelligence» (корпоративный интеллект) — метрику, усредняющую показатели модели в кодинге, SQL и работе с инструкциями . По словам разработчиков, их клиентам нужны не просто чат-боты, а надежные «копилоты» для работы с базами данных, способные выдавать проверяемые ответы .

🏗️ Революция архитектуры: 128 «экспертов» и гибридный подход 4:20

Самым заметным техническим отличием Arctic является её архитектура. В то время как большинство современных моделей используют систему Mixture of Experts (MoE) с восемью экспертами (как, например, в GPT-4 или Grok), Snowflake пошла по пути экстремальной фрагментации .

Технические характеристики Arctic в сравнении с конкурентами:

Команда Snowflake утверждает, что такой подход позволяет значительно повысить качество модели без соразмерного увеличения затрат на вычисления . Вместо того чтобы использовать одну огромную и медленную модель, система выбирает комбинации из множества маленьких специализированных экспертов. Это позволяет Arctic достигать топовых показателей при бюджете на обучение менее 2 миллионов долларов . Для сравнения, оценочная стоимость обучения GPT-4 в свое время составляла около 60 миллионов долларов .

💰 Экономика ИИ: Дешевле, быстрее, доступнее 9:40

Ведущий канала Уэс Рот подчеркивает, что для конечного пользователя стоимость обучения модели не важна, но для компаний, желающих создавать свои решения, это меняет правила игры . Снижение стоимости входа в индустрию дополняется удешевлением инференса (процесса выдачи ответов моделью).

Сравнение стоимости инференса за 1 миллион токенов (данные из видео):

Рот напоминает о знаменитой «утекшей» служебной записке Google, в которой утверждалось: «У нас нет никакой секретной защиты (moat), и у OpenAI её тоже нет» . Основная мысль того документа заключалась в том, что сообщество Open Source «тихо поедает наш ланч», обходя технологических гигантов за счет скорости и коллективных инноваций .

🛡️ Битва за Open Source: Безопасность vs Лоббизм 14:25

Вопрос открытости ИИ-моделей вызывает ожесточенные споры в Вашингтоне. Уэс Рот цитирует Лору Эдельсон, профессора Северо-Восточного университета и бывшего технического директора антимонопольного подразделения Минюста США, которая критикует действия лоббистов крупных тех-компаний .

Основные тезисы дискуссии об открытости:

  1. Аргумент за безопасность: Критики Open Source утверждают, что доступность весов моделей снижает безопасность, так как «плохие парни» могут использовать их для создания биооружия или проведения кибератак .
  2. Аргумент за коллективную защиту: Марк Цукерберг и сторонники открытости сравнивают это с кибербезопасностью: открытость позволяет быстрее находить уязвимости и выпускать патчи . По мнению Цукерберга, ответственная публикация моделей в итоге делает мир безопаснее .
  3. Конкуренция: По словам Лоры Эдельсон, аргумент о том, что бесплатные открытые модели мешают конкуренции, — это «нонсенс» . Компании зарабатывают не на продаже самой модели, а на сервисах вокруг неё (как Data Bricks или Snowflake) .

Эдельсон полагает, что настоящая причина нападок на Open Source со стороны гигантов — не страх перед «Скайнетом» или китайскими хакерами, а нежелание терять контроль над рынком и возможность устанавливать высокие цены . Она утверждает, что государству не хватает собственных экспертов, из-за чего оно вынуждено полагаться на мнение специалистов, финансируемых Big Tech, которые продвигают идею «опасности открытых весов» .

👨‍🍳 «Кулинарная книга» ИИ и будущее персональных моделей 24:00

Одним из самых значимых вкладов Snowflake в сообщество Уэс Рот считает публикацию «Cookbook» — подробного руководства по созданию высококлассных MoE-моделей . Это пособие включает учебный план по подготовке данных и методы оценки качества моделей .

Уэс Рот прогнозирует, что в ближайшем будущем подобные технологии позволят обычным пользователям создавать узкоспециализированных ИИ-агентов для личных нужд . Например, можно будет «натренировать» модель для фильтрации новостей, чтобы она отсекала политический шум и кликбейт, оставляя только важные факты об ИИ .

В завершение обзора автор упоминает символичное событие: Дженсен Хуанг, основатель Nvidia, лично доставил первый в мире сервер DGX H200 в офис OpenAI, посвятив его «развитию ИИ и человечества» . Это подчеркивает, что гонка вооружений в сфере вычислительных мощностей продолжается параллельно с расцветом открытых и эффективных моделей.

💬 Цитаты

«У нас нет никакой секретной защиты (moat), и у OpenAI её тоже нет. Open source тихо поедает наш ланч.»

Уэс Рот (цитируя внутреннюю записку Google) 13:46

«Открытый исходный код означает, что каждый может внедрять инновации быстрее.»

Лора Эдельсон 22:33
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Mixture of Experts (MoE)
Архитектура нейросети, состоящая из набора специализированных подсетей («экспертов»), из которых для каждого запроса выбираются только наиболее подходящие.
Инференс
Процесс работы уже обученной модели по выдаче ответов на запросы пользователя.
SQL-генерация
Способность модели писать код на языке запросов к базам данных.
Open Weights
Модели, у которых опубликованы «веса» — числовые параметры, определяющие поведение нейросети, что позволяет запускать их локально.
📊 Цифры
🗓 Хронология
  1. Февраль 2023 Запуск первой модели Llama от Meta.
  2. Март 2023 Утечка весов Llama в открытый доступ, начало бума Open Source.
  3. Апрель 2024 Релиз Snowflake Arctic и доставка первого Nvidia DGX H200 в OpenAI.
⚖️ Другая сторона
Искусственный интеллект Snowflake Arctic Mixture of Experts Wes Roth Llama 3 Laura Edelson