Уэс Рот о Snowflake Arctic: «Это огромная победа для открытого ИИ»

Компания Snowflake представила собственную большую языковую модель под названием Arctic, которая претендует на звание наиболее эффективного решения для корпоративного сектора. В отличие от многих конкурентов, ориентированных на широкого потребителя, Arctic сфокусирована исключительно на задачах B2B-сегмента, предлагая компаниям возможность создавать собственные ИИ-инструменты без колоссальных затрат, типичных для лидеров рынка.

❄️ Snowflake Arctic: Новый стандарт корпоративного интеллекта 0:00

Snowflake Arctic позиционируется как «самая интеллектуальная и по-настоящему открытая» модель для предприятий . Главной проблемой, которую стремится решить Snowflake, является высокая стоимость и ресурсоемкость разработки собственных LLM для крупного бизнеса, которые зачастую обходятся в десятки и сотни миллионов долларов . Arctic демонстрирует выдающиеся результаты в специфических корпоративных задачах: генерации SQL-запросов, написании программного кода и следовании сложным инструкциям .

Ключевые особенности запуска:

Лицензия Apache 2.0: предоставляет свободный доступ к весам модели и программному коду .
Открытость методологии: компания опубликовала так называемые «рецепты данных» (data recipes) и результаты своих исследований, что является редкостью для индустрии .
Доступность: модель уже размещена на платформе Hugging Face, а также доступна через облачные сервисы Microsoft Azure, Nvidia API, Perplexity и Replicate .

Snowflake вводит понятие «Enterprise Intelligence» (корпоративный интеллект) — метрику, усредняющую показатели модели в кодинге, SQL и работе с инструкциями . По словам разработчиков, их клиентам нужны не просто чат-боты, а надежные «копилоты» для работы с базами данных, способные выдавать проверяемые ответы .

🏗️ Революция архитектуры: 128 «экспертов» и гибридный подход 4:20

Самым заметным техническим отличием Arctic является её архитектура. В то время как большинство современных моделей используют систему Mixture of Experts (MoE) с восемью экспертами (как, например, в GPT-4 или Grok), Snowflake пошла по пути экстремальной фрагментации .

Технические характеристики Arctic в сравнении с конкурентами:

Параметры: 480 миллиардов общих параметров .
Количество экспертов: 128 мелкозернистых (fine-grained) экспертов вместо стандартных 8 .
Тип архитектуры: уникальный гибридный Dense-MoE Transformer .

Команда Snowflake утверждает, что такой подход позволяет значительно повысить качество модели без соразмерного увеличения затрат на вычисления . Вместо того чтобы использовать одну огромную и медленную модель, система выбирает комбинации из множества маленьких специализированных экспертов. Это позволяет Arctic достигать топовых показателей при бюджете на обучение менее 2 миллионов долларов . Для сравнения, оценочная стоимость обучения GPT-4 в свое время составляла около 60 миллионов долларов .

💰 Экономика ИИ: Дешевле, быстрее, доступнее 9:40

Ведущий канала Уэс Рот подчеркивает, что для конечного пользователя стоимость обучения модели не важна, но для компаний, желающих создавать свои решения, это меняет правила игры . Снижение стоимости входа в индустрию дополняется удешевлением инференса (процесса выдачи ответов моделью).

Сравнение стоимости инференса за 1 миллион токенов (данные из видео):

GPT-4: от 10 до 30 долларов .
Claude 3 Opus: от 15 до 75 долларов .
Llama 3 (70B) на чипах Groq: всего 60–80 центов .

Рот напоминает о знаменитой «утекшей» служебной записке Google, в которой утверждалось: «У нас нет никакой секретной защиты (moat), и у OpenAI её тоже нет» . Основная мысль того документа заключалась в том, что сообщество Open Source «тихо поедает наш ланч», обходя технологических гигантов за счет скорости и коллективных инноваций .

🛡️ Битва за Open Source: Безопасность vs Лоббизм 14:25

Вопрос открытости ИИ-моделей вызывает ожесточенные споры в Вашингтоне. Уэс Рот цитирует Лору Эдельсон, профессора Северо-Восточного университета и бывшего технического директора антимонопольного подразделения Минюста США, которая критикует действия лоббистов крупных тех-компаний .

Основные тезисы дискуссии об открытости:

Аргумент за безопасность: Критики Open Source утверждают, что доступность весов моделей снижает безопасность, так как «плохие парни» могут использовать их для создания биооружия или проведения кибератак .
Аргумент за коллективную защиту: Марк Цукерберг и сторонники открытости сравнивают это с кибербезопасностью: открытость позволяет быстрее находить уязвимости и выпускать патчи . По мнению Цукерберга, ответственная публикация моделей в итоге делает мир безопаснее .
Конкуренция: По словам Лоры Эдельсон, аргумент о том, что бесплатные открытые модели мешают конкуренции, — это «нонсенс» . Компании зарабатывают не на продаже самой модели, а на сервисах вокруг неё (как Data Bricks или Snowflake) .

Эдельсон полагает, что настоящая причина нападок на Open Source со стороны гигантов — не страх перед «Скайнетом» или китайскими хакерами, а нежелание терять контроль над рынком и возможность устанавливать высокие цены . Она утверждает, что государству не хватает собственных экспертов, из-за чего оно вынуждено полагаться на мнение специалистов, финансируемых Big Tech, которые продвигают идею «опасности открытых весов» .

👨‍🍳 «Кулинарная книга» ИИ и будущее персональных моделей 24:00

Одним из самых значимых вкладов Snowflake в сообщество Уэс Рот считает публикацию «Cookbook» — подробного руководства по созданию высококлассных MoE-моделей . Это пособие включает учебный план по подготовке данных и методы оценки качества моделей .

Уэс Рот прогнозирует, что в ближайшем будущем подобные технологии позволят обычным пользователям создавать узкоспециализированных ИИ-агентов для личных нужд . Например, можно будет «натренировать» модель для фильтрации новостей, чтобы она отсекала политический шум и кликбейт, оставляя только важные факты об ИИ .

В завершение обзора автор упоминает символичное событие: Дженсен Хуанг, основатель Nvidia, лично доставил первый в мире сервер DGX H200 в офис OpenAI, посвятив его «развитию ИИ и человечества» . Это подчеркивает, что гонка вооружений в сфере вычислительных мощностей продолжается параллельно с расцветом открытых и эффективных моделей.