Как SambaNova Systems меняет правила игры в инференсе ИИ

Eye on AI 1,9 тыс. 23 мин 3 мин 02.01.2025
Главное

В современном мире ИИ основная битва долгое время разворачивалась на поле обучения моделей — территории, где безраздельно властвовала NVIDIA. Однако сегодня фокус смещается в сторону инференса (исполнения моделей), и амбициозный стартап SambaNova Systems заявляет о готовности потеснить технологического гиганта, предложив кардинально иную архитектуру.

🚀 Прорыв в инференсе: SambaNova против NVIDIA и стартапов 3:59

Родриго Лян, сооснователь и генеральный директор SambaNova Systems, утверждает, что компания совершила качественный скачок в производительности, представив новый сервис SambaNova Cloud. Основой этого решения стал чип RDU (Reconfigurable Dataflow Unit), который позволяет запускать сложнейшие открытые модели с рекордной скоростью .

Ключевые достижения SambaNova, озвученные в интервью:

Лян подчеркивает, что по мере перехода ИИ в стадию промышленной эксплуатации расходы на инференс превысят затраты на обучение в 10 раз . В этой новой реальности доминирование Cuda (программной экосистемы NVIDIA) перестает быть непреодолимым барьером, так как разработчики обращаются к сервисам через стандартные API .

🧠 Архитектура RDU: Как работает «реконфигурируемый поток данных» 15:13

В отличие от традиционных GPU, архитектура SambaNova построена на принципе «dataflow» (поток данных). По мнению Ляна, это позволяет сократить количество необходимых чипов на порядок: там, где NVIDIA требуется 100 процессоров, SambaNova справляется примерно с десятью .

Особенности аппаратного обеспечения SambaNova:

  1. Сложная иерархия памяти: Чипы оснащены значительным объемом встроенной SRAM, а также используют HBM и DDR.
  2. Гигантский объем памяти: К системе напрямую подключено 12 терабайт оперативной памяти DDR, что позволяет держать в памяти огромные модели (до триллиона параметров) целиком и запускать их максимально эффективно .
  3. Виртуализация: Лян заявляет, что их софт позволяет одновременно поддерживать сотни различных «чекпоинтов» (версий моделей) на одной системе . Это дает возможность реализовать мультиарендность (multi-tenancy), когда разные клиенты используют свои частные версии моделей на одном оборудовании без необходимости выделять отдельную стойку под каждого.

🏢 Стратегия выхода на рынок: От спецслужб до облаков 12:17

Несмотря на то, что SambaNova меньше на слуху, чем Groq или Cerebras, Родриго Лян объясняет это исторической ориентацией компании на закрытый корпоративный сектор и государственные структуры.

По утверждению гендиректора:

Основной фокус SambaNova долгие годы был направлен на on-premise решения (установка оборудования в дата-центры клиента). Это обусловлено тем, что 83% корпоративных данных, по оценке Ляна, хранятся внутри компаний из соображений безопасности . SambaNova Cloud — это попытка вынести ту же эффективность в облачную среду через партнеров-провайдеров, не требуя при этом строительства новых гигаваттных центров с жидкостным охлаждением .

🔮 Будущее рынка: Открытый код и частные модели 19:46

Родриго Лян строит свой прогноз развития индустрии ИИ на трех столпах:

  1. Доминирование Open Source: Мир идет в сторону открытых моделей (таких как Llama), которые становятся все более качественными .
  2. Рост размеров моделей: Пользователям нужна высокая точность и мультимодальность, что неизбежно ведет к укрупнению архитектур. SambaNova делает ставку на то, что их железо проявляет себя тем лучше, чем больше параметров у модели .
  3. Массовая кастомизация: В будущем каждый пользователь захочет иметь собственный «чекпоинт» модели, обученный на его личных или корпоративных данных .

На вопрос о том, почему OpenAI остается «замужем» за NVIDIA, Лян ответил, что это, вероятно, связано с историческими инвестициями и тем фактом, что GPU появились на рынке раньше . Однако он уверен: рынок требует выбора, и критическая проблема энергопотребления заставит индустрию перейти на более эффективные решения, такие как реконфигурируемые чипы SambaNova .

💬 Цитаты

«Производственный ИИ будет полностью посвящен инференсу... стоимость инференса будет в 10 раз больше, чем мы тратим на обучение.»

Родриго Лян 05:45

«Там, где NVIDIA требуется 100 чипов, мы можем справиться примерно с десятью благодаря архитектуре потока данных.»

Родриго Лян 10:43

«Мы — самый развернутый стартап по ИИ-чипам в правительстве США, о чем люди часто даже не догадываются.»

Родриго Лян 12:33
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Инференс
Процесс использования уже обученной нейросети для получения ответов на новые данные.
RDU (Reconfigurable Dataflow Unit)
Специализированный чип SambaNova, архитектура которого подстраивается под поток данных алгоритма.
Чекпоинт (Checkpoint)
Сохраненное состояние весов модели после определенного этапа обучения или тонкой настройки.
Токены в секунду
Метрика скорости генерации текста нейросетью (примерно соответствует слогам или частям слов).
📊 Цифры
🗓 Хронология
  1. 2017 Основание компании SambaNova Systems Родриго Ляном и профессорами Стэнфорда.
  2. 2017-2020 Привлечение $1,1 млрд инвестиций от Intel, Google, SoftBank и других.
  3. 2024 Запуск SambaNova Cloud и установление мировых рекордов скорости инференса для моделей Llama.
⚖️ Другая сторона
Искусственный интеллект SambaNova Systems Nvidia Llama 3.1 инференс архитектура RDU