# Почему специализированное ИИ-облако дешевле предложений технологических гигантов?

Источник: https://www.youtube.com/watch?v=Jh2KWiMUPPE
Канал: Eye on AI
Опубликовано: 08.01.2025

---

Бум генеративного искусственного интеллекта обострил потребность разработчиков в специализированных вычислительных мощностях, заставив стартапы искать альтернативу традиционным технологическим гигантам. В интервью для подкаста Eye on AI один из первых сотрудников американской компании Lambda Labs подробно рассказал, как их специализированное «облако для искусственного интеллекта» (AI Cloud) конкурирует с крупнейшими гиперскейлерами. Материал раскрывает эволюцию бизнеса от простого мобильного приложения до управления десятками тысяч графических процессоров (GPU) Nvidia и анализирует текущие изменения на рынке ИИ-вычислений.

## 🎨 От мобильных фильтров к ИИ-инфраструктуре
[[JUMP:2:30]]

История компании Lambda Labs началась не с масштабных дата-центров, а с разработки пользовательского софта в сфере машинного обучения. Первым продуктом команды было мобильное приложение DreamScope для iPhone, запущенное в 2016–2017 годах. Приложение использовало технологию переноса стиля (style transfer), позволяя обрабатывать фотографии в манере Ван Гога или Пикассо. Спикер сравнивает DreamScope с ранней версией популярной нейросети Midjourney.

Проект быстро набрал популярность в творческой среде, получив более 1 миллиона скачиваний за первые несколько месяцев после релиза. Разработчики внедрили платную подписку стоимостью $9,99 в месяц, что позволило компании в определенный момент преодолеть отметку в $100 000 годовой регулярной выручки (ARR). Однако, по словам представителя Lambda Labs, этот бизнес никогда не был прибыльным из-за колоссальных затрат на аренду сторонней облачной инфраструктуры для обработки изображений.

Осознание высокой стоимости облака подтолкнуло команду к стратегическому повороту. Вместо аренды мощностей инженеры Lambda Labs начали закупать графические процессоры (GPU) самостоятельно. Для автоматизации работы они создали собственную программную сборку, которая изначально представляла собой обычный Debian-репозиторий, объединяющий библиотеки CUDA, cuDNN, PyTorch и TensorFlow. Этот софт, получивший название Lambda Stack, полностью обнулил затраты стартапа на сторонние облака.

Разработчики обнаружили свободную нишу на рынке: клиенты могли приобрести серверное железо у Dell или HP, но сталкивались с трудностями при настройке программного окружения для машинного обучения. Основатель компании, исследователь в области ИИ Стивен Балабан (Stephen Balaban), принял решение переориентировать бизнес на инфраструктуру. Нынешний представитель компании пришел в команду пятым сотрудником, имея бэкграунд в химической инженерии и количественных финансах, и поначалу совмещал обязанности инженера, техподдержки, HR-специалиста и сейлз-менеджера. На начальном этапе Lambda Labs фокусировалась исключительно на обслуживании сверточных нейросетей, таких как ResNet.

В 2020–2021 годах руководство компании спрогнозировало, что специализированные под нужды ИИ вычислительные кластеры станут критически важной категорией на рынке. В то время традиционные гиперскейлеры находились на ранних стадиях развития ИИ-инфраструктуры, и, как отмечает спикер, никто, кроме OpenAI, еще не предвидел грядущего триумфа больших языковых моделей. Обладая опытом сборки серверных кластеров, Lambda Labs решила развернуть их в собственных дата-центрах и предоставить разработчикам удаленный доступ по модели AWS или GCP, но с глубокой оптимизацией сетевого стека под задачи глубокого обучения. Шесть лет назад компания сделала удачное маркетинговое приобретение, выкупив домен gpus.com, который теперь перенаправляет пользователей на официальный сайт.

## 💰 Почему специализированное облако дешевле гиперскейлеров
[[JUMP:10:29]]

Вопрос о причинах более низкой стоимости услуг Lambda Labs по сравнению с технологическими гигантами регулярно возникает у инвесторов и клиентов. Представитель компании подчеркивает, что здесь нет «волшебной палочки» или скрытых скидок от поставщиков оборудования. Экономическое преимущество складывается из трех ключевых факторов:

1.  Философия ценообразования. До появления специализированных ИИ-облаков ценообразование на рынке GPU оставалось непрозрачным. Спикер указывает, что даже сейчас официальные тарифы на процессоры Nvidia Hopper на сайтах крупных провайдеров могут составлять $5, $6 или $8 за час, хотя реальные контракты заключаются на иных условиях. Lambda Labs изначально предложила рынку прямые и прозрачные тарифы с фиксированной маржой.
2.  Технологический фокус. Традиционные облачные гиганты вынуждены поддерживать тысячи разнообразных микросервисов и обеспечивать их интеграцию между всеми регионами присутствия. При развертывании кластера GPU они закладывают в стоимость огромную сопутствующую инфраструктуру. Lambda Labs оптимизирует дата-центры только под задачи глубокого обучения. В результате, получая новые GPU, компания выводит их на рынок значительно быстрее конкурентов, не тратя ресурсы на лишнюю операционную обвязку.
3.  Статус частной компании. Почти все крупнейшие гиперскейлеры являются публичными корпорациями, жестко привязанными к ожиданиям Уолл-стрит по операционной марже и темпам роста. Lambda Labs остается частным бизнесом, что позволяет руководству сознательно соглашаться на меньшую маржинальность ради ускоренного захвата рынка.

## ⛓️ Дефицит чипов и особенности цепочки поставок Nvidia
[[JUMP:14:30]]

Последние два года ИИ-индустрия существует в условиях, когда кривая спроса на вычислительные мощности стабильно превышает возможности предложения. Скорость масштабирования Lambda Labs сдерживается не отсутствием клиентов, а коммерческими факторами: доступным капиталом для закупки чипов, наличием свободных площадей и электрической мощности в дата-центрах, а также квотами со стороны Nvidia.

Взаимодействие с клиентами в Lambda Labs выстроено по двум направлениям:

* Резервные контракты: клиенты подписывают обязательства на аренду мощностей сроком на один, два или три года. В этом сегменте продажи идут с опережением — заказчики запрашивают кластеры на 1000 или 5000 GPU, а компания разворачивает их в течение примерно трех месяцев.
* Доступ по требованию (On-Demand): компания намеренно выделяет фиксированный процент поступающих видеокарт для спотового рынка, чтобы разработчики могли мгновенно запускать и останавливать одиночные процессоры. По факту, эти мощности утилизируются практически на 100% в течение нескольких дней или недель после запуска.

Спикер опровергает циркулирующие в медиа слухи о наличии «фаворитизма» в распределении чипов Nvidia. По его словам, руководство Nvidia выстроило демократичную партнерскую экосистему и придерживается классического принципа цепочки поставок «первым пришел — первым обслужен» (FIFO). Хотя Nvidia теоретически могла бы отгружать абсолютно все процессоры корпорации Microsoft, квоты распределяются пропорционально размещенным заказам. Ключ к получению дефицитного оборудования кроется в долгосрочном планировании: Lambda Labs размещает заказы и оплачивает соответствующие инвойсы за 6–9 месяцев до фактической даты поставки.

На текущий момент ситуация с доступностью поколения Hopper (модели H100 и H200) стабилизировалась благодаря наращиванию объемов производства самой Nvidia. Однако для следующей архитектуры — Blackwell — дефицитный цикл повторяется заново. Заказы на Blackwell были размещены Lambda Labs и гиперскейлерами за 6–12 месяцев до сегодняшнего дня, а первые поставки ожидаются в конце текущего года или начале следующего. По оценке спикера, любой новый облачный стартап, решивший заказать чипы Blackwell сегодня, столкнется с периодом ожидания в 8–9 месяцев.

## 🔄 Смена парадигмы: от обучения к инференсу
[[JUMP:19:54]]

Структура рабочих нагрузок в ИИ-облаках претерпевает серьезные изменения. Около года назад основная доля инфраструктурных бюджетов в сфере глубокого обучения приходилась на этап тренировки и тонкой настройки (fine-tuning) моделей. Этому способствовал расцвет качественных open-source решений, требовавших объединения огромных массивов GPU в единую сеть.

Современные флагманские процессоры Nvidia лишены узкой специализации. Архитектуры Hopper и Blackwell одинаково эффективны как для ресурсоемкого обучения, так и для инференса (работы уже обученных моделей в приложениях). Спикер отмечает, что географическая удаленность сервера при инференсе пока не является критическим барьером для пользователя: сетевая задержка между Нью-Йорком и Сан-Франциско измеряется миллисекундами, тогда как само вычисление ответа крупной моделью занимает секунды.

Согласно внутренним опросам и анализу Lambda Labs, в настоящее время инференс обогнал обучение по объему закупки новых GPU и операционных затрат клиентов. Фундаментальные модели постепенно становятся базисом, вокруг которого компании выстраивают коммерческие приложения, генерирующие постоянный поток запросов. Тем не менее, представитель компании прогнозирует, что после массового запуска чипов Blackwell пропорция может временно качнуться обратно в сторону обучения, так как исследователи поспешат использовать новые мощности для создания моделей следующего поколения.

На рынке инференса активизировались разработчики альтернативных чипов-ускорителей (ASIC), такие как Cerebras (под руководством Эндрю Фельдмана), SambaNova (под руководством Родриго Лянга) и Groq. Они конкурируют с Nvidia по показателю пропускной способности (количеству генерируемых токенов в секунду). Однако Lambda Labs осознанно отказывается от закупки альтернативных процессоров, сохраняя фокус исключительно на картах Nvidia, которые занимают более 90% рынка вычислительных мощностей ИИ.

Спикер объясняет эту позицию жесткой стратегией распределения капитала:

* Альтернативные ускорители остаются нишевыми продуктами, вокруг которых еще не сформировался массовый экономический спрос.
* Обладая ограниченным бюджетом, Lambda Labs инвестирует исключительно в активы с гарантированной доходностью.
* Видеокарты Nvidia являются универсальным стандартом — весь существующий софт и ИИ-приложения в мире изначально оптимизируются под экосистему CUDA. Руководство компании намерено следить за опытом внедрения ASIC другими игроками, прежде чем принимать решение о диверсификации поставок.

## 🗺️ География клиентов и геополитические барьеры
[[JUMP:28:30]]

Основная доля выручки Lambda Labs, как и большинства других американских облачных провайдеров, формируется за счет клиентов из США. При этом в сегменте обучения моделей присутствует международный элемент: стартапы из Европы и Азии нередко арендуют американские сервера, и наоборот — американские исследователи задействуют зарубежные площадки компании. В сфере инференса инфраструктура Lambda Labs сильнее привязана к США, охватывая ключевые узлы на Западном и Восточном побережьях (включая Вирджинию), а также площадки в Чикаго, Техасе, Солт-Лейк-Сити и Атланте. За пределами США компания официально развивает инфраструктуру в Южной Корее.

Фактор сетевой задержки (latency) приобретает критическое значение по мере уменьшения размеров ИИ-моделей (до 3–8 миллиардов параметров) и развития автономных агентов. Когда ИИ-модели начнут взаимодействовать друг с другом в рамках многоступенчатых цепочек (agentic workflows), скорость передачи данных станет определяющей. Сегодня Lambda Labs применяет динамическую балансировку нагрузки: если дата-центр на Западном побережье перегружен, запросы пользователя из Сан-Франциско автоматически перенаправляются в Атланту.

Особое место в дискуссии занимает вопрос регуляторных ограничений. В соответствии с законодательством США, Lambda Labs обязана блокировать доступ к своим облачным мощностям по IP-адресам для всех санкционных государств, включая Китай и Россию. В то же время разработчики из Великобритании, других европейских, азиатских или африканских стран могут свободно арендовать GPU в облаке компании. Спикер упоминает, что дефицит чипов сильно бьет по развивающимся ИИ-сообществам (например, в Армении), в то время как сама Nvidia пытается сгладить эти дисбалансы, стимулируя создание так называемых «суверенных облаков» внутри отдельных государства (включая Францию и Индию).

Что касается влияния технологических санкций на темпы развития ИИ в Китае, то здесь представитель Lambda Labs высказывает личное мнение, подчеркивая, что не является экспертом в геополитике. На основе открытых технических данных он считает, что жесткие ограничения не привели к критическому отставанию КНР. В качестве аргументов приводятся следующие факты:

* Компания Tencent выпустила open-source модель на базе архитектуры Mixture of Experts (MoE), которая, согласно бенчмаркам, превосходит американскую модель Llama 3 405B от Meta.
* Китайские разработчики (например, создатели нейросети Kling от Kuaishou) демонстрируют передовые закрытые и открытые модели генерации видео, способные на равных конкурировать с американскими продуктами от Runway и Pika.
* В Китае активно развивается практика публикации моделей в открытый доступ (семейства Qwen, модели Tencent), что позволяет обходить многие инфраструктурные барьеры.

По мнению спикера, отсутствие у китайских компаний аналогов рассуждающей модели OpenAI o1 обусловлено лишь фактором времени, поскольку это совершенно новое исследовательское направление. Сам факт создания высококонкурентных моделей в условиях ограничений указывает либо на высочайший уровень китайской инженерной мысли, сумевшей выжать максимум из накопленных запасов GPU, либо на то, что американские санкции не работают в полной мере.

## 📈 Масштабы бизнеса и будущее ИИ-инфраструктуры
[[JUMP:39:36]]

На сегодняшний день под управлением Lambda Labs находится двузначное число дата-центров. Исторически компания начинала с небольших площадок мощностью 3, 5 или 10 мегаватт, однако новые строящиеся объекты рассчитаны на 30, 50 и в перспективе 100 мегаватт. Общий парк оборудования компании насчитывает несколько десятков тысяч графических процессоров Nvidia. По меркам ИИ-индустрии это средний масштаб: для сравнения, технологические гиганты Meta или xAI Илона Маска, не являясь классическими облачными провайдерами, оперируют собственными кластерами в сотни тысяч GPU. Ближайшая цель Lambda Labs — довести объем управляемых процессоров до шестизначного показателя (более 100 000 единиц) в течение следующих года-двух.

Годовые темпы роста бизнеса Lambda Labs превышают 100–150%. Руководство компании категорически не согласно со звучащими на рынке прогнозами о скором выходе на плато спроса на вычислительные мощности. По мнению представителя компании, появление рассуждающих моделей, мультимодальных архитектур, генераторов видео и робототехники сформирует экспоненциальный спрос на compute, а кривая потребностей станет еще круче. Единственным фактором, способным вызвать временную стагнацию («воздушный карман»), может стать время, необходимое индустрии для коммерческого освоения новых ИИ-архитектур.

В отношении физической инфраструктуры Lambda Labs придерживается четкой бизнес-модели: компания не выкупает землю и не строит здания дата-центров самостоятельно. Вместо этого они заключают соглашения долгосрочной аренды с профессиональными операторами цифровой недвижимости, концентрируясь исключительно на развертывании ИИ-серверов и развитии программного слоя Lambda Stack.

В будущем архитектура вычислений разделится по топологическому принципу:

* «Задачи малого мозга» будут полностью решаться на конечных устройствах пользователей (смартфонах, ноутбуках, умных очках).
* «Задачи среднего и большого мозга» потребуют мощных централизованных облаков либо локальных домашних вычислительных узлов, способных управлять, к примеру, бытовыми роботами-гуманоидами.

Параллельно ИИ-индустрия движется к созданию гигантских централизованных дата-центров мощностью 400 мегаватт, полгигаватта и даже несколько гигаватт, требующих для своего энергообеспечения прямого подключения к атомным электростанциям или масштабным массивам солнечных батарей. Энергопотребление одного такого объекта сопоставимо с расходом электроэнергии крупного мегаполиса уровня Нью-Йорка. Спикер убежден, что данный тренд неоспорим, поскольку закон масштабирования (scaling law) остается главным драйвером прогресса в сфере создания передового искусственного интеллекта.