Будущее искусственного интеллекта (ИИ) сталкивается с двумя критическими барьерами: нехваткой данных для обучения и дефицитом электроэнергии. В то время как проблемы с данными решаются с помощью синтетической генерации, энергетический кризис требует радикального пересмотра инфраструктуры — перехода от централизованных систем к децентрализованным облачным платформам.
В подкасте «Eye on AI» Крейг Смит беседует с Грегом Ури, основателем Overclock Labs и создателем сети Akash Network, чтобы обсудить, как децентрализация вычислений меняет рынок систем обучения ИИ и делает технологии доступными вне зависимости от монополии гиперскейлеров вроде Amazon или Google.
🏗️ Происхождение Akash: от Kubernetes до «супероблака» 2:39
Грег Ури, программист с 15-летним стажем в сфере Open Source, внес значительный вклад в создание экосистемы Kubernetes и Docker . Его новый проект, Akash Network (название происходит от санскритского «Акаша» — небо), задумывался как ответ на закрытость и непрозрачность современных облачных технологий .
Основой для проекта послужила концепция «супероблака», предложенная исследователями из Корнеллского университета в 2015 году . Суть идеи заключается в разделении уровней:
- Уровень ресурсов (Resource Layer): Слой, где физически находятся вычислительные мощности.
- Уровень управления (Control Plane): Слой, который распределяет задачи и следит за исполнением.
Akash децентрализует уровень управления, передавая его сообществу, работающему на консенсусе, и позволяет любому владельцу вычислительных мощностей стать провайдером на открытом рынке . По словам Ури, сегодня это самое быстрорастущее облако, обеспечивающее экономию до 10 раз на обычных вычислениях и в 2–3 раза на графических процессорах (GPU) по сравнению с Amazon Web Services (AWS) .
📉 Проблема неиспользованных мощностей 6:36
В мире насчитывается около 7,2 миллиона дата-центров, из которых 11 000 являются профессиональными (с мощностью более 1 МВт) . Среди них около тысячи принадлежат гиперскейлерам, а остальные 10 000 — корпоративным владельцам .
По данным Ури, коэффициент использования ресурсов в корпоративных дата-центрах составляет всего около 15% . Это создает колоссальный избыток мощностей, которые простаивают, пока компании не занимаются активным обучением моделей. Даже чипы предыдущих поколений, такие как NVIDIA H100, остаются высокоэффективными, но часто оказываются «за бортом» из-за выхода новых линеек вроде H200 .
Akash работает как «обратный аукцион»:
- Арендатор (Tenant) выставляет заказ в открытую книгу ордеров, указывая нужную конфигурацию и цену (например, $2 в час за H200) .
- Провайдеры делают ставки, пытаясь выполнить этот заказ.
- Блокчейн выступает механизмом координации: он холдирует средства на эскроу-счете и распределяет их по мере выполнения работы .
Важно, что само выполнение вычислений происходит вне блокчейна (peer-to-peer). После заключения контракта арендатор и провайдер взаимодействуют напрямую, что гарантирует высокую производительность .
⚡ Энергетический тупик гиперскейлеров 17:33
Гиперскейлеры (Amazon, Google, Microsoft) сталкиваются с двумя главными ограничениями: нехваткой энергии и чистой воды для охлаждения . Ури отмечает, что построить новый дата-центр мощностью в несколько сотен мегаватт в США становится крайне сложно из-за регулирования и износа электросетей . На создание одного ядерного реактора уходит около 14 лет и $32 млрд — слишком долго для темпов развития ИИ .
Альтернативой Ури видит создание малых модульных дата-центров мощностью от 100 кВт до 1 МВт . Они могут:
- Размещаться в офисах, университетах или даже частных домах.
- Питаться от возобновляемых источников (солнечная и ветровая энергия), дополненных аккумуляторами.
- Продавать излишки энергии обратно в сеть, компенсируя затраты на оборудование .
🏠 Суверенный ИИ в каждом доме 22:18
Грег Ури считает, что будущее за «домашним» ИИ. Он приводит пример: если человек хочет иметь ИИ-агентов, которые следят за безопасностью детей в доме или записывают переговоры, эти данные не должны покидать домашнюю сеть из соображений приватности .
Согласно расчетам Akash, кластер из восьми чипов H200 (HGX cluster) стоит около полумиллиона долларов и потребляет около 30 кВт . Обычный человек не может себе этого позволить, но бизнес-модель децентрализованного облака позволяет:
- Купить кластер из 40 чипов.
- Один кластер использовать для личных нужд (безопасность, приватность).
- Оставшиеся четыре сдавать в аренду через Akash .
Такие инвестиции, по мнению Ури, могут окупиться за 5 лет при 80% загрузке мощностей арендаторами.
🧬 Приватность и «доверенная среда» (TEE) 33:52
Одной из главных проблем облаков является риск утечки данных. В случае с ChatGPT даже инженеры OpenAI признают, что могут просматривать промпты пользователей . Akash предлагает два решения:
- Децентрализованный аудит: Сторонние аудиторы (например, Overclock Labs) проверяют дата-центры на соответствие стандартам (HIPAA и др.) и публикуют отчеты в блокчейне .
- Trusted Execution Environments (TEE): Использование аппаратного шифрования (например, в чипах NVIDIA H100/H200), где данные зашифрованы даже в оперативной памяти . Это снижает производительность на 10%, но делает невозможным чтение данных даже для владельца физического сервера .
🚀 Бизнес-модель и устойчивость Open Source 45:57
Ури критикует текущую ситуацию с открытым ПО. Проекты вроде Docker или Kubernetes используются всеми, но их создатели часто не имеют устойчивой бизнес-модели .
Akash планирует перейти от «рынка ресурсов» к «рынку сервисов» в 2025 году . Это позволит разработчикам Open Source развертывать свои решения (базы данных, модели) на платформе и получать часть дохода . Цель — поднять выручку на один GPU с нынешних $20 до $50–100 в день за счет добавления платных премиум-сервисов поверх «железа» .
🔍 Будущее распределенного обучения 55:10
По прогнозам Грега Ури, через два года централизованные вычисления достигнут своего потолка . Он призывает ИИ-сообщество серьезно отнестись к распределенному обучению моделей (Decentralized Distributed Training). В качестве примеров успешных исследований в этой области он называет:
- DDist от команды Nous Research.
- DiLo — работа от Google DeepMind.
Ури подчеркивает: чтобы действительно составить конкуренцию гигантам вроде OpenAI, необходимо децентрализовать не только софт, но и саму энергетическую и вычислительную базу . Платформа Akash уже сегодня предлагает аренду чипов H100 по цене около $1,20 за час, что значительно дешевле предложений гиперскейлеров, если удастся найти свободные мощности в условиях их дефицита .