Почему будущее искусственного интеллекта зависит от децентрализованных облаков

Eye on AI 725 59 мин 5 мин 17.03.2025
Главное

Будущее искусственного интеллекта (ИИ) сталкивается с двумя критическими барьерами: нехваткой данных для обучения и дефицитом электроэнергии. В то время как проблемы с данными решаются с помощью синтетической генерации, энергетический кризис требует радикального пересмотра инфраструктуры — перехода от централизованных систем к децентрализованным облачным платформам.

В подкасте «Eye on AI» Крейг Смит беседует с Грегом Ури, основателем Overclock Labs и создателем сети Akash Network, чтобы обсудить, как децентрализация вычислений меняет рынок систем обучения ИИ и делает технологии доступными вне зависимости от монополии гиперскейлеров вроде Amazon или Google.

🏗️ Происхождение Akash: от Kubernetes до «супероблака» 2:39

Грег Ури, программист с 15-летним стажем в сфере Open Source, внес значительный вклад в создание экосистемы Kubernetes и Docker . Его новый проект, Akash Network (название происходит от санскритского «Акаша» — небо), задумывался как ответ на закрытость и непрозрачность современных облачных технологий .

Основой для проекта послужила концепция «супероблака», предложенная исследователями из Корнеллского университета в 2015 году . Суть идеи заключается в разделении уровней:

Akash децентрализует уровень управления, передавая его сообществу, работающему на консенсусе, и позволяет любому владельцу вычислительных мощностей стать провайдером на открытом рынке . По словам Ури, сегодня это самое быстрорастущее облако, обеспечивающее экономию до 10 раз на обычных вычислениях и в 2–3 раза на графических процессорах (GPU) по сравнению с Amazon Web Services (AWS) .

📉 Проблема неиспользованных мощностей 6:36

В мире насчитывается около 7,2 миллиона дата-центров, из которых 11 000 являются профессиональными (с мощностью более 1 МВт) . Среди них около тысячи принадлежат гиперскейлерам, а остальные 10 000 — корпоративным владельцам .

По данным Ури, коэффициент использования ресурсов в корпоративных дата-центрах составляет всего около 15% . Это создает колоссальный избыток мощностей, которые простаивают, пока компании не занимаются активным обучением моделей. Даже чипы предыдущих поколений, такие как NVIDIA H100, остаются высокоэффективными, но часто оказываются «за бортом» из-за выхода новых линеек вроде H200 .

Akash работает как «обратный аукцион»:

  1. Арендатор (Tenant) выставляет заказ в открытую книгу ордеров, указывая нужную конфигурацию и цену (например, $2 в час за H200) .
  2. Провайдеры делают ставки, пытаясь выполнить этот заказ.
  3. Блокчейн выступает механизмом координации: он холдирует средства на эскроу-счете и распределяет их по мере выполнения работы .

Важно, что само выполнение вычислений происходит вне блокчейна (peer-to-peer). После заключения контракта арендатор и провайдер взаимодействуют напрямую, что гарантирует высокую производительность .

⚡ Энергетический тупик гиперскейлеров 17:33

Гиперскейлеры (Amazon, Google, Microsoft) сталкиваются с двумя главными ограничениями: нехваткой энергии и чистой воды для охлаждения . Ури отмечает, что построить новый дата-центр мощностью в несколько сотен мегаватт в США становится крайне сложно из-за регулирования и износа электросетей . На создание одного ядерного реактора уходит около 14 лет и $32 млрд — слишком долго для темпов развития ИИ .

Альтернативой Ури видит создание малых модульных дата-центров мощностью от 100 кВт до 1 МВт . Они могут:

🏠 Суверенный ИИ в каждом доме 22:18

Грег Ури считает, что будущее за «домашним» ИИ. Он приводит пример: если человек хочет иметь ИИ-агентов, которые следят за безопасностью детей в доме или записывают переговоры, эти данные не должны покидать домашнюю сеть из соображений приватности .

Согласно расчетам Akash, кластер из восьми чипов H200 (HGX cluster) стоит около полумиллиона долларов и потребляет около 30 кВт . Обычный человек не может себе этого позволить, но бизнес-модель децентрализованного облака позволяет:

Такие инвестиции, по мнению Ури, могут окупиться за 5 лет при 80% загрузке мощностей арендаторами.

🧬 Приватность и «доверенная среда» (TEE) 33:52

Одной из главных проблем облаков является риск утечки данных. В случае с ChatGPT даже инженеры OpenAI признают, что могут просматривать промпты пользователей . Akash предлагает два решения:

  1. Децентрализованный аудит: Сторонние аудиторы (например, Overclock Labs) проверяют дата-центры на соответствие стандартам (HIPAA и др.) и публикуют отчеты в блокчейне .
  2. Trusted Execution Environments (TEE): Использование аппаратного шифрования (например, в чипах NVIDIA H100/H200), где данные зашифрованы даже в оперативной памяти . Это снижает производительность на 10%, но делает невозможным чтение данных даже для владельца физического сервера .

🚀 Бизнес-модель и устойчивость Open Source 45:57

Ури критикует текущую ситуацию с открытым ПО. Проекты вроде Docker или Kubernetes используются всеми, но их создатели часто не имеют устойчивой бизнес-модели .

Akash планирует перейти от «рынка ресурсов» к «рынку сервисов» в 2025 году . Это позволит разработчикам Open Source развертывать свои решения (базы данных, модели) на платформе и получать часть дохода . Цель — поднять выручку на один GPU с нынешних $20 до $50–100 в день за счет добавления платных премиум-сервисов поверх «железа» .

🔍 Будущее распределенного обучения 55:10

По прогнозам Грега Ури, через два года централизованные вычисления достигнут своего потолка . Он призывает ИИ-сообщество серьезно отнестись к распределенному обучению моделей (Decentralized Distributed Training). В качестве примеров успешных исследований в этой области он называет:

Ури подчеркивает: чтобы действительно составить конкуренцию гигантам вроде OpenAI, необходимо децентрализовать не только софт, но и саму энергетическую и вычислительную базу . Платформа Akash уже сегодня предлагает аренду чипов H100 по цене около $1,20 за час, что значительно дешевле предложений гиперскейлеров, если удастся найти свободные мощности в условиях их дефицита .

💬 Цитаты

«Акаша на санскрите означает небо — именно там формируются облака.»

«Если вы хотите по-настоящему разрушить монополию OpenAI, вам нужно думать о децентрализации.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Гиперскейлеры
Крупнейшие провайдеры облачных услуг, такие как AWS, Microsoft Azure и Google Cloud.
HGX Cluster
Высокопроизводительная серверная архитектура от NVIDIA, объединяющая 8 GPU через NVLink.
TEE (Trusted Execution Environment)
Защищенная область процессора, гарантирующая конфиденциальность и целостность кода и данных.
📊 Цифры
🗓 Хронология
  1. 2015 Корнеллский университет опубликовал शोध о концепции 'супероблака'.
  2. 2017 Пик количества независимых дата-центров в мире (8,6 млн), после чего началось поглощение рынком облаков.
  3. 2020 Запуск сети Akash Network.
  4. 2025 Планируемый запуск сервисной экономики (Services Economy) в Akash.
⚖️ Другая сторона
Искусственный интеллект Akash Network NVIDIA H100 Грег Ури Open Source Kubernetes