# Эпоха фабрик данных: как CEO Labelbox строит конвейер для обучения AGI с экспертами на $250k в год

Источник: https://www.youtube.com/watch?v=Kr3vNRHE-Fo
Канал: The Cognitive Revolution
Опубликовано: 08.07.2025

---

В современной гонке за создание сильного искусственного интеллекта (AGI) фокус сместился с простого сбора данных из интернета на создание высокоспециализированных сред обучения. Генеральный директор Labelbox Ману Шарма в подкасте The Cognitive Revolution описывает текущее состояние индустрии как «эпоху фабрик данных», где ежегодные бюджеты ведущих лабораторий на пост-обучение (post-training) превышают миллиард долларов.

## 🌪️ Хаос и реорганизация в индустрии данных
[[JUMP:00:00]]

Индустрия ИИ переживает период значительной трансформации, вызванный недавними крупными сделками, такими как соглашение Meta с Scale AI на сумму 15 миллиардов долларов [00:14]. Переход ключевых фигур, включая бывшего CEO Scale Алекса Ванга в Meta для руководства командой супер-интеллекта, создал волну неопределенности и новых возможностей в секторе [03:53]. По словам Ману Шармы, сейчас мир наблюдает «максимальную скорость инноваций в день», которую когда-либо видело человечество [04:31].

Ману Шарма выделяет три столпа, необходимых для создания фронтирных моделей:

*   Вычислительные мощности (Compute): огромные капитальные вложения в инфраструктуру [05:25].
*   Талант: исследователи, знающие архитектуры нейронных сетей [05:25].
*   Данные: переход к режиму, где основной упор делается на пост-обучение [05:40].

Если на этапе предварительного обучения (pre-training) модель поглощает паттерны из всего интернета, то пост-обучение превращает «базовую модель» в полезного помощника [06:06]. Ману Шарма утверждает, что каждая западная фронтирная лаборатория ИИ сейчас тратит более 1 миллиарда долларов в год исключительно на данные для пост-обучения [01:04].

## 🧬 Эволюция пост-обучения: от разметки к «гимназиям»
[[JUMP:07:14]]

Подходы к созданию данных прошли несколько ключевых этапов развития:

1.  **Supervised Learning (SFT):** Люди размечали изображения и видео, заставляя модели подражать человеческим тегам [07:27].
2.  **RLHF (Reinforcement Learning from Human Feedback):** Специализированные наборы данных для обучения моделей взаимодействию с работниками интеллектуального труда [08:06].
3.  **RL из верифицируемых вознаграждений:** Текущая парадигма, в которой модели развивают навыки в специализированных средах [08:32].

Ману Шарма называет эти среды «тренажерными залами» (Gyms), где модели обучаются методом проб, ошибок и автоматизированной обратной связи [01:30]. Наиболее активно этот метод применяется в программировании (coding) и математике, так как результат там легко верифицировать — работает код или нет, правильный ли численный ответ [18:38].

По мнению гостя, рассуждение (reasoning) теперь рассматривается как «эмерджентное свойство», возникающее в процессе обучения с подкреплением (RL), а не просто результат прямого подражания человеческим цепочкам мыслей [31:12].

## 🧑‍я Кадры нового поколения: AI-тренеры с зарплатой в $250 000
[[JUMP:10:45]]

Современный рынок данных отошел от концепции «цифровых потогонных цехов» с низкоквалифицированным трудом. Сегодня Labelbox работает с сетью экспертов из 70 стран, включая физиков, математиков и программистов олимпийского уровня [1:10:10].

Ключевые факты о рынке труда AI-тренеров:

*   **Доходы:** Топ-контрибьюторы на платформе Labelbox зарабатывают более 250 000 долларов в год [02:50].
*   **Сложность задач:** Эксперты не просто ставят галочки, а создают среды обучения, пишут верификаторы и решают задачи с «длинным горизонтом» [1:10:47].
*   **Отбор:** Labelbox проводит более 2 000 интервью в день с помощью собственной ИИ-системы Zara [02:50].

Ману Шарма отмечает, что ИИ-интервьюер Zara имеет средний рейтинг удовлетворенности 4.6–4.7 из 5 [1:30:03]. Кандидатам нравится, что система проявляет бесконечное терпение и способна обсуждать нюансы их докторских диссертаций на уровне, недоступном обычному рекрутеру [1:30:29]. Однако наблюдается и «человеческая изобретательность» в попытках обмана: кандидаты иногда используют продвинутый голосовой режим ChatGPT, чтобы два ИИ разговаривали друг с другом во время интервью [1:31:23].

## 🛠️ Тонкая настройка (Fine-tuning) против контекстной инженерии
[[JUMP:46:11]]

В корпоративном секторе Ману Шарма наблюдает отказ от традиционного fine-tuning (дообучения весов модели) в пользу «контекстной инженерии» (context engineering) [49:02]. 

Аргументы в пользу контекстной инженерии (RAG и промпт-инжиниринг):

*   **Эффективность:** Базовые модели (например, Gemini или Claude) уже обладают мощными способностями к рассуждению, которые превосходят узкоспециализированные модели [48:10].
*   **Динамичность:** Fine-tuning «замораживает» инвестиции в конкретную версию модели, тогда как контекстная инженерия позволяет легко переключаться на новые, более мощные базовые модели, выходящие каждые несколько недель [1:02:10].
*   **Стоимость:** Дообучение часто используется только для оптимизации затрат (дистилляция знаний из большой модели в маленькую) или когда требуются уникальные суждения, отсутствующие в базе [52:48].

Ману Шарма приводит пример: модель Gemini 1.5 Pro по многим медицинским тестам превосходит Med-PaLM 2 — модель, специально обученную только на медицинских данных [47:57]. Это доказывает, что общие способности к рассуждению критически важны даже в узких профессиональных областях.

## 🌍 Суверенный ИИ и глобальные перспективы
[[JUMP:1:13:35]]

Обсуждая вопрос «суверенного ИИ» для таких стран, как Бразилия или Индия, Ману Шарма советует правительствам не инвестировать в технологии ради технологий, а идти от обратного — от конкретных целей и клиентского опыта [1:18:50].

Его рекомендации для государств:

1.  Определить высокоценные сценарии использования (налоги, здравоохранение, государственные услуги) [1:23:09].
2.  Использовать частные фронтирные или открытые модели как базу [1:23:50].
3.  Инвестировать в сбор уникальных национальных данных (язык, культурные особенности, локальное законодательство), чтобы адаптировать эти модели под нужды граждан [1:24:03].

Ману Шарма приводит аналогию из своего опыта в Planet Labs: Бразилии не обязательно запускать собственные спутники, чтобы следить за вырубкой лесов — достаточно покупать данные и инсайты у компаний, которые уже сканируют всю Землю ежедневно [1:21:39]. Аналогично, странам стоит сосредоточиться на слое приложений и данных, а не на попытке перегнать OpenAI в вычислительных мощностях.

## 🔮 Будущее: Плато или Взлет?
[[JUMP:1:36:53]]

На вопрос о том, ждет ли нас плато в развитии ИИ или стремительный взлет (fast takeoff), Ману Шарма отвечает, что мы уже находимся в фазе ускорения [1:38:30]. Однако ключевым фактором дальнейшего прогресса станет передача моделям концепции «качества» и «вкуса» [1:40:42].

Ссылаясь на книгу «Дзен и искусство ухода за мотоциклом», Шарма подчеркивает, что люди часто узнают качество, когда видят его, но не могут его формализовать [1:39:51]. Задача Labelbox и всей индустрии данных на ближайшие годы — найти способы передать это интуитивное человеческое понимание превосходства алгоритмам, что станет ключом к созданию по-настоящему надежных и полезных ИИ-агентов [1:40:42].

---
**Инвестиционные метрики и факты:**

*   **Labelbox:** Последний раунд финансирования составил $110 млн (начало 2022 года) [02:37].
*   **Сделка Meta/Scale AI:** Оценивается в $15 млрд [00:14].
*   **Расходы на данные:** Фронтирные лаборатории тратят >$1 млрд в год каждая [01:04].
*   **Операционные показатели:** Labelbox проводит >2000 ИИ-интервью в сутки [02:50].