Основатель Scale AI Александр Ванг о будущем данных, геополитике ИИ и уроках Amazon

The Logan Bartlett Show 386 тыс. 1 ч 31 мин 6 мин 03.11.2023
Главное

В новом выпуске The Logan Bartlett Show гостем стал Александр Ванг (Alexandr Wang), сооснователь и генеральный директор Scale AI — компании, ставшей «фундаментом» для обучения современных нейросетей. В свои 26 лет Александр является самым молодым self-made миллиардером в мире, а его стартап оценивается в $7 млрд, обеспечивая данными таких гигантов, как OpenAI, Meta и Министерство обороны США.

🛢️ Почему данные — это не «новая нефть», а «новый код» 1:00

Александр Ванг категорически не согласен с популярным в прошлом десятилетии тезисом о том, что данные — это новая нефть. По его мнению, хотя данные и стали основным рычагом экономического влияния, они не являются сырьевым товаром (commodity) в привычном смысле .

В отличие от нефти, которая в основе своей однородна, данные обладают «множественностью»: информация для написания кода, юридические тексты или разговорная речь качественно отличаются друг от друга . Ванг считает, что стратегическое преимущество дает не просто владение «скважинами» с данными, а умение грамотно сшивать различные источники информации.

Ключевой тезис Александра — «данные — это новый код» :

🏎️ От беспилотников к «нефтеперерабатывающему заводу» для ИИ 5:03

Первым крупным рынком для Scale AI стали автономные транспортные средства (AV). В 2016–2017 годах индустрия столкнулась с проблемой: машины собирали петабайты видео и данных с лидаров, но алгоритмы не понимали, где на картинке человек, а где — дорожный конус .

Александр Ванг выделяет три столпа, необходимых для создания ИИ, и объясняет роль своей компании:

  1. Вычислительные мощности (Compute): GPU и чипы, где индустрия почти полностью полагается на Nvidia .
  2. Таланты (Talent): Инженеры, чей наём обходится компаниям в миллионы долларов .
  3. Данные (Data): Инфраструктурный слой, который закрывает Scale AI.

Ванг использует аналогию: если данные — это нефть, то Scale AI — это нефтеперерабатывающий завод (refinery) . Компания превращает «сырые» данные в размеченные (labeled data), на которых модель может учиться. По мнению гостя, такие задачи логично отдавать на аутсорс специализированным игрокам, как это произошло с платежами (Stripe) или облачными вычислениями (AWS), из-за эффекта масштаба .

🧠 RLHF и потенциал закрытых данных корпораций 10:49

Современные языковые модели (LLM) обучаются не просто на текстах из интернета, а с помощью методики RLHF (Reinforcement Learning from Human Feedback — обучение с подкреплением на основе отзывов людей) .

Александр Ванг утверждает:

Гость подчеркивает, что 99,9% мировых данных — это не публичный интернет, а частная корпоративная переписка, меморандумы и письма . Будущее корпоративного ИИ он видит в использовании платформы EGP (Enterprise Generative AI Platform), которая позволяет компаниям дообучать базовые модели (GPT-3.5, Llama 2) на своих уникальных данных, создавая защищенные и специализированные инструменты .

⚔️ Геополитика и аналогия с атомной бомбой 22:32

Александр Ванг убежден, что следующие 2–3 года определят развитие мира на десятилетия вперед . Он рассматривает ИИ как фактор «жесткой силы» (hard power), сравнимый по значимости с ядерным оружием.

Сходства и различия с атомным проектом по версии Ванга:

Ванг выражает серьезную обеспокоенность тем, что Китай осознает важность ИИ как инструмента для «прыжка через голову» (leapfrog) традиционных вооружений США . По его данным, Народно-освободительная армия Китая (НОАК) тратит от 1% до 2% своего бюджета на ИИ-технологии, в то время как Министерство обороны США (DoD) — лишь от 0,1% до 0,2% . По мнению Александра, если военные возможности Китая сравняются с американскими, мир станет крайне нестабильным из-за роста энтропии в системе .

☣️ Три категории рисков искусственного интеллекта 28:48

Александр Ванг классифицирует угрозы ИИ по трем корзинам:

  1. Экзистенциальный риск (AI qua AI): ИИ сам по себе становится угрозой человечеству. В эту категорию Ванг верит меньше всего .
  2. Злоупотребление (Misuse): Использование ИИ авторитарными режимами или террористами для биоатак, кибервойн или информационных диверсий. Это самый реальный и пугающий риск .
  3. Социальная нестабильность: Массовое замещение рабочих мест и рост популизма в развитых странах .

Особую опасность Ванг видит в ИИ-компаньонах (вроде Character AI), если они управляются враждебными государствами. По его словам, это может стать самой эффективной спецслужбой в истории, имеющей прямой доступ к душам граждан других стран .

🏗️ Уроки Amazon и культура «технологического прагматизма» 1:00:25

В управлении Scale AI Александр ориентируется на принципы Amazon, особенно на идеи Джеффа Вилки (Jeff Wilkey), бывшего CEO потребительского подразделения Amazon и ментора Ванга .

Ключевые принципы, заимствованные у Amazon:

🧪 Как нанимать людей, которым «не всё равно» 1:10:41

Александр Ванг ищет в сотрудниках прежде всего внутренний локус контроля (Internal Locus of Control) — убеждение, что события в жизни являются результатом собственных действий, а не внешних обстоятельств .

Его любимый вопрос на интервью: «Над чем вы работали упорнее всего в жизни?» . Ответ позволяет оценить степень одержимости кандидата и его внимание к деталям.

Четыре главных качества сотрудника Scale AI:

  1. Внутренний локус контроля.
  2. Умение творчески решать задачи (Problem solving).
  3. «Впечатляемость» — сотрудники должны постоянно задирать планку друг для друга .
  4. Коллаборативность (умение работать в команде без токсичности) .

Ванг критикует культуру найма в Кремниевой долине, ориентированную на бренды . По его словам, работа в Big Tech часто негативно отбирает людей, которые ценят статус выше влияния (impact). В Scale AI он, напротив, ценит «странных» людей (weird people), так как статистически невозможно достичь выдающихся результатов, находясь в центре колокола нормального распределения .

🎻 Влияние Los Alamos и скрипки на лидерство 1:22:28

Александр вырос в Лос-Аламосе в семье физиков, что привило ему «необъяснимую страсть» к науке . Однако именно занятия на скрипке он считает важнейшим фактором своего развития.

Математика и физика всегда дают четкие правильные ответы, но музыка научила его работать в «серой зоне» :

В завершение беседы Александр выразил оптимизм по поводу будущего, назвав ИИ «паровым двигателем, умноженным на миллион» . Особые надежды он возлагает на медицину: ИИ-врач в кармане каждого человека позволит перейти от реактивного лечения к проактивному, что радикально увеличит продолжительность жизни человечества .

💬 Цитаты

«Если данные — это новая нефть, то Scale AI — это нефтеперерабатывающий завод.»

Александр Ванг 07:25

«Каждый из нас может быть кинокритиком, но почти никто не может снять фильм. ИИ учится так же — на обратной связи экспертов.»

Александр Ванг 13:02

«Если ваша рекрутинговая организация похожа на приемную комиссию колледжа — вам стоит начать бояться.»

Александр Ванг 1:14:25
👥 Спикеры
📚 Упомянутые книги
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
RLHF
Метод обучения ИИ через обратную связь от людей-экспертов.
Locus of Control
Психологическое понятие, отражающее склонность человека приписывать свои успехи или неудачи внутренним либо внешним факторам.
Leapfrog
Стратегия 'прыжка через голову', когда страна или компания перепрыгивает промежуточные стадии развития технологий.
📊 Цифры
🗓 Хронология
  1. 2016 Александр Ванг основывает Scale AI после ухода из MIT.
  2. 2019 Начало совместной работы Scale AI и OpenAI над экспериментами с RLHF.
  3. 2023 Участие в саммите по безопасности ИИ в Великобритании и работа с Белым домом над оценкой моделей.
⚖️ Другая сторона
Стартапы и бизнес Scale AI Alexandr Wang RLHF Nvidia Geopolitics