Эдвин Чен из Surge: как построить компанию с выручкой $1 млрд без инвестиций и почему PhD не умеют кодить

20VC (Harry Stebbings) 75,9 тыс. 1 ч 7 мин 6 мин 21.07.2025
Главное

В мире Кремниевой долины, где успех принято измерять объемом привлеченных инвестиций и количеством сотрудников, Эдвин Чен (Edwin Chen) и его компания Surge выглядят аномалией. Основатель компании, достигшей выручки более 1 млрд долларов без единого цента внешнего финансирования, утверждает, что секрет кроется в экстремальной эффективности и фокусе на качестве данных, а не в раздувании штата.

📉 Проблема «бесполезных» сотрудников и культ 10% ресурсов 1:06

Основываясь на своем опыте работы в таких гигантах, как Google, Facebook и Twitter, Эдвин Чен пришел к выводу, что около 90% сотрудников в этих компаниях работают над «бесполезными» задачами . По его мнению, огромные корпорации тратят колоссальные ресурсы на поддержание собственной внутренней механики, которая никак не связана с созданием ценности для конечного пользователя.

Чен формулирует концепцию эффективности малых команд следующим образом:

Как утверждает гость, во многих крупных организациях приоритеты искажены: менеджеры стремятся расширять свои отделы до тысяч человек просто ради статуса («empire building»), чтобы хвастаться перед друзьями должностью вице-президента . В Surge вместо этого внедрена политика отказа от регулярных совещаний «один на один» (one-on-one). Чен считает их негативным сигналом: если вам нужна еженедельная встреча, чтобы узнать, чем занят ваш сотрудник, значит, вы не находитесь в курсе дел и не общаетесь с ним в рабочем процессе .

🛠 Surge против «боди-шопов»: почему разметка данных — это технология 10:07

Эдвин Чен проводит жесткую границу между Surge и конкурентами (такими как Scale AI), которых он называет «боди-шопами» (body shops) или «боди-шопами, маскирующимися под технологические компании» .

По его словам, фундаментальное отличие заключается в следующем:

  1. Отсутствие технологий у конкурентов: По мнению Чена, многие игроки в сфере разметки данных просто нанимают людей «с улицы» или по дипломам PhD и передают их ИИ-лабораториям, не имея инструментов для реального контроля качества .
  2. Алгоритмический подход Surge: Вместо простой передачи «теплых тел» заказчику, Surge строит платформу с использованием сложных алгоритмов для измерения и улучшения качества данных. Это включает в себя A/B-тестирование методов разметки и противодействие попыткам исполнителей обмануть систему с помощью того же ИИ .
  3. Адверсориальный характер работы: Эдвин Чен отмечает, что даже выпускники MIT часто пытаются «взломать» систему разметки, используя LLM для генерации ответов или продавая свои аккаунты. Без глубоких технологий фильтрации получить качественные данные для обучения современных моделей невозможно .

🚀 История основания: от Craigslist до миллиардной выручки 14:02

Идея Surge родилась из боли Чена как инженера по машинному обучению в Twitter. Ему нужно было обучить простой классификатор настроений (sentiment classifier), но существующая система сбора данных была катастрофически неэффективной: компания нанимала случайных людей через Craigslist, которые работали с таблицами .

Проблемы были очевидны:

В 2020 году, сразу после выхода GPT-3, Чен покинул Twitter и за две недели в одиночку собрал первую версию Surge (MVP) . Вместо того чтобы привлекать 20–30 млн долларов инвестиций, как принято в Долине, он сосредоточился на продукте и прямом общении с клиентами.

Эдвин Чен утверждает, что для 95% стартапов привлечение денег — это просто «игра статусов», которая мешает сфокусироваться на реальной проблеме . Surge стала прибыльной с первого месяца работы , что позволило Чену сохранить полный контроль над компанией и её ценностями.

💰 Отказ от продажи компании за $100 млрд и путь к AGI 31:45

Surge продемонстрировала взрывной рост, особенно после релиза ChatGPT, когда индустрия осознала критическую важность человеческой обратной связи (RLHF) . На данный момент компания достигла выручки в размере более 1 млрд долларов .

Несмотря на колоссальные цифры, Чен заявляет о своей принципиальной позиции:

🧠 Почему PhD не гарантирует качество данных 40:09

Обсуждая будущее данных, Эдвин Чен развенчивает миф о том, что для обучения умных моделей достаточно нанять людей с учеными степенями. Surge работает с профессорами Гарварда и докторантами Стэнфорда, но Чен подчеркивает, что «наличие PhD — это еще не всё» .

По его оценке, 80% докторов наук в области компьютерных наук пишут плохой код, потому что сильны только в математике, но не в практике . Для обучения моделей нового поколения требуются не просто академические знания, а «уличная смекалка» (street smarts) и творческий подход, чтобы находить уязвимости в LLM и обучать их решать реальные задачи, а не просто проходить тесты SAT .

📊 Критика бенчмарков: ИИ как «генератор кликбейта» 44:03

Эдвин Чен выражает скепсис по отношению к популярным рейтингам ИИ, таким как LMSYS Chatbot Arena. Он считает, что подобные лидерборды превратились в аналог кликбейта .

Аргументы Чена:

🧪 Тупик синтетических данных 50:01

Чен полагает, что роль синтетических данных (данных, созданных самим ИИ) сильно переоценена. Компании, которые весь прошлый год тренировали модели на синтетике, сейчас обнаруживают серьезные проблемы .

Главный риск использования синтетических данных, по словам гостя, — это «коллапс модели» (model collapse), когда ИИ начинает замыкаться на узком спектре похожих ответов, теряя разнообразие и способность к обобщению . Чен утверждает, что всего несколько тысяч примеров высококачественных данных, созданных людьми, могут быть ценнее, чем 10 миллионов синтетических образцов .

⏳ Прогнозы и будущее 58:53

В завершение беседы Эдвин Чен поделился своим видением сроков достижения технологических прорывов:

Чен также предсказывает появление нескольких независимых AGI-систем с разными «характерами» и специализациями, подобно тому, как в мире существуют разные выдающиеся поэты или математики . Он считает, что мы находимся лишь на 2–5% пути к истинному потенциалу ИИ .

💬 Цитаты

«Я определенно не продал бы компанию за 30 или даже 100 миллиардов долларов. У нас есть всё: прибыльность и контроль над своей судьбой.»

Эдвин Чен 37:20

«Большинство компаний в нашей сфере — это просто боди-шопы, маскирующиеся под технологические компании.»

Эдвин Чен 10:34

«Качество — это самое важное. Оно важнее всего остального. Мы внушаем это каждому сотруднику с первого дня.»

Эдвин Чен 30:02
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Body shop
Компания, которая занимается простой перепродажей человеческого труда без внедрения собственных технологий или добавленной стоимости.
RLHF
Reinforcement Learning from Human Feedback — метод обучения моделей ИИ с использованием оценок и правок, сделанных людьми.
AGI
Artificial General Intelligence — гипотетический ИИ, способный выполнять любую интеллектуальную задачу на уровне человека или выше.
Model Collapse
Деградация модели ИИ, возникающая при её обучении на данных, сгенерированных другими моделями, что ведет к потере вариативности.
📊 Цифры
🗓 Хронология
  1. 2020 Эдвин Чен покидает Twitter и основывает Surge сразу после выхода GPT-3.
  2. 2020 Surge становится прибыльной в первый же месяц после запуска.
  3. Ноябрь 2022 Выход ChatGPT создает «точку перегиба» и взрывной спрос на услуги Surge.
⚖️ Другая сторона
Стартапы и бизнес Edwin Chen Surge 20VC AGI Data Labeling