В мире Кремниевой долины, где успех принято измерять объемом привлеченных инвестиций и количеством сотрудников, Эдвин Чен (Edwin Chen) и его компания Surge выглядят аномалией. Основатель компании, достигшей выручки более 1 млрд долларов без единого цента внешнего финансирования, утверждает, что секрет кроется в экстремальной эффективности и фокусе на качестве данных, а не в раздувании штата.
📉 Проблема «бесполезных» сотрудников и культ 10% ресурсов 1:06
Основываясь на своем опыте работы в таких гигантах, как Google, Facebook и Twitter, Эдвин Чен пришел к выводу, что около 90% сотрудников в этих компаниях работают над «бесполезными» задачами . По его мнению, огромные корпорации тратят колоссальные ресурсы на поддержание собственной внутренней механики, которая никак не связана с созданием ценности для конечного пользователя.
Чен формулирует концепцию эффективности малых команд следующим образом:
- Команда, обладающая 10% ресурсов и штата типичной Big Tech компании, может двигаться в 10 раз быстрее и создавать продукт в 10 раз лучше .
- Отсутствие лишних людей избавляет от бесконечных интервью, бесполезных совещаний и отчетов ради отчетов .
- Высокая плотность талантов в небольшом коллективе позволяет идеям циркулировать быстрее, а коммуникациям оставаться прозрачными .
Как утверждает гость, во многих крупных организациях приоритеты искажены: менеджеры стремятся расширять свои отделы до тысяч человек просто ради статуса («empire building»), чтобы хвастаться перед друзьями должностью вице-президента . В Surge вместо этого внедрена политика отказа от регулярных совещаний «один на один» (one-on-one). Чен считает их негативным сигналом: если вам нужна еженедельная встреча, чтобы узнать, чем занят ваш сотрудник, значит, вы не находитесь в курсе дел и не общаетесь с ним в рабочем процессе .
🛠 Surge против «боди-шопов»: почему разметка данных — это технология 10:07
Эдвин Чен проводит жесткую границу между Surge и конкурентами (такими как Scale AI), которых он называет «боди-шопами» (body shops) или «боди-шопами, маскирующимися под технологические компании» .
По его словам, фундаментальное отличие заключается в следующем:
- Отсутствие технологий у конкурентов: По мнению Чена, многие игроки в сфере разметки данных просто нанимают людей «с улицы» или по дипломам PhD и передают их ИИ-лабораториям, не имея инструментов для реального контроля качества .
- Алгоритмический подход Surge: Вместо простой передачи «теплых тел» заказчику, Surge строит платформу с использованием сложных алгоритмов для измерения и улучшения качества данных. Это включает в себя A/B-тестирование методов разметки и противодействие попыткам исполнителей обмануть систему с помощью того же ИИ .
- Адверсориальный характер работы: Эдвин Чен отмечает, что даже выпускники MIT часто пытаются «взломать» систему разметки, используя LLM для генерации ответов или продавая свои аккаунты. Без глубоких технологий фильтрации получить качественные данные для обучения современных моделей невозможно .
🚀 История основания: от Craigslist до миллиардной выручки 14:02
Идея Surge родилась из боли Чена как инженера по машинному обучению в Twitter. Ему нужно было обучить простой классификатор настроений (sentiment classifier), но существующая система сбора данных была катастрофически неэффективной: компания нанимала случайных людей через Craigslist, которые работали с таблицами .
Проблемы были очевидны:
- Скорость: Ожидание данных занимало месяцы.
- Качество: Разметчики не понимали сленга и хэштегов, классифицируя позитивные твиты как негативные .
- Сложность: Если система не справлялась с простым анализом настроений, она не могла помочь в настройке сложных алгоритмов рекомендаций, основанных на принципах ценности контента, а не просто кликбейте .
В 2020 году, сразу после выхода GPT-3, Чен покинул Twitter и за две недели в одиночку собрал первую версию Surge (MVP) . Вместо того чтобы привлекать 20–30 млн долларов инвестиций, как принято в Долине, он сосредоточился на продукте и прямом общении с клиентами.
Эдвин Чен утверждает, что для 95% стартапов привлечение денег — это просто «игра статусов», которая мешает сфокусироваться на реальной проблеме . Surge стала прибыльной с первого месяца работы , что позволило Чену сохранить полный контроль над компанией и её ценностями.
💰 Отказ от продажи компании за $100 млрд и путь к AGI 31:45
Surge продемонстрировала взрывной рост, особенно после релиза ChatGPT, когда индустрия осознала критическую важность человеческой обратной связи (RLHF) . На данный момент компания достигла выручки в размере более 1 млрд долларов .
Несмотря на колоссальные цифры, Чен заявляет о своей принципиальной позиции:
- Отказ от экзита: Он утверждает, что не продал бы компанию Марку Цукербергу ни за 30 млрд, ни даже за 100 млрд долларов .
- Причина: У него уже есть все необходимые ресурсы и полный контроль над судьбой компании. Продажа, по его мнению, стала бы «признанием неудачи» и ограничила бы его возможности .
- Миссия: Главная цель Чена — участие в создании AGI (общего искусственного интеллекта). Он считает работу Surge критическим элементом в разработке важнейшей технологии нашего времени .
🧠 Почему PhD не гарантирует качество данных 40:09
Обсуждая будущее данных, Эдвин Чен развенчивает миф о том, что для обучения умных моделей достаточно нанять людей с учеными степенями. Surge работает с профессорами Гарварда и докторантами Стэнфорда, но Чен подчеркивает, что «наличие PhD — это еще не всё» .
По его оценке, 80% докторов наук в области компьютерных наук пишут плохой код, потому что сильны только в математике, но не в практике . Для обучения моделей нового поколения требуются не просто академические знания, а «уличная смекалка» (street smarts) и творческий подход, чтобы находить уязвимости в LLM и обучать их решать реальные задачи, а не просто проходить тесты SAT .
📊 Критика бенчмарков: ИИ как «генератор кликбейта» 44:03
Эдвин Чен выражает скепсис по отношению к популярным рейтингам ИИ, таким как LMSYS Chatbot Arena. Он считает, что подобные лидерборды превратились в аналог кликбейта .
Аргументы Чена:
- Пользователи на аренах часто голосуют за более длинные ответы с эмодзи и красивым форматированием, даже если в тексте содержатся фактические ошибки или галлюцинации .
- Компании тратят месяцы, обучая модели «нравиться» людям на таких аренах, вместо того чтобы улучшать реальный интеллект. В результате модели становятся длиннее и вежливее, но не умнее .
- В качестве примера Чен приводит случай, когда топовая модель на вопрос «Когда умер Папа Римский?» выдает огромный текст о том, что он жив (что верно), но тут же ссылается на фейковые результаты поиска о его смерти, запутывая пользователя .
🧪 Тупик синтетических данных 50:01
Чен полагает, что роль синтетических данных (данных, созданных самим ИИ) сильно переоценена. Компании, которые весь прошлый год тренировали модели на синтетике, сейчас обнаруживают серьезные проблемы .
Главный риск использования синтетических данных, по словам гостя, — это «коллапс модели» (model collapse), когда ИИ начинает замыкаться на узком спектре похожих ответов, теряя разнообразие и способность к обобщению . Чен утверждает, что всего несколько тысяч примеров высококачественных данных, созданных людьми, могут быть ценнее, чем 10 миллионов синтетических образцов .
⏳ Прогнозы и будущее 58:53
В завершение беседы Эдвин Чен поделился своим видением сроков достижения технологических прорывов:
- 2028 год: Автоматизация работы среднего инженера-программиста .
- 2038 год: Использование ИИ для поиска лекарства от рака .
Чен также предсказывает появление нескольких независимых AGI-систем с разными «характерами» и специализациями, подобно тому, как в мире существуют разные выдающиеся поэты или математики . Он считает, что мы находимся лишь на 2–5% пути к истинному потенциалу ИИ .