Джаред Каплан из Anthropic: «Мы строим инструменты, где главный пользователь — сама нейросеть»

Сооснователь Anthropic Джаред Каплан в подкасте Y Combinator «The Light Cone» делится инсайдами о внутреннем устройстве одной из самых дорогих ИИ-компаний мира. В центре дискуссии — эволюция продукта от Slack-бота до Claude 3.5 Sonnet, технические вызовы при масштабировании моделей и новая парадигма разработки инструментов, где основным «пользователем» становится сама нейросеть.

🐺 От «собаки» к «волку»: путь в стартапы через Y Combinator 0:51

Джаред Каплан начал карьеру в 2009 году, сразу после окончания MIT. Его путь в индустрию начался с работы в компаниях выпускников Y Combinator, что сформировало его предпринимательское мышление .

По мнению Джареда Каплана, работа в крупном тех-гиганте приучает инженера быть «домашним псом», который просто ждет, когда ему положат еду в миску (поставят задачу). В стартапе же на ранних стадиях приходится быть «волком», который должен охотиться сам, иначе компания погибнет . Именно этот сдвиг в мышлении гость считает самым ценным уроком своей карьеры .

Его профессиональный трек включал:

Первый сотрудник в стартапе Linked (2009 год) .
Первый инженер в MoPub (платформа мобильной рекламы) .
Основатель стартапа SolidStage (зима 2012, YC) — попытка создать более гибкий аналог Heroku еще до появления Docker .
Работа в Grouper (дейтинг-приложение) .

Интересный факт: Джаред Каплан и Грег Брокман (будущий сооснователь OpenAI) познакомились именно в Grouper, где Грег был одним из самых активных пользователей сервиса .

🧪 Переход в AI: самообучение и «B-» по линейной алгебре 5:40

Джаред Каплан признается, что переход в сферу ИИ-исследований в 2014-2015 годах был сопряжен с огромной неуверенностью. В то время AI-безопасность и глубокое обучение казались многим его друзьям чем-то несерьезным, сравнимым с «проблемой перенаселения на Марсе» .

Ключевые моменты его «ретулинга» (переобучения):

У Джареда была оценка B- (или даже C++) по линейной алгебре в колледже, что заставляло его сомневаться, сможет ли он стать топовым исследователем .
Он взял 6 месяцев на самостоятельное изучение Machine Learning, чтобы «не быть обузой» для команд в DeepMind или Google Brain .
Его план обучения в 2015 году включал курсы Coursera, проекты на Kaggle и чтение учебника «Linear Algebra Done Right» .
Для вычислений он использовал гранты YC, арендуя GPU и подключаясь к ним через SSH .

В OpenAI Джаред Каплан попал благодаря Грегу Брокману, заявив, что готов «мыть полы», лишь бы помогать проекту . Его первым заданием была разработка среды для игры в Starcraft, и в течение первых 9 месяцев он вообще не занимался непосредственно машинным обучением .

📉 Законы масштабирования: эпоха GPT-3 12:44

Одним из важнейших этапов в карьере Джареда Каплана стала работа над GPT-3 в 2018–2019 годах. Он был среди тех, кто увидел фундаментальную закономерность:Scaling Laws (законы масштабирования) .

По словам Джареда Каплана, график, показывающий прямую линию зависимости качества модели от объема вычислений на протяжении 12 порядков, стал для него шоком . Это убедило его полностью сфокусироваться на масштабировании систем.

В тот период научное сообщество часто критиковало такой подход. Джаред Каплан вспоминает, что многие считали масштабирование «неэлегантным грубым методом» и бессмысленной тратой денег на GPU . Однако внутри команды сформировался девиз: «Делай глупую вещь, которая работает» (Do the stupid thing that works) .

🚀 Основание Anthropic: миссия против политики 15:46

Anthropic отделилась от OpenAI, когда группа из семи сооснователей (включая Дарио и Даниэлу Амодеи) решила создать институт, способный выдержать «вес» создания трансформирующего ИИ .

Особенности раннего этапа Anthropic:

Команда ушла из OpenAI, несмотря на их статус и миллиардное финансирование .
Первое время у компании не было четкого понимания, каким будет конечный продукт .
Джаред Каплан считает, что отсутствие политических интриг в компании, где сейчас работает более 2000 человек, обусловлено тем, что первые 100 сотрудников пришли исключительно ради миссии .
В первый год работы Джаред Каплан занимался созданием инфраструктуры обучения и закупкой вычислительных мощностей, а также бытовыми задачами вроде открытия счета в Brex .

💻 Claude 3.5 Sonnet и феномен «кодинга» 20:43

Долгое время Anthropic оставалась в тени OpenAI. Ситуация изменилась в 2024 году с выходом Claude 3.5 Sonnet, который стал стандартом де-факто для программирования среди стартапов YC .

Джаред Каплан отмечает следующие аспекты успеха:

Игнорирование тестов: Anthropic не создает команды для «подгонки» моделей под бенчмарки (teaching to the test). По мнению гостя, это создает плохие стимулы, и реальное качество Claude в работе оказывается выше, чем у конкурентов с аналогичными баллами .
Собачья еда (Dogfooding): Ускорение собственных инженеров Anthropic с помощью Claude является приоритетом №1 .
Эмпатия к модели: Успех Claude Code и протокола MCP (Model Context Protocol) Джаред Каплан связывает со сдвигом парадигмы: разработчики начали смотреть на Claude не просто как на инструмент, а как на пользователя .

Джаред Каплан приводит пример «агентских» возможностей: одна из его знакомых с помощью Claude смогла декомпилировать бинарный файл, разобрать ассемблерный код и превратить его в читаемый C-код с понятными именами переменных за 10 минут — задача, на которую у человека ушло бы несколько дней .

🏗️ Инфраструктура: крупнейшая стройка в истории человечества 31:04

Джаред Каплан, отвечающий за всю вычислительную инфраструктуру Anthropic, утверждает, что человечество находится в процессе величайшего строительства в истории .

Ключевые показатели инфраструктурного бума:

Затраты на вычисления для AGI растут примерно в 3 раза ежегодно .
В следующем году этот проект обгонит по масштабам программу «Аполлон» и Манхэттенский проект .
Главным «бутылочным горлышком» Джаред Каплан называет электроэнергию, особенно в США . Компании приходится бороться за разрешения на строительство дата-центров и доступ к мощностям.

Стратегическое преимущество Anthropic заключается в гибкости: это единственная крупная лаборатория, использующая чипы трех разных производителей — NVIDIA (GPU), Google (TPU) и AWS (Trainium) . Это требует огромных усилий от команды инженеров по производительности, но позволяет использовать лучшие чипы для конкретных задач (обучение или инференс) и обходить дефицит поставок .

🎓 Советы новому поколению: «будьте менее внешними» 34:40

В завершение беседы Джаред Каплан дал совет молодым инженерам и студентам, которые сомневаются, стоит ли им заканчивать колледж в эпоху ИИ :

Рискуйте больше. Сейчас время, когда традиционные пути (работа в FAANG, получение дипломов ради «корочки») становятся менее актуальными .
Ищите внутреннюю гордость. Работайте над тем, чем будет гордиться ваша «идеализированная версия себя», а не тем, что просто выглядит престижно в глазах окружающих .