Джейк Хеллер: как построить ИИ-стартап и продать его за $650 млн

Как построить успешный ИИ-стартап с капитализацией в сотни миллионов долларов, основываясь на реальных потребностях рынка, а не на хайповых демонстрациях для инвесторов? Основатель компании Casetext Джейк делится практическим опытом трансформации бизнеса после получения раннего доступа к GPT-4 и последующей продажи стартапа медиагиганту Thomson Reuters за 650 миллионов долларов наличными. В этом глубоком анализе разбираются прикладные методики поиска b2b-ниш, тонкости долгосрочной калибровки промптов через жесткие системы тестирования (evals) и новые подходы к ценообразованию на рынке искусственного интеллекта.

📜 Из большой юриспруденции к сделке на $650 млн наличными 0:00

Путь Джейка в технологическое предпринимательство начался с программирования, которым он увлекался с детства. Позже он сменил вектор, выбрав карьеру в сфере права и политики, окончил юридический факультет, прошел судебную клеркшип и устроился в крупную юридическую фирму. По его признанию, любого человека с бэкграундом создателя (builder), попадающего в старые консервативные профессии вроде юриспруденции или бухгалтерии, поражает архаичность и неэффективность рабочих процессов. Это подтолкнуло его уйти из найма и основать компанию Casetext в 2013 году. Основатель подчеркивает, что путь к успеху в подобных нишах может занять около 8 лет, поэтому молодым предпринимателям нужно быть готовыми к долгосрочному приключению.

Долгое время команда Casetext развивала глубокую убежденность в том, что применение технологий к праву способно радикально изменить индустрию. Семь лет назад, сразу после публикации фундаментальной научной статьи об архитектуре Transformer («Attention Is All You Need»), один из ИИ-исследователей компании по имени Джавид увидел потенциал ранних моделей BERT для улучшения юридического поиска. Благодаря многолетней экспертизе в области больших языковых моделей, летом 2022 года стартап получил закрытый ранний доступ к GPT-4. На тот момент годовая выручка компании составляла около 20 миллионов долларов, а штат насчитывал 100 человек. Джейк принял радикальное решение полностью остановить текущие процессы и перенаправить все ресурсы на создание принципиально нового продукта — Co-Counsel, ставшего первым полноценным ИИ-ассистентом для юристов. Спустя примерно два года продукт и компания были полностью выкуплены корпорацией Thomson Reuters за 650 миллионов долларов наличными.

🎯 Три категории ИИ-идей и революция в расчете объема рынка 3:02

Классический девиз акселератора Y Combinator звучит как «делай то, что нужно людям». По оценке спикера, в эпоху искусственного интеллекта следовать этому правилу стало значительно проще, поскольку потребности клиентов уже материализованы в их текущих затратах. Бизнесы и частные лица прямо сейчас платят реальным людям за выполнение конкретных задач. В качестве примеров таких позиций Джейк приводит сотрудников клиентской поддержки, страховых оценщиков, помощников юристов (паралегалов), а также персональных тренеров и исполнительных ассистентов.

При поиске идеи для ИИ-стартапа спикер рекомендует ориентироваться на три ключевые категории продуктов:

Ассистенты (Assistance): инструменты, помогающие квалифицированным профессионалам быстрее справляться со своей работой. Именно по такой модели построен Co-Counsel, который помогает юристам анализировать огромные массивы документов, проводить исследования и размечать контракты.
Замена функции (Replacement): создание полноценных сервисов (например, виртуальных юридических или бухгалтерских фирм), где искусственный интеллект полностью берет на себя выполнение должностных обязанностей человека.
Ранее немыслимое (Previously unthinkable): выполнение масштабных задач, которые раньше были физически и финансово невозможны. Например, ручной анализ и категоризация сотен миллионов документов стоили бы корпорациям огромных денег, но использование тысяч параллельных инстансов современных моделей (таких как Gemini 2.0 Flash) делает это реальным и доступным.

По мнению Джейка, появление ИИ радикально увеличило общий целевой объем рынка (TAM) для программного обеспечения. Раньше вендоры традиционного SaaS-софта продавали лицензии по модели «за рабочее место» (per-seat), рассчитывая на условные $20 в месяц с пользователя. Сегодня же потенциальным объемом рынка стартапа становится совокупный фонд оплаты труда (ФОТ) сотрудников, чьи задачи автоматизируются. Этот показатель, как утверждает спикер, может быть в 10, 100 или даже 1000 раз больше традиционного софтверного рынка, поскольку компании готовы платить специалистам тысячи долларов в месяц за решение критических проблем.

Джейк считает этот тренд не утопическим, а гуманным, приводя аналогию из эссе Сэма Альтмана о профессии фонарщиков, которая исчезла с приходом электричества. Автоматизация рутины призвана демократизировать доступ к дорогим услугам. В качестве примера приводится статистика, согласно которой более 85% людей с низким доходом в США не имеют доступа к юридической помощи из-за ее высокой стоимости и медлительности человеческого труда. Повышение эффективности юристов в 100 раз позволит сделать их услуги доступными для широких слоев населения.

🛠️ Пошаговое руководство по проектированию ИИ-агентов 9:10

Главным вызовом для разработчиков Джейк называет обеспечение надежности (reliable) системы, то есть переход от эффектной демонстрационной версии к стабильно работающему в продакшене продукту. Для этого он предлагает использовать структурированный инженерный подход.

Процесс проектирования ИИ-агента состоит из четырех последовательных этапов:

Детальное изучение должностных обязанностей. Необходимо досконально разобраться, что именно делает специалист на своем рабочем месте день за днем. Спикер отмечает, что Casetext помогло глубокое понимание контекста: он сам и его сооснователи были юристами, а около 30–40% сотрудников компании (включая разработчиков) имели юридическое образование. Тем, у кого нет профильного опыта, Джейк советует буквально стать «тайными агентами» и глубоко погрузиться в операционную деятельность целевых компаний.
Моделирование идеального процесса. Разработчику необходимо ответить на вопрос: «Как бы эту задачу решил лучший в мире специалист, имей он в своем распоряжении неограниченное время и ресурсы (например, пул из 1000 параллельно работающих ИИ)?». Процесс нужно разбить на микрошаги. В качестве примера приводится функция глубокого исследования (Deep Research), которую Casetext реализовала еще 2,5 года назад на базе GPT-4. Процесс лучшего юриста включает в себя получение запроса, формирование уточняющих вопросов, составление плана исследования, выполнение десятков поисковых сессий, тщательное прочтение сотен документов с фильтрацией нерелевантного контента, ведение аналитических заметок, написание финального эссе и перекрестную проверку точности всех сносок.
Перевод шагов в плоскость исходного кода. На этом этапе каждый выделенный шаг трансформируется в один или несколько промптов. Например, один промпт оценивает релевантность документа по шкале от 0 до 7, другой — пишет текст на основе заметок, третий — проверяет корректность цитирования. При этом Джейк призывает автоматизировать задачи детерминистически (через классический код или математические вычисления) везде, где это возможно, поскольку промпты и токеновые мощности остаются медленными и дорогостоящими.
Выбор между жестким воркфлоу и агентной архитектурой. Если последовательность действий эксперта неизменна от кейса к кейсу, стартапу следует упаковать ее в фиксированный рабочий процесс (workflow). Для этого, по словам спикера, не требуются сложные надстройки вроде LangChain — достаточно обычного Python-кода, где выходные данные одной функции последовательно передаются в другую. Если же логика действий гибко меняется в зависимости от контекста и внешних факторов, инженерам приходится строить более сложную, но менее предсказуемую агентную систему.

🧪 Инженерия промптов и создание жесткой системы тестирования (Evals) 15:18

По оценке Джейка, создать красивое демо с точностью ответов 60–70% достаточно легко: этого часто хватает, чтобы привлечь венчурный капитал от партнеров в фондах или подписать первые пилотные соглашения с клиентами. Однако без жесткого тестирования такие продукты быстро разваливаются в реальной эксплуатации, поскольку большие языковые модели склонны к непредсказуемым ошибкам и галлюцинациям.

Для построения промышленной системы тестирования (evals) спикер рекомендует опираться на отраслевую экспертизу и четкие критерии качества. Ответы ИИ необходимо переводить в объективно измеримый формат: например, требовать от модели вывода значений True/False или оценки по фиксированной шкале, что упрощает автоматическую валидацию. Для развертывания инфраструктуры тестов Джейк выделяет open-source фреймворки, запускаемые через командную строку, такие как Promptfoo.

Методология доведения промптов до промышленного стандарта включает в себя следующие шаги:

Создание базового набора из 12 тестов, максимально точно имитирующих реальные запросы будущих пользователей.
Итеративная калибровка текста промпта до тех пор, пока модель не начнет проходить все 12 тестов без ошибок.
Последовательное расширение тестового покрытия до 50, а затем и до 100 сценариев.
Обязательное использование удерживаемой выборки данных (holdout set), на которую инженер не смотрит во время составления инструкций, чтобы избежать переобучения промпта под конкретные тесты.

Спикер утверждает, что за счет одной лишь аккуратной промпт-инженерии можно продвинуться невероятно далеко без необходимости технического дообучения (fine-tuning) моделей. Модели ошибаются предсказуемо — из-за двусмысленности формулировок или отсутствия примеров. Джейк подчеркивает, что главным критерием успеха стартапа является готовность фаундера или профильного инженера провести две недели без сна, непрерывно переписывая и полируя один единственный промпт ради прохождения системы тестов. Большинство команд сдаются на точности в 60%, заявляя, что ИИ неспособен решить задачу. Однако две недели упорного «гриндинга» позволяют поднять точность до 97%, где оставшиеся 3% брака приходятся на пограничные суждения, в которых ошибаются и люди.

Перед релизом в бета-версию продукт должен стабильно проходить не менее 100 тестов на микрошаг и 100 тестов на весь сквозной процесс с точностью не ниже 99%. В продакшене реальные клиенты начнут отправлять нечитаемые и хаотичные запросы (в духе «burrito me how ouch»). Каждую жалобу пользователя и каждый сбой инженерам необходимо немедленно превращать в новый тест для системы. Данный процесс итеративен: промпты должны обновляться ежедневно, формируя новые пул-реквесты на GitHub каждые 1–2 дня. Джейк призывает разработчиков критически относиться к популярным лидерам мнений, отмечая, что настоящие создатели ИИ-продуктов не публикуют хайповые ролики в Twitter, а методично повышают точность систем за кулисами.

💰 Маркетинг, ценообразование и ловушка пилотных проектов 23:50

Вопреки классическим советам венчурных инвесторов стадий Series A и Series B, утверждающих, что при сильном маркетинге качество продукта вторично, Джейк настаивает на обратном. Опыт Casetext показал, что выдающийся ИИ-продукт запускает мощное бесплатное сарафанное радио и привлекает прессу, превращая менеджеров по продажам в обычных «приемщиков заказов» (order takers), обрабатывающих входящий поток.

В вопросах дистрибуции и монетизации ИИ-приложений спикер выделяет три ключевых аспекта:

Ценностное ценообразование (Value-based pricing). ИИ-стартапы больше не продают просто софт, они продают готовую услугу. Если традиционная юридическая фирма берет $1,000 за аудит контракта, стартап может зафиксировать цену на уровне $500 за контракт. Это означает колоссальный шаг вперед по сравнению со стандартными подписками за $20 в месяц.
Уважение к бюджетному планированию клиентов. При выборе между оплатой за фактическое использование (per-use) и фиксированным тарифом b2b-клиенты Casetext предпочли предсказуемость. Они согласились платить больше — по $6,000 за рабочее место в год ($500 в месяц), ради стабильного годового планирования бюджета.
Преодоление дефицита доверия (Trust gap). Крупные корпорации опасаются внедрять новые ИИ-технологии. Чтобы построить доверие, Джейк рекомендует использовать формат Head-to-Head сравнений: предлагать клиенту запустить ИИ параллельно с его текущими подрядчиками (юристами или бухгалтерами) и наглядно сопоставить скорость, стоимость и качество результатов.

Спикер заявляет о скрытой системной угрозе на рынке — ловушке пилотных контрактов. На правах ангельского инвестора Джейк видит множество стартапов, декларирующих годовую выручку (ARR) в районе $10 млн, однако при детальном анализе эти цифры оказываются краткосрочными 6-месячными пилотами. По его прогнозу, индустрию ждет «массовое вымирание» компаний из-за неспособности конвертировать пилотную выручку (которую он иронично называет PRR — Pilot Recurring Revenue) в постоянные возобновляемые контракты.

Чтобы предотвратить отток клиентов, фаундерам необходимо инвестировать в глубокий онбординг и обучение пользователей. Ссылаясь на недавнее замечание Сатьи Наделлы, Джейк отмечает взрывной рост востребованности роли Field Deployed Engineers (инженеров передового развертывания). Это технические специалисты стартапа, которые физически находятся на стороне заказчика («boots on the ground») и следят за тем, чтобы продукт приносил реальную пользу на рабочих местах. Продукт — это не просто пиксели на экране, а весь комплекс человеческих взаимодействий, поддержки и обучения.

❓ Ответы на вопросы: конкуренты, фокус CEO и защита от копирования 30:16

Отношение к конкурентам и выбор рынка

Джейк рекомендует технологическим фаундерам полностью игнорировать конкурентную среду на старте. Объем рынков интеллектуального труда исчисляется триллионами долларов (будь то маркетинг, право или клиентский сервис), и ни одна компания не сможет монополизировать их целиком. По его мнению, начав строить продукт, разработчики быстро обнаружат, насколько слабы решения конкурентов, и смогут легко обойти их по качеству. При поиске рыночной ниши спикер советует анализировать задачи, которые крупные корпорации уже сейчас массово отдают на аутсорсинг в другие страны. Не стоит автоматизировать процессы, составляющие ядро идентичности бренда — например, написание сценариев в анимационной студии Pixar, поскольку сотрудники будут яростно защищать эту функцию. В то же время, практически любая сфера классического «беловоротничкового» труда представляет собой потенциальный триллионный рынок, куда можно заходить напрямую.

Изменение фокуса основателя по стадиям развития

Отвечая на вопрос швейцарского предпринимателя Майкла об эволюции роли генерального директора, Джейк высказал мнение, что на всех стадиях развития бизнеса — от Seed до Series A, B и C — фокус CEO должен оставаться неизменным: создание великолепного продукта и достижение Product-Market Fit (PMF). Спикер признался, что сам совершил типичную ошибку, начитавшись экспертных блогов: начал воспринимать наем персонала (HR), управление финансами и фандрейзинг как самостоятельные цели. По его убеждению, культура, рекрутинг и продажи должны быть исключительно инструментами, подчиненными главной задаче — созданию продукта, который любят пользователи, а не развиваться в абстракции.

Совет для молодых предпринимателей

Один из участников встречи, 14-летний фаундер, уже успевший продать свой первый стартап консалтинговой компании Deloitte, поинтересовался у Джейка вектором дальнейшего развития. Спикер отметил, что запуск Casetext исключительно в юридической вертикали изначально содержал стратегический просчет: до появления больших языковых моделей рынок софта для юристов был крайне узким, а технологическое влияние — инкрементальным. Ситуация в корне изменилась с появлением LLM. Джейк советует молодым талантам атаковать самые масштабные и сложные из потенциально решаемых проблем. Бизнес всегда хочет эффективнее продавать, а обычные люди мечтают быть стройными, сохранять волосы и избавляться от бытовой рутины. Спикер считает, что появление бытовых роботов-уборщиков за $1,000 в год способно высвободить колоссальный человеческий потенциал, аналогично тому, как изобретение посудомоечной машины в 1950-х годах освободило миллионы людей от домашнего хозяйства.

Ценообразование немыслимых задач и defensibility (защита от копирования)

Обсуждая ценообразование для принципиально новых задач, которые люди физически не способны выполнить (например, сквозной аудит сотен тысяч документов), Джейк рекомендует отталкиваться от ценности для бизнеса (value provided). На старте необходимо вести прямой диалог с клиентом и забирать в качестве оплаты порядка 10–20% от объема сэкономленных средств или созданной ценности. В долгосрочной перспективе законы капитализма неминуемо снизят стоимость подобных ИИ-услуг до центов, что выгодно для общества, но вредно для маржинальности бизнеса, поэтому монетизировать ценность нужно здесь и сейчас.

В ответ на опасения разработчиков стать банальной «оберткой над GPT» (GPT wrapper), строящей бизнес поверх чужих базовых моделей, Джейк советует просто переходить к действию. Как только команда начинает реальную разработку, продукт мгновенно обрастает сложной инфраструктурой: кастомными интеграциями данных, многоуровневыми системами проверок, специфически откалиброванными промптами и оркестрацией различных моделей. Два года непрерывной работы над решением узкой проблемы создают глубокую технологическую защищенность и уникальную экспертизу, которую конкуренты не смогут быстро скопировать.