Век неизменных юридических традиций стремительно трансформируется под воздействием генеративного искусственного интеллекта. Известный патентный юрист Пабло Арредондо прошел путь от ручного анализа судебных прецедентов до создания CoCounsel — передового ИИ-ассистента для адвокатов. История его стартапа CaseText наглядно показывает, как одна технологическая демонстрация способна за 12 часов полностью изменить траекторию развития бизнеса и переосмыслить принципы оказания правовой помощи.
📜 От «бумажного плена» к цифровым базам 4:10
Юридическая сфера всегда опережала многие другие отрасли в систематизации данных. Из-за постоянной необходимости ссылаться на более ранние судебные решения в праве задолго до появления интернета сформировалась жесткая структура, напоминающая современные гиперссылки. Однако в США из-за лавинообразного роста числа исков количество судебных мнений быстро превысило человеческие возможности восприятия.
Пабло Арредондо вспоминает исторический курьез из XIX века, когда юрист Саймон Гринлиф проиграл дело из-за того, что сослался на британский прецедент, который, как оказалось, уже был отменен вышестоящим судом. Попав в крайне неловкое положение, Гринлиф начал вручную составлять списки отмененных решений. Этот прообраз современных юридических указателей лег в основу бизнеса компании West Publishing (ныне часть Thomson Reuters), которая впервые систематизировала прецедентное право в единые серии книг.
Долгое время юристы пользовались жесткими бумажными таксономиями, разбивающими право на категории вроде «гражданские правонарушения» — «нападения животных» — «укусы собак». Ситуация изменилась в конце 1960-х годов с появлением компании Lexus и тотальной оцифровкой документов. Юристы получили возможность искать информацию по ключевым словам и логическим операторам (Boolean search).
Тем не менее поиск по ключевым словам имел фундаментальные ограничения. Как отмечает Пабло Арредондо, основываясь на своем опыте работы в престижной фирме Kirkland & Ellis, традиционные системы страдали от проблем с точностью и полнотой выдачи. Юристы часто пропускали критически важные дела просто потому, что в них использовались синонимы или иные формулировки.
Первым коммерческим прорывом компании CaseText, основанной Пабло Арредондо и Джейком Хеллером, стало использование алгоритмов мягкого цитирования, схожих с рекомендательными системами Spotify или Amazon. Программа анализировала текст адвокатского брифа и предлагала релевантные дела, которые юристы упустили, даже если прямых перекрестных ссылок между ними не было.
🚀 Эволюция моделей: Поворотный BERT и «киношный» прорыв 14:38
Настоящий технологический сдвиг в CaseText произошел в 2018 году. По словам Пабло Арредондо, первыми предвестниками истинной силы ИИ для него стали тесты, в которых компьютер научился распознавать скрытый смысл юридических формулировок. Судьи редко пишут прямолинейно вроде «мы отменяем решение по делу Дженкинса». Они могут выразиться поэтично: «мы с сожалением отправляем дело Дженкинса на свалку забвения».
Компания воспользовалась тем, что Google выложил в открытый доступ исходный код и веса языковой модели BERT, описанной в знаменитой научной работе Якоба Девлина. Разработчики CaseText взяли за основу этот подход и обучили модель на всем массиве общего права США.
Результатом стал запуск поискового движка Parallel Search. С его помощью юрист мог ввести развернутое предложение, а система находила дела со схожим юридическим смыслом, даже если ключевые слова вообще не совпадали.
Пример из практики Пабло Арредондо: При вводе демонстрационного запроса о вымышленном увольнении сотрудника за отказ носить защитную маску, модель выдавала старые прецеденты, где людей наказывали за отказ носить защитные каски или строительные шлемы. Программа оперировала концепцией «безопасности рабочей одежды», выйдя из «тюрьмы ключевых слов».
Этот продукт быстро завоевал признание крупнейших американских фирм из списка Am Law 200. В 2020 году команда протестировала модель GPT-3 от OpenAI, однако, по оценке спикеров, она оказалась слишком ненадежной, лишенной нюансов и непригодной для строгой юридической практики. Компания продолжила развивать собственные поисковые системы, пока не наступил сентябрь 2022 года.
⚡ 12 часов, которые изменили всё: Встреча с GPT-4 20:01
16 сентября 2022 года сооснователи CaseText получили закрытый доступ к ранней демонстрационной версии GPT-4. По воспоминаниям Пабло Арредондо, масштаб качественного скачка был настолько ошеломляющим, что в течение первых 12 часов руководство приняло решение полностью развернуть стратегию компании вокруг этой технологии.
Разработчики попали в закрытый Slack-канал OpenAI, выступая в роли профильных экспертов по юридическому домену. Команда работала без сна трое суток подряд, тестируя модель на генерацию хронологий, анализ документов и суммаризацию текстов.
В процессе тестирования Пабло Арредондо лично столкнулся с феноменом жестких галлюцинаций ИИ.
- Модель сгенерировала крайне убедительный ответ по поводу судебного дела, в котором Пабло реально участвовал в качестве адвоката.
- Когда Арредондо возразил модели, заявив, что он сам вел этот процесс и она ошибается, GPT-4 ответила дерзко: «Вы можете сколько угодно хвастаться своими бывшими делами, но я права, и вот доказательство».
- В качестве аргумента ИИ привел сгенерированную ссылку, ведущую на несуществующую веб-страницу.
Этот случай заставил команду осознать: большую языковую модель нельзя использовать как обычный чат-бот для юристов. Потребовалось внедрение архитектуры RAG (Retrieval-Augmented Generation). В этой схеме GPT-4 жестко принуждают формулировать выводы исключительно на основе документов, извлеченных из проверенной поисковой базы данных CaseText, полностью блокируя «фантазию» алгоритма.
Для верификации возможностей технологии CaseText совместно со специалистами из Стэнфордского университета провели исследование, в ходе которого GPT-4 успешно сдала официальный адвокатский экзамен (Bar Exam). Окончательное понимание того, что технология готова к рынку, пришло к Пабло тогда, когда консервативное сообщество профессиональных юридических библиотекарей, славящееся своей критичностью, признало выдачу системы точной и проработанной.
🛠️ Продуктовые вызовы: Архитектура CoCounsel и цена надежности 28:01
Новый продукт получил название CoCounsel — как дань уважения ИИ-помощнику CoPilot от Microsoft. На старте интерфейс состоял из набора изолированных кнопок под конкретные задачи юриста, но со временем разработчики перешли к привычной двухвкладочной структуре: окну диалогового чата и панели для отображения результатов параллельно выполняемых фоновых задач.
Сегодня CoCounsel закрывает потребности как судебных адвокатов (litigators), так и корпоративных юристов (transactional lawyers). Система способна выполнять ряд сложных аналитических операций:
- Подготовка к допросам (Deposition prep): ИИ генерирует список тем и точечных вопросов для свидетелей.
- Составление хронологий: Из неупорядоченного массива документов и стенограмм формируется четкий поминутный таймлайн событий.
- Проверка соответствия корпоративной политике (Contract compliance): ИИ сопоставляет входящие черновики контрактов с жестким внутренним регламентом компании (например, о применимом праве штата Делавэр) и предлагает готовые правки в режиме рецензирования (Redline).
- Поиск противоречий: Крупный бизнес загружает в CoCounsel многолетние архивы отчетов и показаний конкретных экспертов оппонентов, чтобы ИИ нашел расхождения в их словах для эффектного перекрестного допроса в суде.
Пабло Арредондо подчеркивает, что развитие продукта сопряжено со строгими техническими и регуляторными ограничениями. В частности, разработчики скептически относятся к рекламным заявлениям о гигантских контекстных окнах современных моделей. По мнению Пабло, огромный контекст часто оказывается «миражом»: модели демонстрируют эффект утери информации в середине текста (missing in the middle). По этой причине CaseText продолжает использовать кастомное дробление документов на фрагменты с сохранением смысловых пар.
Кроме того, для работы CoCounsel на выделенных серверах пришлось отключить стандартные фильтры безопасности (alignment) OpenAI. Реальные юридические кейсы регулярно содержат описания жестоких преступлений, проявления расизма или мошенничества, и базовый чат-бот отказывался работать с такими материалами.
Стоимость подписки на CoCounsel составляет около $200 в месяц за одного юриста. Отвечая на критику относительно высокой цены софта, Пабло Арредондо заявляет, что этот инструмент следует оценивать не как программу, а как цифрового коллегу или паралегала, чья реальная аренда обошлась бы фирмам в тысячи долларов.
🏛️ Философия права в эпоху ИИ: Писать — значит мыслить 1:11:37
Пабло Арредондо разделяет позицию основателя Y Combinator Пола Грэма, утверждающего, что процесс написания текста тождественен процессу мышления. Спикер выражает серьезную обеспокоенность тем, что повсеместное делегирование написания судебных брифов и судебных решений искусственному интеллекту может привести к атрофии юридического мышления у молодых специалистов. По его мнению, критически важно ревностно охранять этот интеллектуальный рубеж.
Любопытным индикатором изменения отношения госорганов к ИИ является эволюция взглядов Председателя Верховного суда США Джона Робертса. В своем ежегодном докладе за 2016 год Робертс подчеркивал, что медлительность и консерватизм судебной системы — это осознанная защитная функция, а не баг. Однако в докладе за 2023 год верховный судья кардинально изменил риторику, признав, что отныне юридические исследования немыслимы без ИИ, а сама технология способна обеспечить базовое требование правосудия: сделать его справедливым, быстрым и недорогим.
В будущем Пабло Арредондо прогнозирует появление систем полностью автоматизированного ИИ-арбитража по обоюдному согласию сторон для разрешения мелких споров. Он ссылается на идеи британского профессора Ричарда Сасскинда, призывающего юристов ориентироваться на пользу для клиентов (пациентов), а не заботиться исключительно о сохранении привычных часов оплачиваемого биллинга.
🏢 Новый этап: Под крылом гиганта 1:23:51
В 2023 году компания CaseText была официально поглощена корпорацией Thomson Reuters. Для основателей стартапа это слияние открыло принципиально новые возможности. Операционный директор Thomson Reuters Стив Хаскер объявил о масштабной стратегии внедрения ИИ во все продуктовые вертикали компании.
Пабло Арредондо отмечает, что если раньше стартап был вынужден строить свои решения буквально «из палок и грязи», то теперь они получили доступ к колоссальным, исторически выверенным массивам данных Thomson Reuters: закрытым судебным реестрам, аналитике Practical Law и базам законопроектов. Процесс поглощения не изолировал команду CaseText, а превратил её в «фабрику навыков» для модернизации всей экосистемы глобального медиагиганта.