Ник Фрост из Cohere: почему погоня за AGI мешает созданию полезного искусственного интеллекта

В эпоху, когда Кремниевая долина одержима идеей создания «цифровых богов», канадский стартап Cohere выбирает путь радикального прагматизма. Сооснователь компании Ник Фрост в беседе с Тимом Скарфом на канале Machine Learning Street Talk объясняет, почему погоня за общим искусственным интеллектом (AGI) может быть ложной целью и как превратить языковые модели в надежные рабочие инструменты для бизнеса уже сегодня.

🚀 Философия Cohere: Против «цифровых богов» и за решение реальных задач 0:00

Компания Cohere, штаб-квартира которой находится в Торонто, сознательно дистанцируется от мессианских целей своих конкурентов . Пока лидеры индустрии соревнуются в прогнозах о достижении AGI, Ник Фрост заявляет, что его компания не заинтересована в создании сверхразума.

Основные тезисы позиции Ника Фроста относительно AGI:

Термин AGI описывает технологию, которая на данный момент просто не существует .
По мнению Фроста, современные архитектуры (в частности, трансформеры) не имеют ничего общего с человеческим разумом и вряд ли приведут к его воссозданию .
Фрост утверждает, что бизнес-модель Cohere строится на том, чтобы заставить технологию выполнять обещания, данные рынку, и решать прикладные задачи предприятий, а не философские дилеммы .

Говоря об этике и будущем, Фрост признает теоретическую возможность создания цифровой копии человеческого сознания, однако подчеркивает, что это вопрос далекого будущего, не имеющий отношения к текущему управлению бизнесом .

🧬 От лаборатории Джеффа Хинтона до рок-сцены: История Ника Фроста 1:43

Путь Ника Фроста в индустрию ИИ начался в лаборатории «крестного отца» глубокого обучения Джеффа Хинтона в Торонто . Именно там, работая в Google Brain в качестве инженера-исследователя, он познакомился с Эйденом Гомесом (будущим сооснователем Cohere и соавтором фундаментальной статьи «Attention Is All You Need») .

Личные факты о Нике Фросте:

Он считает Джеффа Хинтона своим главным наставником, который научил его культуре проведения исследований в области машинного обучения .
Помимо науки, Фрост профессионально занимается музыкой: он вокалист в инди-поп-рок группе «Good Kid» . Свой музыкальный стиль он описывает как нечто среднее между The Strokes и Panic! At The Disco.
Команда Cohere сформировалась благодаря «счастливой случайности» (серендипности): Фрост, Гомес и Иван Чжан пересеклись в стенах Университета Торонто (U of T) и Google .

🛠️ Command R: Революция в RAG и борьба с «галлюцинациями» 5:58

Недавний релиз моделей Command R и Command R+ стал важным событием для рынка . Эти модели специально оптимизированы для технологии RAG (Retrieval Augmented Generation — генерация с дополнением результатами поиска).

Ник Фрост выражает скепсис по отношению к самому термину «галлюцинация» . По его мнению, языковые модели по своей природе только и делают, что «галлюцинируют», то есть предсказывают вероятные токены на основе статистических закономерностей. Иногда эти предсказания совпадают с реальностью, а иногда нет.

Подход Cohere к обеспечению достоверности:

Внешний источник истины: Модели обучены не полагаться на «внутреннюю память» весов, а искать информацию во внешних документах .
Цитирование (Citations): Ключевой особенностью Command R является способность указывать конкретный документ и фрагмент текста, на основе которого построен ответ .
Доверие пользователя: Фрост утверждает, что наличие ссылок в интерфейсе кардинально повышает уровень доверия разработчиков и конечных бизнес-пользователей к системе .

Патрик Льюис, работающий в Cohere, является автором оригинальной научной статьи о RAG . Использование этой технологии позволяет компаниям «приземлять» модели на свои закрытые внутренние базы данных, избегая утечки знаний в общее облако тренировочных данных .

🐍 Эволюция инструментов: От калькуляторов до Python-интерпретаторов 12:18

Следующим шагом в развитии ИИ Фрост называет использование инструментов (Tool Use) . Это позволяет моделям выходить за рамки простого написания текста.

Примеры использования инструментов в экосистеме Cohere:

Математика: Языковые модели традиционно плохи в вычислениях, потому что пытаются «запомнить» результаты. Cohere дает им доступ к калькулятору .
Программирование: Модель может написать код на Python, выполнить его и вернуть результат. Это открывает путь к созданию сложных визуализаций данных .
Многошаговое выполнение: Фрост приводит пример запроса: «Создай график высоты пяти самых высоких пирамид» . Модель сначала ищет данные в сети, а затем использует Python для построения графика.

По прогнозу Фроста, в будущем язык станет универсальным интерфейсом между человеком и компьютером, где экран может оставаться пустым, пока машина по команде пользователя вызывает нужные API и строит интерфейсы «на лету» .

🤖 Почему «агенты» — это миф, а последовательное моделирование — реальность 14:44

Ведущий Тим Скарф поднимает тему «агентных систем» — программ, обладающих намерениями и целями. Однако Ник Фрост категорически против такой терминологии .

Фрост утверждает: «Я не люблю приписывать субъектность (agency) последовательным моделям». Его аргументы против концепции ИИ-агентов:

Вероятностная природа: Модели обучаются предсказывать следующую последовательность вызовов инструментов на основе обучающих данных, а не преследуют собственные цели .
Отсутствие реального понимания: Фрост считает, что модель не может «управлять бизнесом», так как количество вариантов развития событий в реальности бесконечно велико (branching factor), а обучающих данных для таких ситуаций не существует .
Аналогия с авиацией: ИИ — это «искусственный полет». Самолеты летают быстрее птиц и на большие расстояния, но они не машут крыльями и не могут зависнуть на месте как колибри. Точно так же ИИ полезен, но он функционирует принципиально иначе, чем человеческий мозг .

📊 Кризис бенчмарков: Почему лидерборды больше не имеют значения 24:52

В индустрии назревает кризис систем оценки качества моделей. Популярные тесты вроде MMLU (вопросы с множественным выбором) часто не коррелируют с реальной полезностью модели для бизнеса .

Проблемы современных метрик:

Загрязнение данных (Data Contamination): Модели часто «видят» тестовые вопросы во время обучения, что делает результаты недостоверными .
Бесполезность задач: Ник Фрост иронизирует над тем, что бизнесу не нужны модели, знающие теорию Зигмунда Фрейда; им нужны инструменты для структурирования документов .
Хрупкость рейтинга ELO: Популярный рейтинг Chatbot Arena (LMSYS) сильно зависит от форматирования текста и вежливости модели в начале диалога, что не делает её более эффективной в работе .

Фрост полагает, что одержимость метриками — это временная фаза . Он сравнивает это с историей смартфонов: когда-то все обсуждали бенчмарки процессоров и сенсорных экранов, но как только технология «приземлилась» и стала зрелой, пользователи начали выбирать устройство просто по удобству решения своих задач .

🛠️ Будущее разработки: От сайнс-проектов к инженерному искусству 37:07

Роль специалиста по данным (Data Scientist) трансформируется. Если в 2017 году основной задачей было обучение кастомных нейросетей для узких задач, то сегодня акцент смещается в сторону программной инженерии и LLM Ops .

Ключевые изменения в рабочем процессе:

Доступность: Теперь обычный софтверный инженер может создать мощное приложение на базе ИИ без глубоких знаний в математике нейросетей .
Промпт-инжиниринг против фича-инжиниринга: Вместо сложной предобработки чисел разработчики «играют с языком», настраивая поведение готовых базовых моделей .
Open Source подход: Cohere активно поддерживает открытое сообщество, выпустив инструментарий Cohere Toolkit на GitHub, который позволяет разворачивать чат-интерфейсы с поддержкой RAG и интерпретатором Python в локальной Docker-среде .

Завершая разговор, Ник Фрост подчеркивает, что главная цель сегодня — сократить «последнюю милю» между впечатляющим демо-роликом и надежным продуктом, который стабильно работает в продакшене .