В эпоху, когда Кремниевая долина одержима идеей создания «цифровых богов», канадский стартап Cohere выбирает путь радикального прагматизма. Сооснователь компании Ник Фрост в беседе с Тимом Скарфом на канале Machine Learning Street Talk объясняет, почему погоня за общим искусственным интеллектом (AGI) может быть ложной целью и как превратить языковые модели в надежные рабочие инструменты для бизнеса уже сегодня.
🚀 Философия Cohere: Против «цифровых богов» и за решение реальных задач 0:00
Компания Cohere, штаб-квартира которой находится в Торонто, сознательно дистанцируется от мессианских целей своих конкурентов . Пока лидеры индустрии соревнуются в прогнозах о достижении AGI, Ник Фрост заявляет, что его компания не заинтересована в создании сверхразума.
Основные тезисы позиции Ника Фроста относительно AGI:
- Термин AGI описывает технологию, которая на данный момент просто не существует .
- По мнению Фроста, современные архитектуры (в частности, трансформеры) не имеют ничего общего с человеческим разумом и вряд ли приведут к его воссозданию .
- Фрост утверждает, что бизнес-модель Cohere строится на том, чтобы заставить технологию выполнять обещания, данные рынку, и решать прикладные задачи предприятий, а не философские дилеммы .
Говоря об этике и будущем, Фрост признает теоретическую возможность создания цифровой копии человеческого сознания, однако подчеркивает, что это вопрос далекого будущего, не имеющий отношения к текущему управлению бизнесом .
🧬 От лаборатории Джеффа Хинтона до рок-сцены: История Ника Фроста 1:43
Путь Ника Фроста в индустрию ИИ начался в лаборатории «крестного отца» глубокого обучения Джеффа Хинтона в Торонто . Именно там, работая в Google Brain в качестве инженера-исследователя, он познакомился с Эйденом Гомесом (будущим сооснователем Cohere и соавтором фундаментальной статьи «Attention Is All You Need») .
Личные факты о Нике Фросте:
- Он считает Джеффа Хинтона своим главным наставником, который научил его культуре проведения исследований в области машинного обучения .
- Помимо науки, Фрост профессионально занимается музыкой: он вокалист в инди-поп-рок группе «Good Kid» . Свой музыкальный стиль он описывает как нечто среднее между The Strokes и Panic! At The Disco.
- Команда Cohere сформировалась благодаря «счастливой случайности» (серендипности): Фрост, Гомес и Иван Чжан пересеклись в стенах Университета Торонто (U of T) и Google .
🛠️ Command R: Революция в RAG и борьба с «галлюцинациями» 5:58
Недавний релиз моделей Command R и Command R+ стал важным событием для рынка . Эти модели специально оптимизированы для технологии RAG (Retrieval Augmented Generation — генерация с дополнением результатами поиска).
Ник Фрост выражает скепсис по отношению к самому термину «галлюцинация» . По его мнению, языковые модели по своей природе только и делают, что «галлюцинируют», то есть предсказывают вероятные токены на основе статистических закономерностей. Иногда эти предсказания совпадают с реальностью, а иногда нет.
Подход Cohere к обеспечению достоверности:
- Внешний источник истины: Модели обучены не полагаться на «внутреннюю память» весов, а искать информацию во внешних документах .
- Цитирование (Citations): Ключевой особенностью Command R является способность указывать конкретный документ и фрагмент текста, на основе которого построен ответ .
- Доверие пользователя: Фрост утверждает, что наличие ссылок в интерфейсе кардинально повышает уровень доверия разработчиков и конечных бизнес-пользователей к системе .
Патрик Льюис, работающий в Cohere, является автором оригинальной научной статьи о RAG . Использование этой технологии позволяет компаниям «приземлять» модели на свои закрытые внутренние базы данных, избегая утечки знаний в общее облако тренировочных данных .
🐍 Эволюция инструментов: От калькуляторов до Python-интерпретаторов 12:18
Следующим шагом в развитии ИИ Фрост называет использование инструментов (Tool Use) . Это позволяет моделям выходить за рамки простого написания текста.
Примеры использования инструментов в экосистеме Cohere:
- Математика: Языковые модели традиционно плохи в вычислениях, потому что пытаются «запомнить» результаты. Cohere дает им доступ к калькулятору .
- Программирование: Модель может написать код на Python, выполнить его и вернуть результат. Это открывает путь к созданию сложных визуализаций данных .
- Многошаговое выполнение: Фрост приводит пример запроса: «Создай график высоты пяти самых высоких пирамид» . Модель сначала ищет данные в сети, а затем использует Python для построения графика.
По прогнозу Фроста, в будущем язык станет универсальным интерфейсом между человеком и компьютером, где экран может оставаться пустым, пока машина по команде пользователя вызывает нужные API и строит интерфейсы «на лету» .
🤖 Почему «агенты» — это миф, а последовательное моделирование — реальность 14:44
Ведущий Тим Скарф поднимает тему «агентных систем» — программ, обладающих намерениями и целями. Однако Ник Фрост категорически против такой терминологии .
Фрост утверждает: «Я не люблю приписывать субъектность (agency) последовательным моделям». Его аргументы против концепции ИИ-агентов:
- Вероятностная природа: Модели обучаются предсказывать следующую последовательность вызовов инструментов на основе обучающих данных, а не преследуют собственные цели .
- Отсутствие реального понимания: Фрост считает, что модель не может «управлять бизнесом», так как количество вариантов развития событий в реальности бесконечно велико (branching factor), а обучающих данных для таких ситуаций не существует .
- Аналогия с авиацией: ИИ — это «искусственный полет». Самолеты летают быстрее птиц и на большие расстояния, но они не машут крыльями и не могут зависнуть на месте как колибри. Точно так же ИИ полезен, но он функционирует принципиально иначе, чем человеческий мозг .
📊 Кризис бенчмарков: Почему лидерборды больше не имеют значения 24:52
В индустрии назревает кризис систем оценки качества моделей. Популярные тесты вроде MMLU (вопросы с множественным выбором) часто не коррелируют с реальной полезностью модели для бизнеса .
Проблемы современных метрик:
- Загрязнение данных (Data Contamination): Модели часто «видят» тестовые вопросы во время обучения, что делает результаты недостоверными .
- Бесполезность задач: Ник Фрост иронизирует над тем, что бизнесу не нужны модели, знающие теорию Зигмунда Фрейда; им нужны инструменты для структурирования документов .
- Хрупкость рейтинга ELO: Популярный рейтинг Chatbot Arena (LMSYS) сильно зависит от форматирования текста и вежливости модели в начале диалога, что не делает её более эффективной в работе .
Фрост полагает, что одержимость метриками — это временная фаза . Он сравнивает это с историей смартфонов: когда-то все обсуждали бенчмарки процессоров и сенсорных экранов, но как только технология «приземлилась» и стала зрелой, пользователи начали выбирать устройство просто по удобству решения своих задач .
🛠️ Будущее разработки: От сайнс-проектов к инженерному искусству 37:07
Роль специалиста по данным (Data Scientist) трансформируется. Если в 2017 году основной задачей было обучение кастомных нейросетей для узких задач, то сегодня акцент смещается в сторону программной инженерии и LLM Ops .
Ключевые изменения в рабочем процессе:
- Доступность: Теперь обычный софтверный инженер может создать мощное приложение на базе ИИ без глубоких знаний в математике нейросетей .
- Промпт-инжиниринг против фича-инжиниринга: Вместо сложной предобработки чисел разработчики «играют с языком», настраивая поведение готовых базовых моделей .
- Open Source подход: Cohere активно поддерживает открытое сообщество, выпустив инструментарий Cohere Toolkit на GitHub, который позволяет разворачивать чат-интерфейсы с поддержкой RAG и интерпретатором Python в локальной Docker-среде .
Завершая разговор, Ник Фрост подчеркивает, что главная цель сегодня — сократить «последнюю милю» между впечатляющим демо-роликом и надежным продуктом, который стабильно работает в продакшене .