Ник Фрост из Cohere: почему погоня за AGI мешает созданию полезного искусственного интеллекта

Machine Learning Street Talk 51,4 тыс. 41 мин 6 мин 15.06.2024
Главное

В эпоху, когда Кремниевая долина одержима идеей создания «цифровых богов», канадский стартап Cohere выбирает путь радикального прагматизма. Сооснователь компании Ник Фрост в беседе с Тимом Скарфом на канале Machine Learning Street Talk объясняет, почему погоня за общим искусственным интеллектом (AGI) может быть ложной целью и как превратить языковые модели в надежные рабочие инструменты для бизнеса уже сегодня.

🚀 Философия Cohere: Против «цифровых богов» и за решение реальных задач 0:00

Компания Cohere, штаб-квартира которой находится в Торонто, сознательно дистанцируется от мессианских целей своих конкурентов . Пока лидеры индустрии соревнуются в прогнозах о достижении AGI, Ник Фрост заявляет, что его компания не заинтересована в создании сверхразума.

Основные тезисы позиции Ника Фроста относительно AGI:

Говоря об этике и будущем, Фрост признает теоретическую возможность создания цифровой копии человеческого сознания, однако подчеркивает, что это вопрос далекого будущего, не имеющий отношения к текущему управлению бизнесом .

🧬 От лаборатории Джеффа Хинтона до рок-сцены: История Ника Фроста 1:43

Путь Ника Фроста в индустрию ИИ начался в лаборатории «крестного отца» глубокого обучения Джеффа Хинтона в Торонто . Именно там, работая в Google Brain в качестве инженера-исследователя, он познакомился с Эйденом Гомесом (будущим сооснователем Cohere и соавтором фундаментальной статьи «Attention Is All You Need») .

Личные факты о Нике Фросте:

🛠️ Command R: Революция в RAG и борьба с «галлюцинациями» 5:58

Недавний релиз моделей Command R и Command R+ стал важным событием для рынка . Эти модели специально оптимизированы для технологии RAG (Retrieval Augmented Generation — генерация с дополнением результатами поиска).

Ник Фрост выражает скепсис по отношению к самому термину «галлюцинация» . По его мнению, языковые модели по своей природе только и делают, что «галлюцинируют», то есть предсказывают вероятные токены на основе статистических закономерностей. Иногда эти предсказания совпадают с реальностью, а иногда нет.

Подход Cohere к обеспечению достоверности:

  1. Внешний источник истины: Модели обучены не полагаться на «внутреннюю память» весов, а искать информацию во внешних документах .
  2. Цитирование (Citations): Ключевой особенностью Command R является способность указывать конкретный документ и фрагмент текста, на основе которого построен ответ .
  3. Доверие пользователя: Фрост утверждает, что наличие ссылок в интерфейсе кардинально повышает уровень доверия разработчиков и конечных бизнес-пользователей к системе .

Патрик Льюис, работающий в Cohere, является автором оригинальной научной статьи о RAG . Использование этой технологии позволяет компаниям «приземлять» модели на свои закрытые внутренние базы данных, избегая утечки знаний в общее облако тренировочных данных .

🐍 Эволюция инструментов: От калькуляторов до Python-интерпретаторов 12:18

Следующим шагом в развитии ИИ Фрост называет использование инструментов (Tool Use) . Это позволяет моделям выходить за рамки простого написания текста.

Примеры использования инструментов в экосистеме Cohere:

По прогнозу Фроста, в будущем язык станет универсальным интерфейсом между человеком и компьютером, где экран может оставаться пустым, пока машина по команде пользователя вызывает нужные API и строит интерфейсы «на лету» .

🤖 Почему «агенты» — это миф, а последовательное моделирование — реальность 14:44

Ведущий Тим Скарф поднимает тему «агентных систем» — программ, обладающих намерениями и целями. Однако Ник Фрост категорически против такой терминологии .

Фрост утверждает: «Я не люблю приписывать субъектность (agency) последовательным моделям». Его аргументы против концепции ИИ-агентов:

📊 Кризис бенчмарков: Почему лидерборды больше не имеют значения 24:52

В индустрии назревает кризис систем оценки качества моделей. Популярные тесты вроде MMLU (вопросы с множественным выбором) часто не коррелируют с реальной полезностью модели для бизнеса .

Проблемы современных метрик:

  1. Загрязнение данных (Data Contamination): Модели часто «видят» тестовые вопросы во время обучения, что делает результаты недостоверными .
  2. Бесполезность задач: Ник Фрост иронизирует над тем, что бизнесу не нужны модели, знающие теорию Зигмунда Фрейда; им нужны инструменты для структурирования документов .
  3. Хрупкость рейтинга ELO: Популярный рейтинг Chatbot Arena (LMSYS) сильно зависит от форматирования текста и вежливости модели в начале диалога, что не делает её более эффективной в работе .

Фрост полагает, что одержимость метриками — это временная фаза . Он сравнивает это с историей смартфонов: когда-то все обсуждали бенчмарки процессоров и сенсорных экранов, но как только технология «приземлилась» и стала зрелой, пользователи начали выбирать устройство просто по удобству решения своих задач .

🛠️ Будущее разработки: От сайнс-проектов к инженерному искусству 37:07

Роль специалиста по данным (Data Scientist) трансформируется. Если в 2017 году основной задачей было обучение кастомных нейросетей для узких задач, то сегодня акцент смещается в сторону программной инженерии и LLM Ops .

Ключевые изменения в рабочем процессе:

Завершая разговор, Ник Фрост подчеркивает, что главная цель сегодня — сократить «последнюю милю» между впечатляющим демо-роликом и надежным продуктом, который стабильно работает в продакшене .

💬 Цитаты

«Мы не заинтересованы в создании цифровых богов. Я хочу, чтобы технология выполняла свои обещания и решала реальные проблемы сегодня.»

Ник Фрост 00:00

«Я не люблю термин «галлюцинация», потому что он подразумевает, что модель может делать что-то другое. На самом деле всё, что делают LLM — это галлюцинируют.»

Ник Фрост 07:19

«ИИ — это искусственный полет. Самолеты невероятно полезны, но это не крылья колибри.»

Ник Фрост 21:41
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
RAG (Retrieval Augmented Generation)
Метод, при котором языковая модель ищет информацию во внешних документах перед тем, как сгенерировать ответ.
AGI (Artificial General Intelligence)
Гипотетический искусственный интеллект, способный выполнить любую интеллектуальную задачу, доступную человеку.
MMLU
Популярный тест для оценки знаний языковых моделей, состоящий из 57 различных предметов.
LLM Ops
Набор практик и инструментов для управления жизненным циклом приложений на базе больших языковых моделей.
📊 Цифры
🗓 Хронология
  1. 2017 Публикация статьи о трансформерах и начало роста популярности роли Data Scientist.
  2. Март 2024 Релиз моделей Command R и Command R+, ориентированных на бизнес-сектор.
⚖️ Другая сторона
Искусственный интеллект Cohere Command R Ник Фрост Retrieval Augmented Generation AGI