Глава Cohere Эйдан Гомес о развитии рассуждения в ИИ и будущем корпоративных моделей

Machine Learning Street Talk 28,7 тыс. 1 ч 4 мин 29.06.2024
Главное

Генеральный директор Cohere Эйдан Гомес в интервью для канала Machine Learning Street Talk (MLST) представил видение развития искусственного интеллекта, ориентированного на реальные потребности бизнеса. В центре дискуссии — отказ от гонки за «цифровыми богами» в пользу создания практичных инструментов, способных к сложному рассуждению и эффективной работе с корпоративными данными.

🚀 Философия Cohere: Ценность важнее AGI 1:39

В отличие от многих игроков в Кремниевой долине, Cohere не ставит своей целью создание общего искусственного интеллекта (AGI). По словам Эйдана Гомеса, миссия компании заключается в создании ценности для мира через предоставление предприятиям технологий, которые могут быть интегрированы в их продукты и усилить кадровый потенциал.

Основной акцент делается на преодолении «проблемы последней мили» — барьеров, мешающих внедрению больших языковых моделей (LLM) в реальный сектор:

Гомес считает, что индустрия должна уйти от «хрупкости» промпт-инжиниринга. По его мнению, модели должны стать достаточно умными, чтобы понимать общее намерение пользователя и надежно действовать от его имени, независимо от конкретных формулировок.

🧠 Прорыв в рассуждении и проблема галлюцинаций 17:00

Одной из самых обсуждаемых тем стала способность моделей к логическому выводу (reasoning). Гомес утверждает, что вопреки распространенному мнению, современные модели уже способны рассуждать, и это не бинарная характеристика («да» или «нет»), а континуум.

Основные тезисы Гомеса по развитию этой способности:

Что касается проблемы галлюцинаций, которую раньше считали экзистенциальной угрозой для технологии, Гомес настроен оптимистично. Он утверждает, что за последний год был достигнут значительный прогресс, и в 2024–2025 годах надежность моделей существенно возрастет.

🛠 Command R и новая архитектура моделей 10:20

Эйдан признал, что в 2023 году Cohere несколько отставала от лидеров рынка, так как компания занималась внутренней реорганизацией и перестройкой технологической стратегии. Результатом этой работы стала серия моделей Command R и R+.

Ключевые особенности нового подхода:

  1. Отказ от копирования: Cohere агрессивно исключает из обучения выходы моделей других провайдеров (например, GPT). По мнению Гомеса, это позволяет избежать «коллапса моделей», когда все ИИ начинают говорить одинаково и наследуют одни и те же ошибки.
  2. Специализация на RAG и инструментах: Модели Command R оптимизированы для поиска по внешним источникам (Retrieval Augmented Generation) и использования сторонних API.
  3. Сжатие против расширения: После периода создания гигантских моделей на триллионы параметров индустрия перешла к фазе сжатия их в эффективные форм-факторы для промышленного использования.

Гомес предсказывает переход к архитектуре Mixture of Experts (MoE), где отдельные компоненты будут экспертами в узких областях: коде, медицине или математике. Это позволит деплоить только нужные субкомпоненты вместо гигантских монолитных моделей.

⚖️ Политика, риски и идеологические битвы 33:36

Эйдан Гомес выступает как активный критик концепции экзистенциального риска (X-risk). По его словам, идея о том, что языковые модели захватят мир и убьют всех, на данный момент не имеет под собой оснований и является предметом академических дискуссий, а не регуляторной политики.

Позиция Гомеса по вопросам регулирования:

Гомес также прокомментировал закрытие Института будущего человечества Ника Бострома, отметив, что хотя он не согласен со многими их идеями, дефундирование академических институтов — это всегда потеря для науки. Он охарактеризовал современные движения вокруг ИИ (EA — эффективный альтруизм и e/acc — эффективный акселерационизм) как «культоподобные» и признался, что не хочет ассоциироваться ни с одним из них.

🏢 Культура Cohere и вызовы масштабирования 54:00

Сегодня в Cohere работает около 350 человек. Гомес признался, что как начинающий основатель совершил «каждую возможную ошибку», но выжил благодаря способности быстро признавать провалы и слушать опытных наставников.

Особенности работы в глобальной компании:

В завершение Гомес отметил, что 2024 год станет временем, когда ИИ-решения наконец выйдут из стадии «научных проектов» и начнут массово внедряться в производство, становясь фундаментальной частью повседневной работы.

💬 Цитаты

«Мы здесь не для того, чтобы строить AGI. Мы здесь для того, чтобы создавать ценность для мира.»

Эйдан Гомес 01:54

«Предыдущие поколения моделей были слабыми в рассуждениях, но они рассуждают.»

Эйдан Гомес 17:30

«Я — вокальный критик X-рисков и идеи, что языковые модели захватят мир и убьют всех.»

Эйдан Гомес 34:19
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
RAG
Метод, при котором ИИ ищет информацию в предоставленных документах, прежде чем дать ответ.
MoE (Mixture of Experts)
Архитектура нейросети, состоящая из нескольких специализированных подсетей-«экспертов».
Синтетические данные
Данные, созданные другими моделями ИИ для обучения новых систем, когда реальных данных не хватает.
X-risk
Теория об экзистенциальном риске, согласно которой ИИ может стать угрозой существованию человечества.
📊 Цифры
🗓 Хронология
  1. 2019 Основание компании Cohere (работает 4,5 года на момент записи).
  2. 2023 Период внутренней реорганизации и временного отставания Cohere от лидеров рынка.
  3. 2024 Выпуск моделей серии Command R и фокус на развитии навыков рассуждения.
⚖️ Другая сторона
Искусственный интеллект Cohere Эйдан Гомес Command R RAG синтетические данные