Эйдан Гомес о будущем ИИ: «Мы стоим на пороге трансформации продуктов»

Eye on AI 27 тыс. 1 ч 1 мин 3 мин 24.05.2023
Главное

Архитектор будущего: Эйдан Гомес о том, как нейросети меняют наш мир 0:00

Искусственный интеллект прошел путь от простых алгоритмов до технологий, способных понимать человеческий язык на уровне, который многие эксперты еще десятилетие назад считали недостижимым. В этом выпуске подкаста Eye on AI ведущий Крейг обсуждает эволюцию генеративного ИИ и будущее корпоративных технологий с Эйданом Гомесом — сооснователем компании Cohere и одним из ключевых разработчиков архитектуры Transformer, лежащей в основе современных языковых моделей.

🏗 Рождение Transformer: от «Maple Forest» до Google Brain 2:18

Эйдан Гомес, выросший в сельской части канадского Онтарио, прошел путь от стажера Google Brain до создателя технологии, изменившей индустрию. В годы учебы в Университете Торонто он начал глубоко изучать глубокое обучение, буквально засыпая с научными статьями на прикроватной тумбочке. Именно тогда он впервые связался с Джеффри Хинтоном, предложив свою идею о периодических функциях активации в нейронах. Хотя эта конкретная идея не прижилась, Хинтон, будучи лидером в своей области, уделил время студенту, что стало началом их профессионального взаимодействия.

В Google Brain Эйдан работал над амбициозным проектом «одна модель для всего» (One model to learn them all), целью которого было создание мультимодальной системы, способной обрабатывать текст, изображения, аудио и видео одновременно. Для реализации этой задачи была создана инфраструктура Tensor2Tensor.

Ключевым моментом стало объединение усилий с коллегами, которые работали над моделями на основе механизмов внимания (attention):

🧠 Что такое Transformer и почему он работает? 15:38

Эйдан описывает Transformer как удивительно простую архитектуру. В ее основе лежат два элемента: многослойные перцептроны (MLP) и механизм внимания.

Одной из причин доминирования Transformer стало то, что сообщество исследователей консолидировалось вокруг этой архитектуры, инвестируя в инфраструктуру и аппаратную поддержку. Хотя Эйдан уверен, что существуют и другие архитектуры, способные к подобным результатам, текущая инерция индустрии делает переход на другие решения сложной задачей.

🚀 Путь к Cohere и трансформация бизнес-процессов 36:49

Несмотря на революционный прорыв, Эйдан ощущал определенное разочарование: даже спустя три года после публикации статьи о Transformer мир технологий практически не изменился. Это побудило его вместе с сооснователями Ником Фросстом и Иваном Чжаном основать Cohere.

Миссия Cohere заключается в предоставлении доступа к мощным LLM для широкого круга разработчиков и компаний. Основные приоритеты компании:

  1. Приватность и комплаенс: Работа с конфиденциальными данными предприятий требует высочайшего уровня безопасности.
  2. Независимость от облачных провайдеров: Cohere позволяет клиентам избежать «привязки» к одному вендору, предоставляя возможность развертывания в разных облачных средах.

По мнению Эйдана, в ближайшие 18 месяцев мы увидим фундаментальные изменения в продуктовой сфере. Интерфейсы продуктов будут перестроены под диалоговое взаимодействие, как это когда-то произошло при переходе на мобильные приложения.

🛡 Галлюцинации и достоверность 49:15

Говоря о проблеме галлюцинаций (ложных утверждений моделей), Эйдан предлагает различать «полезную» креативность и нежелательную выдумку фактов. Важным решением он называет метод Retrieval Augmented Generation (RAG), предложенный Патриком Льюисом.

🔮 Будущее ИИ и вопросы сознания 52:54

Обсуждая опасения Джеффри Хинтона относительно рисков ИИ, Эйдан подчеркивает, что многие эксперты были шокированы тем, насколько быстро развивались технологии. По словам Эйдана, позиция Хинтона не является алармистской, а скорее «измеренной и разумной»: нужно серьезно относиться к неопределенности будущего и не исключать различные сценарии развития событий.

На философский вопрос о возможности возникновения самосознания у машин Эйдан отвечает с прагматичных научных позиций:

💬 Цитаты

«Модель начала понимать язык таким образом, что, по моему личному мнению, нас отделяли от этого десятилетия.»

Эйдан Гомес 00:17

«Архитектура Transformer — это просто многослойные перцептроны, сложенные друг на друга, плюс внимание.»

Эйдан Гомес 16:54

«Я не придаю человечеству божественного статуса. Думаю, сознание находится в мозге и является физическим процессом.»

Эйдан Гомес 58:37
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Transformer
Архитектура нейронных сетей, которая использует механизм внимания для обработки последовательностей данных.
LLM (Large Language Model)
Большая языковая модель, обученная на огромных массивах данных для понимания и генерации текста.
RAG (Retrieval Augmented Generation)
Метод, при котором модель при генерации ответа сначала ищет информацию во внешних источниках.
MLP (Multi-Layer Perceptron)
Многослойный перцептрон, базовая единица нейронных сетей.
📊 Цифры
🗓 Хронология
  1. 2017-2018 Создание и публикация архитектуры Transformer командой в Google Brain.
  2. 2019 Основание компании Cohere для коммерциализации технологий LLM.
  3. 2026 Интервью с Эйданом Гомесом о текущем состоянии ИИ-индустрии.
⚖️ Другая сторона
Искусственный интеллект Aidan Gomez Transformer Cohere Large Language Models Retrieval Augmented Generation