Эйдан Гомес о будущем AI: «Интерфейс будущего — это разговор»

Machine Learning Street Talk 21,5 тыс. 51 мин 3 мин 14.11.2022
Главное

Эйдан Гомес о будущем AI: Как трансформеры меняют мир программ

0:00

Эйдан Гомес — сооснователь и CEO компании Cohere, а также один из создателей архитектуры Transformer, ставшей фундаментом современной индустрии ИИ. В интервью каналу Machine Learning Street Talk он обсудил историю создания этой технологии, ограничения современных языковых моделей и видение того, как ИИ станет естественным интерфейсом для взаимодействия с человеческими знаниями.

🏗️ История создания трансформеров 4:16

Разработка архитектуры Transformer проходила в Google Brain в 2017 году. По словам Эйдана Гомеса, это был «экстремальный спринт» длиной в 12 недель, в ходе которого исследователи работали на пределе возможностей, стремясь создать чисто «внимательную» (attentive) модель.

🧠 Ограничения архитектур и поиск нового 10:02

Обсуждая недавние исследования (например, работу DeepMind о Chomsky hierarchy), ведущий отметил, что трансформеры по своей природе не являются полными по Тьюрингу без внешней памяти, что ограничивает их способность к символьным рассуждениям и работе с бесконечными объектами.

🚀 Миссия Cohere: ИИ для всех разработчиков 15:00

Цель компании Cohere — сделать использование языковых моделей доступным для любого разработчика, независимо от его специализации, убирая необходимость глубокого погружения в управление GPU и настройку CUDA-ядер.

🌐 ИИ как «расширенный разум» 46:10

Гомес развивает концепцию Дэвида Чалмерса об «расширенном разуме» (extended mind), утверждая, что языковые модели становятся для человека новым способом взаимодействия с информацией.

💬 Цитаты

«Я искренне надеюсь, что трансформеры — это не последняя архитектура. Было бы крайне разочаровывающе, если бы это было пределом наших возможностей.»

Эйдан Гомес 11:07

«Я считаю, что реальная ценность ИИ-моделей заключается в форме творческого взаимодействия между человеческим мозгом и моделью.»

Эйдан Гомес 47:02
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Transformer
Архитектура нейронных сетей, основанная на механизме внимания, ставшая стандартом для обработки естественного языка.
BLEU score
Метрика для оценки качества машинного перевода текста.
Полнота по Тьюрингу
Способность системы вычислить любую вычислимую функцию.
Hallucination (галлюцинация)
Ситуация, когда языковая модель уверенно генерирует фактологически неверную информацию, пытаясь заполнить пробелы в своих знаниях.
📊 Цифры
🗓 Хронология
  1. 2017 Создание архитектуры Transformer в команде Google Brain.
⚖️ Другая сторона
Искусственный интеллект Aidan Gomez Cohere Transformer architecture