Эндрю Ын: «За последнее десятилетие ИИ призвал больше ангелов, чем демонов»

Eye on AI 15 тыс. 33 мин 5 мин 26.07.2023
Главное

Эндрю Ын, один из самых влиятельных исследователей в области машинного обучения и основатель DeepLearning.AI, в интервью для канала Eye on AI делится оптимистичным взглядом на развитие искусственного интеллекта. Он подробно объясняет, почему считает теорию экзистенциальной угрозы ИИ необоснованной, как технологии компьютерного зрения повторяют путь языковых моделей и почему открытый код критически важен для мировой инновационной экосистемы.

🛡️ Миф об экзистенциальной угрозе: почему ИИ не убьёт человечество 2:14

Эндрю Ын скептически относится к заявлениям о том, что ИИ представляет угрозу существованию человечества, и подчеркивает, что для подобных опасений нет никаких научных доказательств . Несмотря на то что такие признанные учёные, как Джефф Хинтон и Йошуа Бенджо, публично заявляли о рисках вымирания, Ын признаётся, что не может проследить логику в их аргументации .

По мнению Эндрю Ына, два основных сценария катастрофы выглядят неправдоподобно:

Эндрю Ын проводит параллель с авиационной индустрией: на заре самолётостроения аварии были частыми и трагичными, но человечество не запретило полёты, а разработало протоколы безопасности . Сегодня ИИ-системы становятся безопаснее с каждым месяцем, и хотя идеальный контроль невозможен (как и в случае с самолётом под влиянием ветра), текущего уровня управляемости достаточно для безопасной эксплуатации .

🧠 От «стохастических попугаев» к пониманию мира 7:30

В научном сообществе ведётся дискуссия: действительно ли большие языковые модели (LLM) понимают мир или они являются лишь «стохастическими попугаями», имитирующими интеллект. Эндрю Ын убеждён, что современные системы обладают реальным пониманием .

В качестве доказательства он приводит исследование под названием Othello GPT, представленное на конференции ICLR :

  1. Модель обучали предсказывать следующий ход в игре Отелло (реверси), подавая на вход только последовательность ходов без правил игры.
  2. Исследователи обнаружили, что внутри нейронной сети сформировалось представление о состоянии доски — полноценная «модель мира» игры .
  3. Модель не просто имитировала статистику, а «понимала», какие ходы возможны, исходя из текущей позиции фишек .

По словам эксперта, способность LLM признавать ошибки в расчётах (например, исправлять неверный шаг в математической задаче после указания пользователя) также свидетельствует о наличии внутренней логики, схожей с тем, как дети учатся решать задачи .

🤝 Необходимость консенсуса и риски регулирования 10:45

Эндрю Ын отмечает, что отсутствие единства среди исследователей ИИ сбивает с толку политиков и регуляторов . Он сравнивает ситуацию с климатологами: ученые, занимающиеся климатом, смогли стать эффективной силой, потому что выступили единым фронтом через такие структуры, как МГЭИК (IPCC) .

Раскол в ИИ-сообществе, по мнению Ына, создаёт опасные побочные эффекты:

Эндрю Ын напоминает, что около 10 лет назад Илон Маск и Билл Гейтс уже предупреждали, что ИИ — это «призыв демона» . Однако, как утверждает Ын, за прошедшее десятилетие технология «призвала гораздо больше ангелов, чем демонов», став мощным инструментом развития общества .

🌍 ИИ как инструмент выживания вида 14:51

Вместо того чтобы замедлять разработку ИИ из-за гипотетических страхов, Ын призывает ускорить её, так как технология является ключом к решению реальных экзистенциальных угроз:

🖼️ Революция визуальных промптов: Landing AI 24:40

В своей компании Landing AI Эндрю Ын развивает технологию Visual Prompting (визуальные подсказки). Он поясняет, что сфера компьютерного зрения сейчас проходит тот же путь, который текстовые модели начали в 2017 году после выхода статьи о трансформерах (Attention Is All You Need) .

Основные вехи этого процесса:

  1. 2017 год: Появление текстовых трансформеров, что привело к созданию GPT-3 и ChatGPT .
  2. 2020 год: Публикация статьи о Vision Transformer (ViT), которая запустила волну инноваций в обработке изображений .
  3. Текущий момент: Переход от обучения на размеченных данных к самообучению (self-supervision) на огромных массивах картинок из интернета .

Благодаря визуальным промптам (технология Landing Lens), разработка приложений компьютерного зрения, которая раньше занимала 6 месяцев, теперь доступна любому пользователю за несколько дней или даже секунд . Вместо написания кода пользователь может просто «подсветить» несколько пикселей на экране, обучая систему распознавать объекты.

Примеры использования Visual Prompting:

🇨🇳 Глобальная экосистема и открытый код 19:34

Эндрю Ын подчеркивает, что сообщество разработчиков ИИ является по-настоящему глобальным. Он отмечает бурное развитие открытых моделей в Китае, несмотря на мнение западной прессы о том, что законы о цензуре задушат китайские LLM .

На примере релиза Stable Diffusion в 2022 году эксперт доказывает пользу открытого кода: несмотря на риски создания дипфейков и предвзятость моделей, выгода от массовых инноваций в видео- и фоторедакторах кратно перевешивает вред . Ын призывает сохранять свободный обмен идеями между учеными США, Европы и Китая, что он лично наблюдал на недавней конференции CVPR .


💬 Цитаты

«Я бы почтительно заметил, что за последнее десятилетие с помощью ИИ мы призвали гораздо больше ангелов, чем демонов.»

«Если ИИ достаточно умен, чтобы случайно уничтожить нас, он, вероятно, будет достаточно умен, чтобы понять наши намерения.»

«Я бы предпочел, чтобы ИИ развивался быстрее, а не медленнее, если мы хотим, чтобы человечество процветало в следующие тысячи лет.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Стохастический попугай
Теория о том, что большие языковые модели лишь статистически комбинируют фразы, не понимая смысла.
Визуальный промптинг
Метод обучения модели компьютерного зрения путем указания на объекты прямо на изображении, по аналогии с текстовыми запросами.
Регуляторный захват
Ситуация, когда государственное регулирование начинает работать в интересах доминирующих на рынке компаний, ограничивая конкуренцию.
📊 Цифры
🗓 Хронология
  1. 2014 Илон Маск делает первое громкое предупреждение об угрозе ИИ («призыв демона»).
  2. 2017 Выход статьи «Attention Is All You Need», начало революции LLM.
  3. 2020 Адаптация архитектуры трансформеров для компьютерного зрения (ViT).
  4. 2022 Релиз Stable Diffusion, открывший доступ к генерации изображений широким массам.
  5. 2023 Конференция CVPR, где Vision Transformers признаны полноценной альтернативой сверточным сетям.
⚖️ Другая сторона
Искусственный интеллект Эндрю Ын Landing AI Othello GPT Vision Transformer экзистенциальный риск ИИ