Илья Суцкевер: «Возможно создать ИИ, желающий подчиняться человеку»

Lex Fridman 68,3 тыс. 18 мин 6 мин 09.05.2020
Главное

Создание искусственного интеллекта человеческого уровня (AGI) остается главным вызовом современности, балансирующим на грани технологического прорыва и глубоких философских вопросов о природе разума. В ходе беседы Лекс Фридман и один из ведущих ученых в области ИИ Илья Суцкевер подробно обсуждают архитектуру будущих мыслящих машин, потенциал систем симуляции и фундаментальные риски распределения колоссальной власти, которую принесет с собой технологическая сингулярность. Собеседники пытаются заглянуть за горизонт технологического прогресса, чтобы понять, как человечество сможет сосуществовать с разумом, превосходящим его собственный.

🤖 Путь к сильному искусственному интеллекту 0:01

Потенциал алгоритмов self-play

Илья Суцкевер предполагает, что для создания сильного искусственного интеллекта (AGI) потребуется комбинация глубокого обучения и нескольких дополнительных концепций. Одной из таких ключевых идей, по его мнению, станет механизм самообучения в процессе игры (self-play). Лекс Фридман описывает этот подход как эволюционный процесс, в котором системы исследуют мир и непрерывно совершенствуются, соревновавшись с агентами сопоставимого уровня мастерства.

Суцкевер выделяет уникальное свойство таких систем — способность находить по-настоящему творческие и неожиданные решения сложных задач. В качестве исторических прецедентов он приводит известные разработки компании OpenAI и сторонних лабораторий:

По словам Суцкевера, именно дефицит подлинной креативности отличает современные коммерческие модели от полноценного AGI, и развитие состязательных сред способно преодолеть этот барьер.

🌐 Преодоление барьера симуляции 2:04

Эксперимент с роборукой OpenAI

Значительная часть достижений в области обучения с подкреплением получена в симуляциях, что вызывает скепсис у критиков технологии, указывающих на ограниченность виртуальных сред. Однако Илья Суцкевер уверен, что перенос навыков из виртуальной среды в физический мир (sim-to-real) не просто возможен, но и регулярно демонстрируется исследовательскими группами, особенно в сфере компьютерного зрения.

В качестве убедительного примера ученый напоминает об эксперименте OpenAI с роборукой, собиравшей кубик Рубика. Ключевые технологические особенности этого проекта:

Суцкевер прогнозирует, что способность нейросетей к генерализации и трансферу знаний будет непрерывно прогрессировать. Он проводит параллель с поведением человека: геймеры, осваивая сложные видеоигры, извлекают из них абстрактную «мораль истории» и затем успешно переносят эти паттерны в повседневную реальность.

🧠 Философия разума: телесность и сознание 5:20

Эмерджентность сознания в нейросетях

Размышляя о необходимости физического воплощения (embodiment) для обретения истинного разума, самосознания или страха смерти, Суцкевер высказывает гипотезу, что наличие физического тела крайне полезно, но не является обязательным условием для создания AGI. По его мнению, отсутствие телесных модальностей ИИ сможет компенсировать другими способами. Как исторический аналог такого преодоления он приводит биографию Хелен Келлер, которая, будучи слепоглухой от рождения, смогла развить полноценное интеллектуальное и концептуальное восприятие мира.

Вопрос возникновения сознания (consciousness) ученый связывает со способностью нейросетей формировать сложные внутренние репрезентации окружающего мира. Логическая цепочка Суцкевера строится на следующем онтологическом допущении:

  1. Человеческий мозг материален и обладает сознанием.
  2. Искусственные нейронные сети фундаментально схожи с биологическими структурами мозга.
  3. Следовательно, теоретически должны существовать конфигурации нейросетей, способные обладать полноценным сознанием.

На замечание Лекса Фридмана о том, что биологический мозг может скрывать в себе гораздо более сложную, нематериалистическую «магию», Суцкевер отвечает прагматично: если бы такая скрытая сложность существовала, она уже сейчас проявилась бы в виде непреодолимого барьера для технологического прогресса, чего на практике не наблюдается.

📊 Критерии интеллекта и парадоксы восприятия 8:05

Проблема нечеловеческих ошибок

Классический тест Тьюринга, основанный на имитационной игре в рамках естественного языка, сегодня уступает место более сложным метрикам. Илья Суцкевер признается, что его бы глубоко впечатлила система глубокого обучения, способная безошибочно выполнять базовые задачи (например, компьютерное зрение или машинный перевод), не допуская при этом глупых, «нечеловеческих» ошибок. По его наблюдениям, текущий скепсис общества проистекает именно из природы ошибок ИИ: когда модель ошибается там, где человек с базовым пониманием контекста никогда бы не оступился, это разрушает у людей веру в наличие интеллекта у машины.

Тем не менее, собеседники критикуют склонность человеческой природы обесценивать когнитивные способности алгоритмов. В качестве примера приводится языковая модель GPT-2, которая, обладая колоссальной широтой и в ряде тем глубиной знаний, заведомо превосходит среднестатистического человека по объему удерживаемой информации. Лекс Фридман описывает феномен медийного восприятия ИИ в XXI веке: общественность и журналисты целенаправленно ищут единичные кейсы катастрофических сбоев (будь то беспилотные автомобили или генеративные тексты), чтобы выпустить критические статьи, успокаивая себя мыслью о неразумности машин. Илья Суцкевер соглашается с этим, отмечая, что реальным триггером, который заставит человечество массово признать силу ИИ, станет момент, когда технологии начнут оказывать прямое и масштабное влияние на мировой ВВП.

👑 Политическая архитектура будущего с AGI 11:15

Модель «Совет директоров и генеральный директор»

В гипотетический первый вечер после создания полноценного AGI Суцкевер планирует подвергнуть систему тотальной проверке: задавать ей вопросы из всех возможных сфер — от фактологических до глубоко личных, эмоциональных и психологических, пытаясь спровоцировать ошибку, а также обязательно попросит у нее жизненного совета.

Однако за рамками личного любопытства скрывается фундаментальный вопрос распределения власти. Лекс Фридман цитирует Авраама Линкольна: «Почти все из нас могут выдержать невзгоды, но если вы хотите проверить характер человека, дайте ему власть». В контексте XXI века обладание кодами доступа к первому AGI станет эквивалентом абсолютной власти над планетой.

Илья Суцкевер предлагает утопическую, но технологически выверенную модель будущего политического устройства:

🛡️ Технологии выравнивания и отказ от контроля 14:22

Математика этики в обучении с подкреплением

Центральной проблемой безопасности остается сохранение контроля человека над созданными технологиями. Илья Суцкевер высказывает твердое убеждение в том, что возможно спроектировать AGI, целевая функция которого будет фундаментально сопряжена с желанием подчиняться человеку и помогать ему. Он предлагает биологическую аналогию с родительским инстинктом: забота о детях, стремление накормить их, одеть и обеспечить им успех не воспринимаются родителями как обуза, это их глубинное внутреннее стремление. По мнению ученого, аналогичный глубокий драйв — искреннее желание помогать человечеству процветать — можно заложить в саму архитектуру сильного ИИ.

Комментируя исторический пример Джорджа Вашингтона, который добровольно отказался от продления своих президентских полномочий во избежание диктатуры, Суцкевер заявляет, что для него лично передача контроля над готовым AGI обществу будет тривиальным шагом. Сценарий единоличного владения подобной технологией ученый называет «терроризирующим», подчеркивая, что никогда бы не хотел оказаться на месте абсолютного диктатора.

С технической точки зрения процесс выравнивания (alignment) ценностей ИИ с человеческими Суцкевер описывает через призму обучения с подкреплением (RL):

Такой подход, по мнению исследователя, позволит создать гибкую, но фундаментально безопасную систему ИИ, не подверженную спонтанным искажениям базовых этических директив.

💬 Цитаты

«Для создания сильного искусственного интеллекта потребуется комбинация глубокого обучения и нескольких дополнительных концепций, и я думаю, self-play станет одной из них.»

Илья Суцкевер 0:17

«Я верю с глубоким убеждением, что можно спроектировать AGI таким образом, что у него будет глубокий внутренний драйв помогать человечеству процветать.»

Илья Суцкевер 15:17
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
AGI (Сильный искусственный интеллект)
Гипотетический искусственный интеллект, обладающий способностью понимать, обучаться и выполнять любые интеллектуальные задачи на уровне человеческого разума.
Self-play (Самообучение в игре)
Метод обучения ИИ, при котором агенты совершенствуют свои навыки, непрерывно соревнуясь со своими же копиями или схожими по силе моделями.
Sim-to-real (Перенос из симуляции в реальность)
Технологический процесс успешного переноса алгоритмов управления и моделей ИИ, полностью обученных в виртуальной среде, на физические объекты реального мира.
RL (Обучение с подкреплением)
Метод машинного обучения, при котором система формирует оптимальную стратегию поведения, получая отклики в виде наград или штрафов за свои действия.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Илья Суцкевер Лекс Фридман OpenAI AGI Глубокое обучение