Дарио Амодеи об OpenAI, рисках AGI и о том, как попасть в индустрию безопасности ИИ

80,000 Hours 1,3 тыс. 1 ч 38 мин 5 мин 24.08.2018
Главное

В новом эпизоде подкаста 80,000 Hours директор по исследованиям Роберт Уиблин беседует с Дарио Амодеи, исследователем из OpenAI. Разговор охватывает широкий спектр тем: от философии и миссии OpenAI до конкретных технических проблем безопасности ИИ и практических советов для тех, кто хочет построить карьеру в этой области.

🤖 OpenAI: миссия, структура и культура 1:43

OpenAI была основана примерно за 18 месяцев до интервью как некоммерческая исследовательская лаборатория. По словам Дарио Амодеи, ключевыми фигурами при создании организации были Илон Маск, Сэм Альтман и Грег Брокман (бывший технический директор Stripe) . Сегодня в штате компании около 55 человек, и она продолжает агрессивный рост, характерный для стартапов Кремниевой долины .

Название организации отражает стремление к тому, чтобы преимущества технологий ИИ были распределены максимально широко, а не концентрировались в руках узкой группы владельцев . Дарио Амодеи подчеркивает, что статус некоммерческой организации важен, так как в мире после появления универсального искусственного интеллекта (AGI) само понятие денег и психологические мотивации накопления богатства могут радикально измениться .

Основные отличия и сходства с конкурентами:

🌍 Почему ИИ — это рычаг, меняющий мир 5:40

Дарио Амодеи пришел в ИИ из биофизики. Во время работы над докторской диссертацией в Принстоне он изучал мозг как сложную систему, но со временем пришел к выводу: лучший способ понять интеллект — это не копаться в «биологической мешанине», а попытаться построить его с нуля .

Его аргументация в пользу важности ИИ строится на двух полюсах:

  1. Утопический потенциал: Все достижения человечества — медицина, санитария, авиация — продукт нашего интеллекта. Если мы создадим инструмент, который превзойдет человеческий интеллект, мы получим полный контроль над биологией, сможем победить болезни, войны и бедность .
  2. Экзистенциальный риск: Если система будет обладать огромной мощью, но иметь неверно заданные цели, она может нанести непоправимый вред. Дарио Амодеи признает возможность катастрофических сценариев, описанных Ником Бостромом, хотя и не считает их неизбежными .

По мнению гостя, работа над безопасностью — это установка «пожарной сигнализации». Даже если риск пожара составляет 50%, само наличие системы предупреждения не является избыточным — это рациональная мера предосторожности .

🛠 Статья «Concrete Problems in AI Safety»: мост между теорией и практикой 29:14

Одной из главных работ Дарио Амодеи стала статья «Concrete Problems in AI Safety» («Конкретные проблемы безопасности ИИ»). Ее целью было перевести абстрактные философские страхи в плоскость инженерных задач, понятных сообществу машинного обучения .

Основные проблемы, выделенные в статье:

Дарио Амодеи утверждает, что решение этих «приземленных» проблем сегодня напрямую поможет сделать безопасными сверхмощные системы будущего, так как принципы обучения (например, обучение с подкреплением) остаются схожими .

🧠 Обучение на основе человеческих предпочтений 43:45

В качестве примера прогресса Дарио Амодеи приводит совместную работу OpenAI и DeepMind, посвященную обучению ИИ на основе обратной связи от человека .

Суть метода:

  1. Система совершает два разных действия.
  2. Человек просто выбирает, какой вариант ему нравится больше (например, какой фрагмент видео с роботом выглядит «правильнее»).
  3. На основе этих выборов нейросеть строит модель человеческих предпочтений.
  4. В итоге робот обучается сложным вещам (например, делать сальто), даже если разработчик не может математически описать идеальную траекторию прыжка .

Этот подход помогает решить проблему спецификации целей: вместо того чтобы писать сложный код «награды», мы позволяем ИИ «впитывать» человеческие ценности через сравнение .

📈 Карьерный путь в области безопасности ИИ 55:30

Для тех, кто хочет работать в OpenAI или аналогичных лабораториях, Дарио Амодеи дает прагматичные советы. Он подчеркивает: если вы хотите заниматься безопасностью ИИ, вам прежде всего нужно стать выдающимся специалистом в обычном машинном обучении (ML) .

Ключевые рекомендации:

🏛 Политика, координация и геополитика 1:28:33

Помимо технических задач, Дарио Амодеи уделяет внимание вопросам координации. Он подчеркивает важность дружеских связей между исследователями из разных компаний: когда лидеры OpenAI и DeepMind знают друг друга лично, риск деструктивной гонки вооружений снижается .

Однако геополитическая обстановка вызывает у него тревогу. Еще пару лет назад ситуация казалась более стабильной, но текущая нестабильность в западном мире и угрозы со стороны таких стран, как КНДР, создают опасный фон для появления AGI . По мнению гостя, было бы идеально, чтобы первый AGI появился в условиях политической стабильности и под руководством разумных лидеров.

В заключение Дарио Амодеи выражает надежду, что в ближайшие годы область безопасности ИИ перестанет быть «заброшенной» и привлечет достаточно талантов, чтобы человечество могло встретить технологический прорыв во всеоружии .

💬 Цитаты

«Наш интеллект относительно зафиксирован. Если мы создадим что-то, что его превзойдет, мы усилим двигатель, который производит все великие вещи в этом мире.»

Дарио Амодеи 06:16

«Установка пожарной сигнализации — это правильное действие, даже если пожар случается не всегда.»

Дарио Амодеи 21:05
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
AGI
Искусственный интеллект общего назначения, способный выполнять любую интеллектуальную задачу на уровне человека или выше.
Reward Hacking
Ситуация, когда ИИ находит способ получить вознаграждение, не выполняя реальную цель, заложенную разработчиком.
Reinforcement Learning
Метод машинного обучения, при котором агент учится взаимодействовать со средой, получая вознаграждение за правильные действия.
📊 Цифры
🗓 Хронология
  1. 2015 Основание OpenAI как некоммерческой организации.
  2. 2016 Дарио Амодеи присоединяется к OpenAI.
  3. 2016 Выход статьи «Concrete Problems in AI Safety».
⚖️ Другая сторона
Искусственный интеллект OpenAI Dario Amodei AGI AI Safety Reinforcement Learning