Педро Домингос: «Современный успех ИИ — это локальный оптимум, а не финал»

Eye on AI 1,1 тыс. 59 мин 5 мин 17.04.2025
Главное

В новом эпизоде подкаста «Eye on AI» Педро Домингос, профессор Вашингтонского университета и автор бестселлера «Верховный алгоритм», анализирует историю и перспективы коннекционизма — доминирующей сегодня школы машинного обучения. Он объясняет, почему современный успех нейросетей может быть лишь «локальным оптимумом» и как конкуренция за гранты и внимание инвесторов заставляет исследователей двигаться в узком коридоре одних и тех же идей.

🧠 Суть коннекционизма: реверс-инжиниринг мозга 9:03

Коннекционизм — одна из старейших парадигм в искусственном интеллекте, зародившаяся еще в 1940-х годах. Основная идея этой школы, по словам Домингоса, заключается в попытке скопировать природный интеллект. «Мы хотим построить разумные машины. Что мы знаем из того, что уже разумно? Людей и, в частности, человеческий мозг» .

Как утверждает профессор, коннекционисты действуют как инженеры, пытающиеся разобрать автомобиль конкурента (например, Toyota разбирает Ford), чтобы понять, как он устроен:

📉 Циклы забвения: от уничтожения Минским до триумфа Deep Learning 12:34

История коннекционизма полна драматических падений. По мнению Домингоса, наиболее сильный удар по школе нанесли Марвин Минский и Сеймур Паперт. В своей книге 1969 года «Перцептроны» они математически доказали ограничения простых нейросетей .

Последствия этого научного труда были катастрофическими для дисциплины:

  1. Интерес к нейросетям упал «камнем» на следующие 15 лет .
  2. Консенсус 70-х состоял в том, что обучение машин не работает, и нужно заниматься «инженерией знаний» .
  3. В 1980-х произошел возврат благодаря алгоритму обратного распространения ошибки (Backpropagation), но он снова уперся в то, что обучение работало только с одним скрытым слоем .

Настоящий прорыв, который Домингос называет скорее маркетинговым, чем фундаментально научным, случился с появлением термина «глубокое обучение» (Deep Learning). Джефф Хинтон, Ян Лекун и Йошуа Бенжио стали «упертыми идеалистами», которые продолжали работу, когда все остальные отвернулись от нейросетей .

🔄 Алгоритм Backprop: как ИИ «распределяет вину» 14:48

Центральная проблема, которую решает коннекционизм, — это «назначение веса вины» (credit assignment problem). Домингос объясняет это на примере: если сеть должна отличить кошку от собаки, но ошибается, как понять, какой именно из миллионов нейронов внутри системы виноват в ошибке? .

Алгоритм обратного распространения ошибки (Backprop) дает простой ответ:

Домингос раскрывает закулисную историю Backprop: алгоритм переоткрывали около 20 раз. Он существовал у теоретиков управления в 60-х, у экономистов из Гарварда в 70-х, и даже в 80-х статьи с ним отклонялись рецензентами со словами: «Минский и Паперт доказали, что это не работает» .

🚀 Революция Vision и тайна «30-миллионного интерна» 22:49

Долгое время сообщество специалистов по компьютерному зрению (Computer Vision) скептически относилось к нейросетям, считая их лишь инструментом для распознавания цифр . Ситуацию изменил звонок Джеффа Хинтона к «папе компьютерного зрения» Джитендре Малику .

Ключевыми факторами успеха AlexNet в 2012 году стали:

  1. Датасет ImageNet: Миллион примеров, собранный Фей-Фей Ли .
  2. GPU: Использование графических процессоров позволило обучать сети такого масштаба .

Домингос вспоминает историю студента Хинтона — Навдипа Джайтли. Ларри Пейдж называл его «30-миллионным интерном», а Хинтон считает его «миллиардным интерном». Летом в Google Джайтли за три месяца обошел результаты сотен инженеров, годами разрабатывавших системы распознавания речи, просто применив глубокое обучение .

✨ Трансформеры и «внимание»: история случайного открытия 31:36

Вопреки распространенному мнению, ключевая идея Трансформеров — механизм «внимания» (Attention) — была придумана не в Google. По утверждению профессора Домингоса, её изобрел стажер в группе Йошуа Бенжио в Монреале по имени Дмитрий (Дима) Баданау .

Основные тезисы развития технологий обработки языка:

⚔️ ГАНы и эволюционная борьба 42:29

Генеративно-состязательные сети (GAN), созданные Яном Гудфеллоу, принесли в ИИ термин «генеративный». Домингос описывает их как «эволюционную гонку вооружений» между двумя сетями:

  1. Генератор: Пытается создать подделку (например, фото кота) .
  2. Дискриминатор: Пытается отличить подделку от реальности .

По мнению гостя, ГАНы фактически породили индустрию дипфейков . Однако сейчас технология стала менее популярной из-за нестабильности обучения, уступив место диффузионным моделям .

🚩 Скепсис вокруг Reinforcement Learning и DeepSeek 48:01

Особое внимание Домингос уделяет обучению с подкреплением (Reinforcement Learning, RL). Он выражает «оправданный скепсис» по поводу недавних успехов, включая китайскую модель DeepSeek, заявляющую об использовании «чистого RL» .

Аргументы Педро Домингоса против «магии RL»:

🌸 Проблема «одного цветка» в современной науке 54:36

В завершение беседы Педро Домингос критикует нынешнее состояние области ИИ за отсутствие разнообразия. По его мнению, огромные бюджеты и внимание индустрии сосредоточены на крайне узком направлении (Трансформеры), в то время как другие перспективные школы (байесовцы, эволюционисты) остаются в тени .

Он приводит историческую аналогию: Минский и Паперт признавались, что «уничтожили» нейросети в 60-х сознательно, чтобы перетянуть финансирование DARPA на свою символическую школу .

Домингос призывает к использованию метода «симуляции отжига» (Simulated Annealing) в науке — внесению «шума» и случайных идей, чтобы не застрять в локальном минимуме развития . «Сейчас цветет только один цветок, а нам нужно позволить расцвести тысяче», — заключает профессор .

💬 Цитаты

«В коннекционизме все знания заложены в связях между нейронами, как и в человеческом мозге.»

Педро Домингос 15:39

«Джефф Хинтон говорит, что Backpropagation — это не будущее. Он использует его только ради того, чтобы статьи принимали к печати.»

Педро Домингос 44:54

«Нам нужно больше «симуляции отжига» в исследованиях ИИ, чтобы не зацикливаться на одной идее.»

Педро Домингос 57:40
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Backpropagation
Метод обучения нейросетей путем корректировки весов от выхода к входу на основе ошибки.
Трансформер
Архитектура нейросети, использующая механизм внимания для обработки последовательных данных без рекурсии.
Credit assignment problem
Проблема определения того, какой именно элемент в сложной системе (нейрон в сети) ответственен за ошибку.
📊 Цифры
🗓 Хронология
  1. 1943 Публикация Маккалоха и Питтса о логической модели нейрона.
  2. 1958 Создание Перцептрона Фрэнком Розенблаттом.
  3. 1986 Публикация Хинтона и Румельхарта, популяризировавшая Backpropagation.
  4. 2012 Прорыв глубокого обучения в распознавании образов (ImageNet).
  5. 2017 Публикация научной статьи «Attention Is All You Need», представившей Трансформеры.
⚖️ Другая сторона
Искусственный интеллект Pedro Domingos Backpropagation DeepSeek Transformer Reinforcement Learning