Педро Домингос: «Спор символистов и нейросетей завершится полной интеграцией»

В интервью для канала «Eye on AI» известный исследователь искусственного интеллекта и профессор Вашингтонского университета Педро Домингос (Pedro Domingos) подробно описывает историю, философию и текущее состояние символического подхода к ИИ. На протяжении десятилетий это направление оставалось доминирующим, однако сегодня оно переживает новый виток развития, объединяясь с глубоким обучением. Автор книг «Верховный алгоритм» и «2040» объясняет, почему современные нейросети по-прежнему нуждаются в строгих логических правилах и как гибридные системы меняют ландшафт технологий.

🧠 Что такое символический ИИ и откуда он взялся 0:00

Символический подход к искусственному интеллекту основан на так называемой гипотезе физических символьных систем. У истоков этого направления стояли четыре «отца-основателя» ИИ: Марвин Минский, Джон Маккарти, Герб Саймон и Аллан Ньюэлл. Все они были убежденными символистами, а Саймон и Ньюэлл первыми четко сформулировали упомянутую гипотезу, корни которой уходят еще к работам Алана Тьюринга.

Суть гипотезы заключается в следующем:

Система, способная манипулировать символами определенным образом, обладает всем необходимым для реализации полноценного интеллекта.
Физическое воплощение этих символов в реальном мире совершенно не имеет значения.

По словам Педро Домингоса, получившего докторскую степень по машинному обучению еще в 1990-х годах, символисты твердо верили, что изучение мозга на уровне отдельных нейронов — это ошибочный путь. Эксперт приводит аналогию с программированием: когда разработчик пишет код на Python или Java, ему, к счастью, не нужно думать на уровне транзисторов. Точно так же, по мнению гостя, интеллект необходимо формулировать на уровне абстрактных представлений и алгоритмов, а физическая реализация — это лишь вторичная инженерная задача.

В 1970-х, 1980-х и 1990-х годах символический ИИ был абсолютно доминирующей парадигмой. В те времена понятие искусственного интеллекта практически приравнивалось к символическому подходу, а некоторые исследователи даже отказывались считать нейронные сети частью ИИ, что сегодня выглядит довольно забавно. В отличие от биологически вдохновленных нейросетей, символический подход черпал вдохновение из математики, логики, психологии и классической философии. По мнению Педро Домингоса, символический ИИ можно назвать прикладной философией, где философские идеи операционализируются на вычислительной машине.

🔢 Природа символов и логика рассуждений 6:37

Для людей, не связанных с ИИ напрямую, понятие «символ» часто остается размытым. Педро Домингос дает простое объяснение: символами являются обычные слова естественного языка, когда человеческая речь представляет собой последовательность символов. Другой наглядный пример — математика, где в уравнении $f = ma$ каждый элемент ($f$, $=$, $m$, $a$) является символом. Символисты утверждают, что комбинирование и преобразование таких наборов знаков — это все, что требуется для любых вычислений и создания ИИ.

С этой точкой зрения согласуется фундаментальная гипотеза Чёрча — Тьюринга, согласно которой универсальная машина Тьюринга способна реализовать любое возможное вычисление. Гость иронично замечает, что даже любая нейросеть, запущенная на современном компьютере, технически остается системой манипуляции символами, где в роли символов выступают векторы, матрицы, тензоры и градиенты.

Исторически манипуляции в символическом ИИ строятся на правилах логики и математики, таких как аксиомы Пеано для арифметики или классические правила вывода. Одним из старейших правил является модус поненс (Modus Ponens), сформулированный еще Аристотелем. Профессор иллюстрирует его классическим примером:

Все люди смертны (первый набор символов).
Сократ — человек (второй набор символов).
Следовательно, Сократ смертен (выведенное утверждение).

В 1960-х годах исследователи открыли так называемое правило резолюций, которое легло в основу логического программирования. Это правило вывода обладает свойствами корректности и полноты, позволяя логически вывести любое истинное утверждение, которое в принципе может быть выведено.

Внутри самого символического сообщества долгое время существовал глубокий раскол на две фракции:

«Аккуратные» (the neats): Их лидером был Джон Маккарти. Они стремились делать все строго, записывая абсолютно все знания в виде четких логических формул и решая задачи через строгие правила вывода.
«Всклокоченные» (the scruffies): К ним относились Марвин Минский, Аллан Ньюэлл и Герб Саймон. Эта группа опиралась на психологию и полагалась на эвристические методы рассуждений.

По воспоминаниям Домингоса, в 1980-х годах «аккуратный» подход доминировал, и его сторонники были уверены, что находятся на пороге создания ИИ человеческого уровня, ожидая его появления в течение ближайшего десятилетия. Однако реальность оказалась сложнее.

🔄 Дедукция, индукция и «главный алгоритм» символистов 11:40

Традиционные логические правила вывода, такие как модус поненс или резолюция, являются дедуктивными. Дедукция ведет рассуждения от общих утверждений к частным следствиям, гарантируя абсолютную истинность результата, если исходные посылки верны. Однако для полноценного интеллекта необходима и индукция — способность переходить от частных фактов к общим правилам, то есть обучаться.

Главным инструментом символистов в этой сфере стала так называемая обратная дедукция (inverse deduction). Домингос называет ее «верховным алгоритмом» этой школы. Логика здесь аналогична другим математическим операциям:

Вычитание определяется как действие, обратное сложению.
Интегрирование выступает как инверсия дифференцирования.
Индукция реализуется через инвертирование дедуктивного вывода.

На практике обратная дедукция выглядит следующим образом: видя, что Сократ, Платон и Аристотель являются людьми и все они смертны, система делает рискованное индуктивное предположение, что все люди смертны. Профессор подчеркивает, что индукция всегда несет в себе риск ошибки, в отличие от строгой дедукции. Тем не менее за последние десятилетия наука научилась квантифицировать этот риск. За разработку теории, доказывающей, что при определенных допущениях индуктивные выводы могут быть верными с высокой долей вероятности, ученый Лесли Валиант получил премию Тьюринга, которую называют Нобелевской премией в области компьютерных наук.

🛑 Проблема хрупкости и бутылочное горлышко экспертных систем 14:40

Одним из главных практических применений символического ИИ, начиная с 1970-х годов, стала медицинская диагностика. В таких системах пациент описывается набором признаков (фич), которыми выступают симптомы: температура, повышенное давление, головная боль или результаты анализов крови. Логические правила оперируют этими признаками, чтобы выдать диагноз.

В эпоху предыдущего бума ИИ в 1980-х годах инженеры знаний часами интервьюировали экспертов-медиков, пытаясь переложить их неформальный человеческий опыт на строгий язык компьютерной логики. Однако этот подход столкнулся с двумя фундаментальными проблемами, которые остановили развитие индустрии:

Бутылочное горлышко извлечения знаний (knowledge acquisition bottleneck): Опрос экспертов обходился слишком дорого и занимал колоссальное количество времени. Кроме того, человеческие знания имеют огромный «длинный хвост» — эксперты часто используют неосознанный опыт, о котором забывают упомянуть при интервью. Ярким примером стал амбициозный проект Cyc Дага Лената, целью которого было заложить абсолютно все знания о мире в единую базу правил. Система разрасталась до миллионов правил, но все равно пасовала в простейших ситуациях, при этом огромный объем ненужных данных лишь замедлял ее работу.
Проблема хрупкости (brittleness problem): Реальный мир, по мнению Домингоса, не является черно-белым, каким его хочет видеть классическая логика. В медицине врач почти никогда не знает диагноз со стопроцентной уверенностью, речь всегда идет о вероятностях. Попытки добавить в экспертные системы «коэффициенты уверенности» привели к хаосу и неверным выводам. Использование полноценной теории вероятностей в 1960-х годах казалось ученым экспоненциально сложным и вычислительно невозможным, поэтому от него отказались в пользу эвристик.

Решением проблемы бутылочного горлышка стало машинное обучение: вместо интервьюирования экспертов системы начали автоматически извлекать знания из накопленных данных. Переход от инженерии знаний к машинному обучению обеспечил колоссальный прогресс ИИ в последние три десятилетия, поскольку с ростом объемов данных системы умнеют фактически бесплатно.

Проблему хрупкости удалось эффективно решить лишь с появлением вероятностных графических моделей, пришедших из статистической школы компьютерного зрения. Сегодня ученые умеют эффективно совмещать вероятностный вывод со строгими правилами. Педро Домингос отмечает, что одним из его личных главных достижений в науке стала разработка математического представления, объединяющего в себе полную силу как симвоческого ИИ, так и вероятностных рассуждений.

🌳 Символьное машинное обучение: деревья решений и мифы о нейросетях 20:14

В массовом сознании сегодня существует опасное заблуждение: многие ошибочно приравнивают символический ИИ исключительно к ручной инженерии знаний, а машинное обучение — к нейросетям (коннекционизму). Профессор Домингос категорически заявляет, что это не так. Существует огромный пласт литературы по символьному машинному обучению, включая индуктивное логическое программирование (ILP). Многие задачи, возможностью решения которых сегодня так гордятся сторонники глубокого обучения, специалисты по ILP успешно щелкали еще 30 лет назад.

В рамках символического подхода для представления знаний используются не только правила формата «если-то», но и деревья решений (decision trees). Математически дерево решений эквивалентно набору правил, где каждый путь от корня к листу представляет собой отдельное логическое условие. В условиях нехватки данных деревья решений работают значительно лучше других подходов. Более того, самые эффективные на сегодняшний день алгоритмы для работы с табличными данными в коммерческих приложениях — это случайные леса (Random Forests) и градиентный бустинг, представляющие собой комбинации множества деревьев решений. В 1990-х годах исследователи обнаружили, что объединение множества моделей дает потрясающий эффект, реализуя «мудрость толпы» в машинном обучении. Именно эти алгоритмы чаще всего выигрывают соревнования на платформе Kaggle, обходя по эффективности нейросети.

Гость также подробно разбирает популярный миф о том, будто глубокое обучение обладает монополией на самостоятельное извлечение признаков (фич) из данных, избавляя от необходимости ручного проектирования. Домингос называет это утверждение ложным по двум причинам:

Нейросети, как и любые другие алгоритмы, точно так же критически зависят от базовых фич на входе, будь то сырые пиксели с камеры беспилотного автомобиля или симптомы пациента.
Способность создавать новые промежуточные абстрактные признаки из сырых данных есть и у других парадигм. В символьном обучении для этого существует целое направление, называемое «изобретением предикатов» (predicate invention), а в статистическом обучении — обнаружение скрытых переменных (latent variables).

По мнению профессора, заявления об отсутствии проектирования признаков в глубоком обучении — лукавство. То, что в классическом машинном обучении называют «проектированием признаков» (feature engineering), в мире нейросетей превратилось в «архитектурный инжиниринг» (architecture engineering). Когда исследователь конструирует сложную архитектуру сети, задает скрытые слои, механизмы внимания и связи, он математически занимается ровно тем же самым — создает правильные промежуточные признаки для алгоритма.

⚔️ Противостояние титанов: Маркус против Хинтона и путь к гибридизации 38:10

Жесткая полемика между сторонниками символизма и коннекционизма (нейросетей) ведется с 1950-х годов, являясь центральной темой всей истории ИИ. Ярким примером этого противостояния в публичном поле долгое время служили жаркие дебаты между психолингвистом Гэри Маркусом (Gary Marcus) и «крестным отцом» глубокого обучения Джеффри Хинтоном (Geoffrey Hinton).

Маркус представляет традицию MIT, CMU и Стэнфорда — его учителем был Стивен Пинкер, воспитанник Ноама Хомского, чьи взгляды на язык полностью соответствуют символическому подходу. Хинтон же последовательно развивает коннекционизм с 1970-х годов. В 1980-х годах символисты во главе с Пинкером аргументированно доказали, что тогдашние нейросети принципиально не способны решать сложные языковые задачи, и на тот момент они выиграли спор. Сегодня коннекционисты научились справляться со многими из тех вызовов (например, со схемами Винограда), но фундаментальная дискуссия продолжается.

Педро Домингос убежден, что этот многолетний спор завершится исключительно полной интеграцией обеих парадигм, и этот процесс уже активно идет. В качестве примера эксперт приводит легендарную систему AlphaGo от DeepMind. Ее триумф над человеком в игру го стал возможен благодаря комбинации трех элементов:

Поиск по дереву Монте-Карло (Monte Carlo Tree Search) — метод символического ИИ, который символисты использовали для игры в го задолго до прихода нейросетей.
Глубокие сверточные нейросети для визуального анализа позиций на игровой доске.
Обучение с подкреплением (Reinforcement Learning).

🚀 Современное применение и разделение труда: от Бури в пустыне до моделей OpenAI o1 45:03

Между парадигмами ИИ сегодня существует естественное и логичное разделение труда, напоминающее концепцию двух систем мышления человека Даниэла Канемана.

По мнению Домингоса, коннекционизм идеально подходит для задач «Системы 1»:

Низкоуровневые процессы: распознавание образов, компьютерное зрение, обработка речи и базовое понимание контекста. В этих областях символистам делать нечего, здесь нейросети безраздельно доминируют.

Символический подход незаменим для задач «Системы 2»:

Высокоуровневое логическое мышление, долгосрочное планирование, рассуждения и строгие вычисления.

Наглядным историческим примером мощи символического ИИ профессор называет операцию «Буря в пустыне» во время войны в Персидском заливе. Тогда США за кратчайшие сроки перебросили 400 тысяч солдат и всю сопутствующую инфраструктуру. Эта сложнейшая логистическая задача была полностью не под силу классическим методам исследования операций, и ее успешно решили автоматизированные системы планирования на базе символического ИИ, просчитавшие, что, куда и в какой последовательности должно быть доставлено. Сегодня логические SAT-солверы и системы автоматического доказательства теорем массово применяются для верификации программного обеспечения и проектирования топологии интегральных микросхем.

Возвращаясь к сегодняшнему дню, Домингос комментирует новые флагманские модели рассуждений, такие как OpenAI o1. Профессор отмечает, что сами по себе большие языковые модели (LLM) — это коннекционистский субстрат, который изначально не умеет хорошо решать математические задачи или логически рассуждать. Ирония судьбы заключается в том, что обычный карманный калькулятор в вопросах точного сложения длинных чисел оказывается умнее, чем ChatGPT, которая при огромных объемах вычислений на больших цифрах спотыкается. Именно поэтому разработчики из OpenAI начали прививать нейросетям методы дискретного поиска и построения цепочек рассуждений, заимствованные напрямую из традиционного символического ИИ. Независимо от того, признают ли это сами технологические компании публично, интеграция символических подходов — это единственный путь к созданию по-настоящему надежного интеллекта.