Томас Диттерих: «Современный ИИ — это консервативная технология»

Эволюция ИИ: От экспертных систем к нейросимволическому будущему 0:25

В интервью каналу Eye on AI профессор Томас Диттерих (Thomas Dietterich), один из пионеров машинного обучения, чья карьера началась еще в 1977 году, анализирует путь развития технологий ИИ — от ранних попыток кодирования человеческих знаний до современных моделей, основанных на глубоком обучении и архитектуре трансформеров. Главный тезис эксперта заключается в том, что, несмотря на впечатляющие успехи генеративного ИИ, поле машинного обучения сталкивается с фундаментальными проблемами, такими как неспособность систем работать с новизной и отсутствие теоретической базы для объяснения того, почему современные нейросети работают настолько эффективно.

История и эволюция методов обучения 0:37

Томас Диттерих выделяет несколько этапов в развитии искусственного интеллекта:

Ранний этап (1950-е — 1970-е): Основное внимание уделялось попыткам формализовать человеческие знания в виде программного кода. Ярким примером стала программа Артура Сэмюэля (Arthur Samuel) из IBM для игры в шашки, которая достигла уровня хорошего любителя.
Эра экспертных систем (1980-е): В этот период доминировали системы, построенные на интервьюировании экспертов для создания узкоспециализированных баз знаний и правил (например, для медицинской диагностики или идентификации грибов).
Становление машинного обучения: Диттерих был в числе небольшой группы исследователей, которые еще в 1980 году на первом профильном семинаре в Университете Карнеги — Меллон настаивали на альтернативном пути: обучении компьютеров на основе данных, а не через прямое кодирование правил экспертами.

По словам профессора, ключевой особенностью глубокого обучения стала способность моделей самостоятельно «выучивать» внутренние представления данных, что значительно превзошло эффективность ручного проектирования признаков. Однако он отмечает, что современные методы «ленивы»: они хорошо работают лишь в рамках тех данных, на которых обучались, и часто не способны распознать объект, если ранее не видели ничего похожего.

Трансформеры и ограничения больших языковых моделей 14:11

Обсуждая роль современных моделей, Томас Диттерих отмечает неоднозначность их применения:

Компьютерное зрение: Профессор скептически относится к доминированию трансформеров в распознавании объектов по отдельным кадрам, считая, что сверточные нейронные сети (CNN) часто эффективнее, так как они учитывают пространственную структуру и инвариантность к сдвигу.
Работа с видео: Трансформеры показывают огромную силу при анализе видео, где механизмы внимания позволяют эффективно отслеживать сложные временные зависимости, недоступные для более простых моделей.
Фундаментальные проблемы: Главным риском Диттерих называет «Rumsfeld problem» — проблему неизвестного. Модели являются консервативными, ориентированными на прошлое технологиями.

Путь к научной достоверности: Нейросимволические системы 28:33

Одной из наиболее перспективных областей Диттерих считает создание нейросимволических архитектур, где база знаний хранится отдельно от нейросети.

Проблема хранения фактов: Профессор утверждает, что фактологические знания не должны быть зашиты в веса нейросети, так как это делает их крайне сложными для редактирования и обновления. Их лучше хранить в структурированных графах знаний или базах данных.
Символическая регрессия: Ученый с оптимизмом смотрит на развитие алгоритмов символической регрессии (например, Python-пакет PiSR). Они позволяют fitting-данным превращать их в математические формулы, которые физики могут интерпретировать, понимая, какие процессы стоят за уравнением.
Замыкание цикла: Диттерих предлагает концепцию «замыкания цикла», где большая языковая модель формулирует задачу, отдает ее на решение специализированному оптимизатору или программе доказательства теорем, а затем оценивает результат с точки зрения здравого смысла.

Безопасность и оценка неопределенности 48:42

Говоря о применении ИИ в критических областях, таких как медицина или беспилотные системы, Диттерих подчеркивает, что ни один статистический алгоритм не гарантирует стопроцентную надежность.

Оценка неопределенности: Вместо слепой веры в ответ ИИ, системы должны уметь количественно оценивать свою неуверенность. Если модель не уверена в результате, она должна передавать управление другим методам принятия решений.
Борьба с галлюцинациями: Профессор критикует существующие методы самопроверки ИИ, такие как «P-true» (запрос модели оценить собственный ответ «да/нет»), называя их неэффективными.

В завершение беседы Томас Диттерих выразил уверенность, что, несмотря на хайп, «суперинтеллект» не появится в ближайшее время, а перед исследователями стоит множество открытых и захватывающих задач, требующих глубокой научной работы, а не только инженерных экспериментов.