Тим Скарфе и Томас Диттерих о парадоксе ChatGPT: почему ИИ все еще не умеет рассуждать

Machine Learning Street Talk 40,3 тыс. 1 ч 8 мин 5 мин 16.10.2024
Главное

В рамках подкаста Machine Learning Street Talk ведущий Тим Скарфе (Tim Scarfe) побеседовал с профессором Томасом Диттерихом, одним из пионеров машинного обучения. В центре дискуссии — «парадокс ChatGPT»: почему системы, демонстрирующие невероятную беглость речи и широту познаний, остаются фундаментально ограниченными, как они имитируют разум и почему для создания по-настоящему надежного ИИ нам придется вернуться к принципам классической инженерии безопасности.

🧠 Природа LLM: между энциклопедией и статистическим эхом 1:05

По мнению профессора Диттериха, большие языковые модели (LLM) — это «совершенно новый зверь» в мире искусственного интеллекта . Если на протяжении десятилетий системы ИИ были узкоспециализированными (экспертные системы в медицине или проектировании), то ChatGPT впервые продемонстрировал впечатляющую широту охвата. Однако эта широта таит в себе ловушку:

Собеседники обсудили исследование «The Embers of Autoregressions», которое показывает: GPT-4 успешно сортирует слова по алфавиту в прямом порядке (75% успеха), но справляется гораздо хуже в обратном порядке, так как такие примеры реже встречаются в данных .

⚖️ Проблема неопределенности: когда ИИ «не знает, что он не знает» 10:17

Одной из главных проблем текущих моделей Диттерих считает отсутствие адекватной оценки собственной уверенности. В машинном обучении различают два типа неопределенности:

  1. Алеаторная (случайная): Шум в данных, естественная вариативность языка. Современные методы оценки уверенности ИИ (например, через вероятности токенов) измеряют именно её .
  2. Эпистемическая (знаниевая): Неопределенность, возникающая из-за отсутствия данных о конкретном предмете.

Диттерих утверждает, что существующие методы (например, многократные запросы с разной «температурой» и последующая кластеризация ответов) лишь частично решают проблему галлюцинаций . По его словам, чтобы достичь 95–100% точности, моделям, возможно, придется отказываться от ответа в 40% случаев, что сделает их менее полезными для массового пользователя .

В качестве перспективного решения профессор предлагает:

🛠 Система 1 vs Система 2: ИИ как интуиция без логики 17:34

Тим Скарфе и его гость сошлись во мнении, что современные LLM представляют собой своего рода «Систему 1» по Канеману — быструю, интуитивную, но лишенную глубокого логического анализа .

Диттерих скептичен относительно того, что архитектура трансформеров сама по себе способна к настоящему рассуждению . Он выделяет ключевые различия:

Профессор видит будущее в гибридных системах, где LLM выступает в роли интерфейса или генератора кода для формальных решателей (например, SAT-солверов или инструментов вроде Lean). Такой подход позволит объединить «интуицию» модели с математической гарантией результата .

📚 Знания вне весов: Графы знаний и «Право на забвение» 21:49

Важной темой обсуждения стала негибкость «памяти» нейросетей. Знания в LLM «вплавлены» в веса, что делает их обновление или удаление (согласно европейскому законодательству о праве на забвение) крайне сложной задачей .

Диттерих предлагает использовать LLM для построения структурированных Графов Знаний (Knowledge Graphs):

🧪 Наука и Open Source: кризис PDF и 8-битный прорыв 31:00

Профессор Диттерих, будучи модератором раздела машинного обучения на arXiv с 1998 года, отметил радикальные изменения в научной среде :

Особый интерес вызвал рассказ о коллегах из Университета Цинхуа, которые из-за санкций на поставку GPU (A100/H100) вынуждены разрабатывать методы обучения огромных моделей в 8-битном режиме на потребительских игровых видеокартах . Профессор надеется, что это сделает обучение ИИ доступным для академического сообщества, которое сейчас не может конкурировать с ресурсами OpenAI или Google.

🚧 Инженерия безопасности: почему ИИ — это «хрупкая надежность» 41:40

Обсуждая безопасность, Диттерих опирается на классическую теорию управления и работы Нэнси Левесон (Nancy Leveson). Он выделяет концепцию «Robust yet Fragile» (надежный, но хрупкий) :

Диттерих утверждает, что безопасность — это не свойство продукта, которое можно «включить» перед релизом, а непрерывный процесс контроля . Он призывает внедрять в ИИ механизмы обнаружения «почти случившихся аварий» (near misses). Если беспилотный автомобиль проехал в двух метрах от пешехода только потому, что тот вовремя отпрыгнул, система не должна считать это успехом. Она должна понимать контрфактуальную реальность: если бы пешеход не действовал, произошла бы авария .

💬 Цитаты

«Мы получаем не базу знаний, а статистическую модель базы знаний.»

Томас Диттерих 08:00

«Безопасность — это не то, что вы создаете и развертываете, это концепция постоянного управления и контроля.»

Томас Диттерих 54:20

«Архитектура трансформеров — это не предел; они великолепны для отображения последовательностей, но их способность к рассуждению под вопросом.»

Томас Диттерих 1:05:05
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
ROT13
Простой шифр подстановки, заменяющий букву на 13-ю по счету после нее в алфавите.
Эпистемическая неопределенность
Неуверенность модели, связанная с недостатком знаний или данных о конкретной области.
RAG
Технология, позволяющая языковой модели искать информацию во внешних документах перед ответом.
SAT-солвер
Программа для решения задачи выполнимости булевых формул, используется в формальной логике.
📊 Цифры
🗓 Хронология
  1. 1998 Томас Диттерих становится модератором раздела машинного обучения на arXiv.
  2. 2009 Создание датасета ImageNet (в нем еще не было моноколес и современных электросамокатов).
  3. 2023 Выпуск модели Llama от Meta, вызвавший взрыв опенсорсных исследований.
⚖️ Другая сторона
Искусственный интеллект ChatGPT OpenAI Thomas Dietterich LLM arXiv