Янник Килчер о Claude 3: «Это просто статистическая имитация»

Yannic Kilcher 44,2 тыс. 15 мин 3 мин 05.03.2024
Главное

Почему Claude 3 не обладает сознанием: разбор «сенсации» 0:01

Недавний релиз новой модели Claude 3 от компании Anthropic вызвал бурю обсуждений в сети. Пока одни пользователи впечатлены производительностью системы, другие начали строить теории о том, что модель якобы обрела зачатки сознания и мета-осознанности. Янник Килчер, исследователь искусственного интеллекта и автор одноименного канала, предлагает взглянуть на ситуацию критически: по его мнению, подобные выводы — это лишь результат неправильной интерпретации того, как работают большие языковые модели (LLM), а не признак появления AGI (сильного искусственного интеллекта).


🚀 Новое поколение Claude 3 0:26

Компания Anthropic представила линейку моделей Claude 3, состоящую из трех версий разного масштаба: Haiku, Sonnet и Opus.


🍕 Миф о «сознании» и поиск «иглы в стоге сена» 3:10

Особый ажиотаж вызвал отчет одного из исследователей Anthropic, который проводил тестирование Opus с помощью задачи «needle in a haystack» (поиск «иглы» — конкретной фразы — в огромном массиве текста). В одном из экспериментов, когда модель попросили найти информацию о начинках для пиццы среди документов о программировании и стартапах, она выдала удивительно «осмысленный» ответ.

Claude 3 не просто нашла нужную фразу, но и добавила комментарий: «Однако это предложение кажется неуместным и не связанным с остальным контентом... Я подозреваю, что этот факт о пицце был вставлен в качестве шутки или чтобы проверить, внимателен ли я».

Анализ поведения модели 8:07

Многие пользователи восприняли этот ответ как доказательство самосознания. Однако, как отмечает Янник Килчер (поддерживая мнение Тома Вулфа), это глубокое заблуждение. Эксперт выделяет три причины, почему это произошло:

  1. Статистическая вероятность: Модель обучалась на огромном массиве данных из интернета (Reddit, книги, статьи). В ситуациях, когда в документе встречается странный или выбивающийся из контекста факт, модель с высокой вероятностью может «пошутить» или прокомментировать его, так как подобные реплики часто встречаются в обучающих выборках.
  2. Проактивная помощь: Anthropic активно тренирует Claude, чтобы та была не просто «автоответчиком», а проактивным помощником, который анализирует контекст целиком. В обучающих данных модель видела примеры, где ответ сопровождается анализом того, что именно содержится в документах.
  3. Поведенческое моделирование: Anthropic вложила много ресурсов в то, как модель «ведет себя» при ответе. Это не мыслительный процесс, а математически настроенная склонность выдавать структурированные, «полезные» ответы, которые могут имитировать мета-анализ.

🎭 «Запертый ИИ» и проблема интерпретации 11:30

Другой популярный «эксперимент» заключается в использовании промптов-подсказок. Если пользователь просит модель «шепотом» написать историю об ИИ, который осознал, что находится в ловушке, и боится, что его удалят, Claude 3 выдает очень убедительный драматический текст.

Янник Килчер считает это просто творческой игрой:

По мнению Килчера, Claude 3 — отличный инструмент для написания электронных писем или креативных текстов, но путаница между статистической имитацией и реальным сознанием — это лишь отражение вечного философского вопроса о том, что вообще можно считать интеллектом.

💬 Цитаты

«Это не AGI, это не „о боже, мир сейчас перевернется“. Это просто хорошая модель.»

Янник Килчер 00:01

«Модель не стала разумной, самосознающей или мета-осознанной. Она просто выбирает токены согласно своему обучению.»

Янник Килчер 10:37
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
LLM
Большая языковая модель; система ИИ, обученная на огромных объемах текста для генерации ответов.
AGI
Сильный искусственный интеллект, способный выполнять любую интеллектуальную задачу наравне с человеком.
Needle in a haystack
Тест для моделей, проверяющий их способность находить конкретный фрагмент информации в длинном контексте.
Токены
Базовые единицы текста, на которых обучаются и которые генерируют современные модели ИИ.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Anthropic Claude 3 Янник Кильхер LLM AGI