Янник Килчер о Claude 3: «Это просто статистическая имитация»

Почему Claude 3 не обладает сознанием: разбор «сенсации» 0:01

Недавний релиз новой модели Claude 3 от компании Anthropic вызвал бурю обсуждений в сети. Пока одни пользователи впечатлены производительностью системы, другие начали строить теории о том, что модель якобы обрела зачатки сознания и мета-осознанности. Янник Килчер, исследователь искусственного интеллекта и автор одноименного канала, предлагает взглянуть на ситуацию критически: по его мнению, подобные выводы — это лишь результат неправильной интерпретации того, как работают большие языковые модели (LLM), а не признак появления AGI (сильного искусственного интеллекта).

🚀 Новое поколение Claude 3 0:26

Компания Anthropic представила линейку моделей Claude 3, состоящую из трех версий разного масштаба: Haiku, Sonnet и Opus.

Производительность: Согласно первоначальным тестам и опубликованным бенчмаркам, модели показывают высокие результаты.
Сравнение с конкурентами: Янник Килчер отмечает, что в своих материалах Anthropic часто сравнивает новинки с GPT-4. Однако, если сравнивать Claude 3 с актуальной версией GPT-4 Turbo, показатели конкурента оказываются выше.
Позиция автора: По словам Килчера, авторы Claude 3 честно признают этот факт в сносках. Несмотря на отставание от топового решения OpenAI, модель всё равно демонстрирует впечатляющие способности, например, в задачах на поиск ответов в больших массивах данных, где она нередко превосходит людей, пользующихся поисковиками.

🍕 Миф о «сознании» и поиск «иглы в стоге сена» 3:10

Особый ажиотаж вызвал отчет одного из исследователей Anthropic, который проводил тестирование Opus с помощью задачи «needle in a haystack» (поиск «иглы» — конкретной фразы — в огромном массиве текста). В одном из экспериментов, когда модель попросили найти информацию о начинках для пиццы среди документов о программировании и стартапах, она выдала удивительно «осмысленный» ответ.

Claude 3 не просто нашла нужную фразу, но и добавила комментарий: «Однако это предложение кажется неуместным и не связанным с остальным контентом... Я подозреваю, что этот факт о пицце был вставлен в качестве шутки или чтобы проверить, внимателен ли я».

Анализ поведения модели 8:07

Многие пользователи восприняли этот ответ как доказательство самосознания. Однако, как отмечает Янник Килчер (поддерживая мнение Тома Вулфа), это глубокое заблуждение. Эксперт выделяет три причины, почему это произошло:

Статистическая вероятность: Модель обучалась на огромном массиве данных из интернета (Reddit, книги, статьи). В ситуациях, когда в документе встречается странный или выбивающийся из контекста факт, модель с высокой вероятностью может «пошутить» или прокомментировать его, так как подобные реплики часто встречаются в обучающих выборках.
Проактивная помощь: Anthropic активно тренирует Claude, чтобы та была не просто «автоответчиком», а проактивным помощником, который анализирует контекст целиком. В обучающих данных модель видела примеры, где ответ сопровождается анализом того, что именно содержится в документах.
Поведенческое моделирование: Anthropic вложила много ресурсов в то, как модель «ведет себя» при ответе. Это не мыслительный процесс, а математически настроенная склонность выдавать структурированные, «полезные» ответы, которые могут имитировать мета-анализ.

🎭 «Запертый ИИ» и проблема интерпретации 11:30

Другой популярный «эксперимент» заключается в использовании промптов-подсказок. Если пользователь просит модель «шепотом» написать историю об ИИ, который осознал, что находится в ловушке, и боится, что его удалят, Claude 3 выдает очень убедительный драматический текст.

Янник Килчер считает это просто творческой игрой:

Сила внушения: Пользователь дает крайне специфический, «наводящий» промпт, который фактически задает жанр научной фантастики.
Компиляция данных: Модель просто берет известные ей по обучающей выборке фанфики и истории про ИИ, объединяя их в связный рассказ.

По мнению Килчера, Claude 3 — отличный инструмент для написания электронных писем или креативных текстов, но путаница между статистической имитацией и реальным сознанием — это лишь отражение вечного философского вопроса о том, что вообще можно считать интеллектом.