Кэл Ньюпорт: «ChatGPT не обладает разумом, это просто генератор слов»

Технологии будущего: Кэл Ньюпорт о том, как работает ChatGPT и почему не стоит бояться «инопланетного разума» 0:00

Автор подкаста Deep Questions Кэл Ньюпорт недавно опубликовал в журнале The New Yorker подробное исследование, посвященное работе больших языковых моделей (LLM) и их влиянию на общество. На фоне ажиотажа вокруг ChatGPT, вызвавшего в последние месяцы как восторг от креативности алгоритмов, так и опасения по поводу вытеснения людей из экономики, Ньюпорт призывает к более трезвому взгляду на эти технологии. По его мнению, рассматривать ИИ как «черный ящик», способный на непредсказуемые действия — значит поддаваться необоснованным страхам.

Механика «магии»: как нейросеть «угадывает» слова 13:01

Чтобы развенчать мифы вокруг искусственного интеллекта, Ньюпорт предлагает взглянуть на базовые принципы работы таких моделей, как ChatGPT. Несмотря на кажущуюся «разумность», процесс их работы сводится к пяти ключевым концепциям:

Угадывание следующего слова (Word Guessing). Модель работает как авторегрессивная система: она получает фрагмент текста и предсказывает, какое одно слово должно следовать за ним. Затем она добавляет это слово к исходному тексту и снова делает предсказание, раз за разом наращивая ответ. У системы нет «памяти» в привычном понимании: каждый раз она заново обрабатывает всю последовательность и выдает следующий токен.
Поиск релевантных совпадений. В основе работы лежит сопоставление входных данных с огромным массивом текстов, на которых модель была обучена («Source text»). Она ищет контекстные совпадения, чтобы понять, какие слова обычно следуют за похожими фразами.
Голосование (Voting). Вместо простого выбора система рассчитывает вероятностное распределение для всех возможных слов из своего словаря (около 50 000 токенов). Это «голосование» основано на том, как часто определенные слова встречались в обучающей выборке после подобных конструкций. Выбор следующего слова носит вероятностный характер — модель как бы бросает «взвешенную кость».
Детекция признаков (Feature Detection). Модель анализирует запрос пользователя, чтобы выделить ключевые признаки (например, «инструкция», «стиль Библии короля Якова», « peanut butter sandwich»). На основе этих признаков применяются внутренние «правила», которые корректируют вероятности (усиливают или ослабляют «голоса» за определенные слова).
Самообучение. В процессе обучения нейросеть получает миллиарды отрывков реального текста. Она «отрезает» последнее слово, пытается угадать его, сравнивает свой ответ с оригиналом и математически корректирует свои внутренние параметры (те самые 1.5 млн «книг» правил), чтобы в следующий раз быть точнее.

Экономика и рынок труда: революция или эволюция? 40:01

Кэл Ньюпорт утверждает, что успех ChatGPT в генерации связных ответов — это не признак появления гибкого интеллекта, а результат феноменального объема обучающих данных.

Риски автоматизации. Модели не обладают пониманием того, о чем они пишут. Например, на платформе Stack Overflow запретили использование ответов ИИ, так как они часто звучат убедительно, но содержат фактические ошибки.
Сфера применения. ИИ будет полезен там, где нужно переписать текст в другом стиле, синтезировать информацию или помочь с черновой работой, но он не заменит специалистов, выполняющих сложную, контекстуальную работу.
Будущее логистики. Настоящая «тихая» революция произойдет не в генерации текстов, а в автоматизации мелких задач (назначение встреч, сбор данных), когда ИИ-агенты смогут взаимодействовать друг с другом напрямую.

Почему ИИ не станет «самосознающим» 46:01

По мнению Ньюпорта, опасения по поводу «инопланетного интеллекта», который поработит человечество, лишены архитектурных оснований. Программы вроде ChatGPT — это статичные сущности. После завершения обучения их «веса» (внутренние параметры) не меняются в процессе использования. Для наличия сознания или самосознания необходима «маневренная память» и возможность обновлять модель самого себя в меняющемся мире, чего у LLM-архитектуры просто нет.

Закат эпохи социальных сетей?

В завершение обсуждения Ньюпорт прокомментировал недавнее решение NPR прекратить использование Twitter. По его мнению, это позитивная тенденция. Ньюпорт уверен, что архитектура Twitter (ретвиты, бесконечные ленты, алгоритмы отбора контента) намеренно провоцирует возмущение, поляризацию и создает искаженную картину мира. Будущее за более «частными садами» — личными сайтами, подкастами и рассылками, где эксперты и СМИ могут доносить информацию без посредничества «смесителя» алгоритмов.