Кэл Ньюпорт: «ChatGPT не обладает разумом, это просто генератор слов»

Cal Newport 16,3 тыс. 1 ч 28 мин 3 мин 17.04.2023
Главное

Технологии будущего: Кэл Ньюпорт о том, как работает ChatGPT и почему не стоит бояться «инопланетного разума» 0:00

Автор подкаста Deep Questions Кэл Ньюпорт недавно опубликовал в журнале The New Yorker подробное исследование, посвященное работе больших языковых моделей (LLM) и их влиянию на общество. На фоне ажиотажа вокруг ChatGPT, вызвавшего в последние месяцы как восторг от креативности алгоритмов, так и опасения по поводу вытеснения людей из экономики, Ньюпорт призывает к более трезвому взгляду на эти технологии. По его мнению, рассматривать ИИ как «черный ящик», способный на непредсказуемые действия — значит поддаваться необоснованным страхам.

Механика «магии»: как нейросеть «угадывает» слова 13:01

Чтобы развенчать мифы вокруг искусственного интеллекта, Ньюпорт предлагает взглянуть на базовые принципы работы таких моделей, как ChatGPT. Несмотря на кажущуюся «разумность», процесс их работы сводится к пяти ключевым концепциям:

  1. Угадывание следующего слова (Word Guessing). Модель работает как авторегрессивная система: она получает фрагмент текста и предсказывает, какое одно слово должно следовать за ним. Затем она добавляет это слово к исходному тексту и снова делает предсказание, раз за разом наращивая ответ. У системы нет «памяти» в привычном понимании: каждый раз она заново обрабатывает всю последовательность и выдает следующий токен.
  2. Поиск релевантных совпадений. В основе работы лежит сопоставление входных данных с огромным массивом текстов, на которых модель была обучена («Source text»). Она ищет контекстные совпадения, чтобы понять, какие слова обычно следуют за похожими фразами.
  3. Голосование (Voting). Вместо простого выбора система рассчитывает вероятностное распределение для всех возможных слов из своего словаря (около 50 000 токенов). Это «голосование» основано на том, как часто определенные слова встречались в обучающей выборке после подобных конструкций. Выбор следующего слова носит вероятностный характер — модель как бы бросает «взвешенную кость».
  4. Детекция признаков (Feature Detection). Модель анализирует запрос пользователя, чтобы выделить ключевые признаки (например, «инструкция», «стиль Библии короля Якова», « peanut butter sandwich»). На основе этих признаков применяются внутренние «правила», которые корректируют вероятности (усиливают или ослабляют «голоса» за определенные слова).
  5. Самообучение. В процессе обучения нейросеть получает миллиарды отрывков реального текста. Она «отрезает» последнее слово, пытается угадать его, сравнивает свой ответ с оригиналом и математически корректирует свои внутренние параметры (те самые 1.5 млн «книг» правил), чтобы в следующий раз быть точнее.

Экономика и рынок труда: революция или эволюция? 40:01

Кэл Ньюпорт утверждает, что успех ChatGPT в генерации связных ответов — это не признак появления гибкого интеллекта, а результат феноменального объема обучающих данных.

Почему ИИ не станет «самосознающим» 46:01

По мнению Ньюпорта, опасения по поводу «инопланетного интеллекта», который поработит человечество, лишены архитектурных оснований. Программы вроде ChatGPT — это статичные сущности. После завершения обучения их «веса» (внутренние параметры) не меняются в процессе использования. Для наличия сознания или самосознания необходима «маневренная память» и возможность обновлять модель самого себя в меняющемся мире, чего у LLM-архитектуры просто нет.

Закат эпохи социальных сетей?

В завершение обсуждения Ньюпорт прокомментировал недавнее решение NPR прекратить использование Twitter. По его мнению, это позитивная тенденция. Ньюпорт уверен, что архитектура Twitter (ретвиты, бесконечные ленты, алгоритмы отбора контента) намеренно провоцирует возмущение, поляризацию и создает искаженную картину мира. Будущее за более «частными садами» — личными сайтами, подкастами и рассылками, где эксперты и СМИ могут доносить информацию без посредничества «смесителя» алгоритмов.

💬 Цитаты

«Мы вызвали инопланетный интеллект, мы мало что знаем о нем, кроме того, что он невероятно мощный.»

Кэл Ньюпорт 09:31

«Это не Hal из «Космической одиссеи 2001», это не инопланетный интеллект.»

Кэл Ньюпорт 48:37
👥 Спикеры
📚 Упомянутые книги
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
LLM (Large Language Model)
Большая языковая модель, обученная на огромных массивах текста для предсказания следующего элемента последовательности.
Токен
Базовая единица текста (слово, часть слова или знак), которую обрабатывает нейросеть.
Авторегрессия
Метод генерации текста, при котором модель предсказывает каждый следующий элемент, основываясь на предыдущих.
Transformer
Архитектура нейронных сетей, позволяющая эффективно обрабатывать длинные последовательности данных с помощью механизма внимания.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект ChatGPT Cal Newport Large Language Models AI LLM