Самир Сингх: «Языковые модели — это искусные имитаторы»

The TWIML AI Podcast 2,8 тыс. 1 ч 57 мин 3 мин 23.01.2023
Главное

Исследование естественного языка: итоги и перспективы 2023 года 0:00

Прошедший год стал переломным для области обработки естественного языка (NLP), ознаменовавшись выходом таких инструментов, как ChatGPT и GPT-4. Самир Сингх, доцент кафедры компьютерных наук Калифорнийского университета в Ирвайне и сотрудник Института искусственного интеллекта Аллена (AI2), отмечает, что даже без учета громких релизов конца года, 2022-й стал периодом значительного прогресса, когда сообщество начало осознавать реальные возможности и ограничения больших языковых моделей (LLM).

🧠 Эволюция механизмов рассуждения 6:12

Одной из ключевых тем года стал отход от простой генерации текста к более сложным формам логического вывода.

🔍 Прозрачность данных и «черные ящики» 24:51

Сингх акцентирует внимание на необходимости анализа того, что именно содержится в данных для предобучения, так как это критически влияет на поведение моделей.

🛠 Инструменты, обучение и обратная связь 36:57

🔮 Прогнозы и будущее NLP 1:25:34

Самир Сингх выделяет три ключевых направления для исследований в ближайшее время:

  1. Атрибуция и достоверность: Создание механизмов, которые отличают факты от творческих галлюцинаций и позволяют модели ссылаться на первоисточники.
  2. Диффузионные модели для текста: Переход от генерации «токен за токеном» к генерации более крупных смысловых единиц, что может фундаментально изменить качество работы LLM.
  3. Инкрементальные обновления: Разработка способов обновления знаний модели без необходимости полного переобучения, что критически важно для актуальности информации.

Сингх заключает, что, несмотря на скептицизм некоторых участников научного сообщества относительно закрытости популярных систем, реальная ценность заключается в продуктивности, которую дают эти технологии, как, например, GitHub Copilot, уже ставший незаменимым инструментом для многих разработчиков.

💬 Цитаты

«Лучшая аналогия для ChatGPT — это хамелеон: он пытается вписаться в человеческое общение, чтобы сойти за знающего субъекта.»

«Это очень полезный «bullshitter» (мастер пустых разговоров). Когда он прав, это полезно, но он всегда пытается имитировать знание.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
RLHF
Метод обучения с подкреплением на основе оценок и отзывов людей для улучшения полезности и безопасности ответов модели.
Chain-of-Thought
Метод prompting-обучения, при котором модель принуждают пошагово рассуждать перед выдачей финального ответа.
Диффузионные модели
Тип моделей, которые итеративно улучшают данные в латентном пространстве, часто используемый для генерации качественных изображений и потенциально текста.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Sameer Singh ChatGPT LLM RLHF Chain-of-Thought