Как сделать GenAI реально полезным: уроки Стэнфорда и OpenAI

Практическое применение генеративного ИИ требует перехода от простого «общения» с чат-ботами к глубокому пониманию архитектуры систем, окружающей модели. В рамках вебинара Stanford Online эксперты из индустрии и академической среды обсудили, как современные LLM (Large Language Models) обретают свои возможности и почему успех продукта на 90% зависит от того, что происходит «вокруг» нейросети.

В дискуссии приняли участие Кристофер Поттс (Christopher Potts), профессор лингвистики Стэнфордского университета, и Мишель Покрасс (Michelle Pokrass), руководитель группы исследований пост-тренинга в OpenAI. Модератором выступил Адитья Чаллапалли (Aditya Challapally), инженер по машинному обучению в Microsoft.

🧠 Природа моделей: Базовые vs Пост-обученные 2:18

Одним из главных заблуждений в индустрии Кристофер Поттс считает недооценку способностей «базовых» моделей (base models) — тех, что еще не прошли стадию тонкой настройки (fine-tuning) . По его словам, такие модели обладают колоссальным скрытым потенциалом и креативностью, хотя и остаются менее предсказуемыми. Пост-тренинг, которым занимается команда Мишель Покрасс в OpenAI, — это процесс «извлечения» этих скрытых возможностей и приведения их в соответствие с человеческими предпочтениями .

Мишель Покрасс поясняет разницу на наглядном примере:

Базовая модель: Обучена предсказывать следующий токен на огромном массиве данных. Если спросить её «Как ездить на велосипеде?», она может ответить списком других вопросов: «Как водить машину?», «Как плавать?» . Она не осознает себя как помощника.
Пост-обученная модель (ChatGPT): Это результат выравнивания (alignment), когда модель учат быть полезным ассистентом .

Главный инсайт Мишель заключается в том, что способности ИИ часто являются «эмерджентными» (возникающими спонтанно при масштабировании) . Никто в OpenAI изначально не планировал, что GPT-4 будет феноменально писать код — эта способность проявилась сама по мере роста масштаба обучения.

🛠 Эволюция GPT-4: От бенчмарков к реальным нуждам разработчиков 7:45

Создание модели GPT-4.1 стало важным этапом, когда фокус сместился с максимизации «абстрактного интеллекта» на конкретную применимость для разработчиков .

Группа пост-тренинга OpenAI выделила четыре приоритета для этой версии:

Длинный контекст: Способность обрабатывать огромные пакеты документов без потери качества.
Вызов инструментов (tool calling): Повышение «упорства» модели при обращении к внешним API и софту .
Написание кода: Улучшение логики программирования.
Следование инструкциям (instruction following): Способность точно выполнять десятки условий в одном промте .

По словам Мишель, ключевым отличием в разработке стало использование внутренних систем оценки (evals), основанных на реальных сценариях использования, а не на общедоступных академических тестах .

🏗 Системный подход: Важность «обвязки» 10:42

Кристофер Поттс утверждает: отличная модель в плохой системе — это плохой продукт . Если вы ожидаете от ИИ генерацию JSON-кода, но неправильно настроили параметры выборки (sampling) или программную среду, вы получите «мусор» на выходе, в чем не будет вины самой модели.

Успех GenAI-продукта зависит от качества инструментов, к которым у модели есть доступ, и от того, насколько хорошо спроектировано ПО вокруг неё . Мишель Покрасс добавляет, что сейчас на рынке наблюдается «capabilities overhang» (избыток возможностей): даже если развитие моделей остановится на уровне GPT-4, человечеству понадобится еще около пяти лет, чтобы реализовать весь потенциал этой технологии через создание качественных системных оболочек .

⚖️ Проблема ценностей и «душа» ИИ 18:11

Вопрос о том, чьи ценности кодируются в ИИ, остается дискуссионным. Мишель Покрасс отмечает, что создать модель, свободную от предвзятости (bias-free) для всех людей на Земле, невозможно . OpenAI решает это через публикацию «Model Spec» — открытого документа, описывающего желаемое поведение модели, и приглашает всё общество к его обсуждению .

Кристофер Поттс предлагает «неочевидный» подход к обучению нормам: модель нельзя обучить избегать табуированных тем (например, ругательств), просто удалив их из обучающей выборки . В таком случае ИИ вырастет «наивным» и не будет понимать контекста. Правильный путь — показать модели запрещенный контент и четко проинструктировать её, почему и когда его нельзя использовать .

📈 Революция в оценке: Как сделать ИИ полезным 38:23

Самым важным фактором успеха ИИ-стартапов эксперты называют наличие собственных систем оценки — evals .

Практические советы от Кристофера Поттса и Мишель Покрасс:

Начните с малого: Даже 12 вручную описанных кейсов «правильного» поведения системы лучше, чем бесконечное тестирование на живых пользователях или слепое доверие бенчмаркам из Твиттера .
Используйте few-shot примеры: Вместо того чтобы 50 раз умолять модель «сделай вот так», просто дайте в промте 3–5 примеров «вход — идеальный выход» .
LLM как судья: Использование мощной модели для оценки работы более слабой модели (или системы в целом) крайне эффективно . Чтобы избежать путаницы, разбивайте сложные критерии оценки на отдельные проходы.
Синтетические данные: Кристофер Поттс призывает отбросить академический снобизм относительно «только человеческих данных» . Синтетические данные позволяют быстрее искать ошибки и «галлюцинации» системы.

🔮 Взгляд в будущее: Интерпретируемость 47:44

В завершение Кристофер Поттс высказал оптимистичный прогноз относительно «прозрачности» нейросетей. Существует миф, что нейронные сети — это «черный ящик», который принципиально не поддается анализу . Однако исследования показывают обратное: по мере роста качества моделей в них спонтанно формируются структуры, которые человек может интерпретировать . Это открывает двери для глубокого научного понимания того, как именно ИИ обобщает знания и принимает решения.