Перси Лян: «Цепочки рассуждений в нейросетях могут быть уловкой для продажи токенов»

На лекции курса CS221 в Стэнфорде профессор Перси Лян и модератор Кен обсудили стремительную эволюцию искусственного интеллекта — от академических основ до глобального культурного феномена. В рамках «беседы у камина» участники проанализировали, как изменилась роль исследователя в эпоху доминирования больших языковых моделей и почему будущим инженерам стоит сосредоточиться не на написании кода, а на поиске смыслов.

🎓 Путь от ручных грамматик к машинному обучению 1:05

Перси Лян вспоминает свое обучение в бакалавриате MIT в начале 2000-х годов, когда ИИ был сосредоточен на теории и алгоритмах, а не на данных . В то время в обработке естественного языка (NLP) доминировали «ручные» грамматики, которые Лян считал бесперспективными из-за невозможности их масштабирования .

Переломным моментом стал 2005 год, когда Лян начал работать над прообразом современных языковых моделей.

Технология: Это была марковская модель, а не трансформер .
Масштаб данных: Обучение велось на 100 миллионах слов, в то время как современные модели используют триллионы .
Результат: Модель самостоятельно научилась кластеризовать названия городов и дней недели. По мнению Ляна, это были первые зачатки «эмерджентных способностей», которые подтолкнули его к серьезным исследованиям в области ИИ .

Лян признает, что 20 лет назад никто не обладал достаточным воображением, чтобы предсказать появление GPT-3 или GPT-5 просто за счет масштабирования той же идеи . По его словам, даже исследователи из OpenAI не знали наверняка, наступит ли этот прорыв в 2020 или 2050 году .

🌍 ИИ вне лаборатории: восприятие и реальность 5:42

За последние три года ИИ превратился из узкоспециальной темы в глобальное явление, сравнимое с появлением интернета . Теперь национальные стратегии и рекламные щиты на шоссе 101 посвящены нейросетям . Однако общественное восприятие технологии часто искажено.

Перси Лян выделяет следующие аспекты восприятия ИИ:

Культурный разрыв: На Западе преобладает мрачное видение ИИ в духе «Терминатора», тогда как на Востоке к технологии относятся более оптимистично .
Багаж научной фантастики: Идея «разумного агента», который входит в дверь, чтобы уничтожить мир, мешает видеть реальность. По мнению Ляна, ИИ — это скорее невидимая инфраструктура, работающая в фоновом режиме ваших смартфонов и таблиц .
Недооцененные возможности: Профессор считает, что люди недостаточно ценят фундаментальную способность моделей предсказывать следующий токен. Именно минимизация перплексии (показатель неопределенности модели) на длинных контекстах (до миллиона токенов) является истинным мерилом интеллекта, а не публичные лидерборды .
Переоцененные возможности: Лян скептически относится к нынешним «цепочкам рассуждений» (thinking traces). По его мнению, зачастую это выглядит как длинный, путаный и неэффективный процесс, который может быть «уловкой для генерации большего количества токенов» .

🏫 Роль университета в эпоху гигантов 13:40

В студенческой среде растет беспокойство, что роль академии снижается из-за нехватки вычислительных ресурсов по сравнению с Google или OpenAI . Перси Лян не согласен с этим, утверждая, что академическая наука всегда находилась «на обочине», занимаясь вещами, которые едва работают .

По мнению Ляна, у университетов есть уникальные задачи, которые индустрия игнорирует из-за конфликта интересов:

Фундаментальные исследования («Blue-sky research»): Поиск новых архитектур, которые придут на смену трансформерам .
Этика и право: Изучение проблем авторского права и запоминания контента моделями. Лаборатории не будут этим заниматься, так как на них уже подают в суд .
Честная оценка: Разработка независимых методов тестирования моделей, выявляющих их недостатки, а не только рекламирующих возможности .

💼 Карьера: от «исполнителя» к «архитектору смыслов» 18:05

Лян подтверждает, что спрос на разработчиков начального уровня (entry-level) с традиционным набором навыков падает . Однако это не означает исчезновения профессий, а лишь их трансформацию. Как калькуляторы не лишили людей работы, а избавили от рутинных вычислений, так и ИИ освобождает инженеров для более глубоких задач .

Главный совет профессора будущим выпускникам:

Переходите от вопроса «как построить?» к вопросу «что именно стоит строить?» . Если приложение можно создать за 5 минут, ценность будет представлять только сама идея и ее полезность для людей .
Ищите возможности вне IT: применение ИИ в материаловедении, изучении климата, ДНК и нейронауках сейчас недооценено .

При выборе первой работы Лян рекомендует использовать стратегию «исследования, а не эксплуатации» (exploration vs exploitation) . Главным критерием должен быть потенциал роста и команда, у которой можно учиться, а не громкое имя компании . Профессор отмечает, что многие успешные лидеры имели извилистый карьерный путь, поэтому отсутствие стажировки в престижном месте на втором курсе не является катастрофой .

🛠️ Обновление курса CS221 и прозрачность индустрии 26:45

В 2025 году структура курса CS221 была пересмотрена, чтобы соответствовать реалиям. Лян внедрил формат «исполняемых лекций», где концепции сразу привязаны к коду, чтобы избежать разрыва между теорией и практикой . Также в курс добавлены модули по социальному воздействию ИИ .

Обсуждая закрытость современных ИИ-лабораторий, Лян выделяет три причины отсутствия прозрачности:

Конкуренция: Желание сохранить торговые секреты .
Судебные иски: Опасения по поводу данных, на которых обучались модели .
Приоритеты: У инженеров в гонке за результатом просто нет времени на подготовку подробных отчетов для публики .

В завершение Лян подчеркнул важность «гибкости» (grit) и умения сотрудничать. В отличие от университетских заданий, реальная работа всегда коллективна, и навыки взаимодействия становятся решающими в быстро меняющемся мире .