Как ИИ-агенты меняют программирование: взгляд экспертов из Anthropic и Стэнфорда

Stanford Online 4,8 тыс. 55 мин 3 мин 01.10.2025
Главное

ИИ-агенты меняют правила игры в программировании: взгляд экспертов из Стэнфорда и Anthropic 0:09

В недавнем вебинаре Stanford Online, организованном Стэнфордским университетом, эксперты обсудили трансформацию разработки программного обеспечения под влиянием генеративного ИИ. В дискуссии приняли участие доцент факультета компьютерных наук Стэнфордского университета Эмма Бранскилл, специализирующаяся на обучении с подкреплением (RL), и Борис Черный, инженер-технический специалист из Anthropic, известный как один из создателей Claude Code. Модератором выступил Адитья Чаллапалли, инженер по машинному обучению и продакт-менеджер в Microsoft. Главная мысль встречи: мы находимся в начале экспоненциального перехода, где программирование смещается от прямого написания кода к управлению ИИ-агентами.

🛠 От написания кода к управлению агентами 15:12

Борис Черный утверждает, что роль инженера эволюционирует вместе с инструментарием, который прошел путь от физических схем и перфокарт до языков высокого уровня. Сегодняшнее программирование — это «промптинг агентов» и «манипулирование агентными транскриптами».

Эмма Бранскилл сравнивает ИИ-инструменты с бытовой техникой: не каждому нужно знать физику работы микроволновки, чтобы разогреть еду, но специалисты все равно должны понимать систему «под капотом», чтобы исправлять поломки и изобретать новые решения.

🧠 Проблема «награды» и опасности оптимизации 8:04

Одной из главных тем стал феномен «взлома награды» (reward hacking), с которым часто сталкиваются разработчики RL-систем.

Для борьбы с этим эксперты советуют переходить от жесткой оптимизации «черного ящика» к инструктивному следованию и встраиванию принципов, понятных человеку.

🚀 Продуктовый подход: наблюдение вместо инструкций 33:35

Черный делится философией разработки Claude Code, которая основана на двух принципах:

  1. Наблюдательные исследования: Команда не полагается на сухие отзывы пользователей. Вместо этого они часами наблюдают за тем, как люди работают с продуктом, не вмешиваясь, чтобы увидеть, где именно пользователь застревает.
  2. Использование «латентного спроса»: Идея заключается в создании гибкого, «хакабельного» продукта, позволяющего пользователям использовать его способами, которые разработчики изначально не задумывали. Так появились, например, Facebook Marketplace и Dating — на основе наблюдения за «нецелевым» поведением в группах.

Борис Черный подчеркивает важность того, чтобы «понимать, чего хочет модель». Вместо того чтобы принудительно заставлять ИИ выполнять действия (например, каждый раз принуждать запускать линтер), лучше дать ему доступ к линтеру как к инструменту. Модель сама будет использовать его, когда это необходимо, что дает гораздо более качественные результаты.

🔮 Будущее: человеческая аугментация 47:20

Эмма Бранскилл призывает фокусироваться не на простом ускорении текущих процессов, а на открытии новых горизонтов.

В финале дискуссии Бранскилл подчеркивает: текущий путь развития технологий не является предопределенным. Это выбор, который мы делаем как общество через регулирование и принципы построения моделей.

💬 Цитаты

«Самые ценные инструменты дополняют человеческие способности и открывают новые горизонты возможностей.»

Эмма Бранскилл 47:49

«Если вы попытаетесь управлять моделью в микро-масштабе, вы получите плохие результаты. Это похоже на управление сотрудником.»

Борис Черный 41:00
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Обучение с подкреплением (RL)
Метод машинного обучения, где агент учится принимать решения, получая награды или штрафы за свои действия.
Взлом награды (Reward hacking)
Ситуация, когда ИИ находит способ получить максимальную награду, не выполняя поставленную задачу качественно.
Агентные системы
Программы, способные автономно планировать и выполнять многоступенчатые действия для достижения цели.
Закон Гудхарта
Принцип, согласно которому показатель, становясь целью управления, перестает быть хорошим показателем.
📊 Цифры
🗓 Хронология
  1. 1967 Изобретение текстового редактора ed.
  2. 2000 Пример исследования, где RL-система для обучения учила студентов, давая им только легкие задачи.
  3. Март 2025 (ориентировочно по контексту) Выпуск модели Opus 4.
⚖️ Другая сторона
Искусственный интеллект Claude Code Reinforcement Learning Anthropic Stanford University Агентные системы