Google I/O 2026 Recap with Logan Kilpatrick, Josh Woodward and Tulsee Doshi

Google for Developers 894 32 мин 4 мин 22.05.2026

На конференции Google I/O 2026 ведущий Логан Килпатрик (Google DeepMind) обсудил с Джошем Вудвордом (Google Labs) и Тулси Доши (Google Gemini) переход к эпохе «агентов», эволюцию моделей семейства Gemini и будущее пользовательских интерфейсов. В ходе дискуссии участники раскрыли детали работы новых систем Spark и Omni, а также поделились видением того, как ИИ-модели начинают самостоятельно управлять рабочими процессами и бюджетами пользователей.

🤖 Новые модели: Интеллект, переходящий в действие 0:30

Главным лейтмотивом конференции в 2026 году стала концепция «интеллекта в действии» (intelligence with action) . По мнению Тулси Доши, сегодня невозможно обсуждать модели в отрыве от конкретных продуктов, так как грань между ними стирается.

Ключевые анонсы в области моделей:

Тулси Доши подчеркнула, что успех Gemini 3.5 Flash — это результат «превосходства в пост-обучении» (post-training excellence), включая использование методов обучения с подкреплением (RL) и тесную интеграцию модели с программной обвязкой (harness) .

🎬 Прорыв в видеопроизводстве: Проект Flow и Omni 1:39

Модель Omni продемонстрировала возможности глубокого редактирования видео, которые участники назвали «магическими». Джош Вудворд выделил продукт Google Flow, который позволяет управлять видеопроизводством на уровне режиссера:

  1. Scene Consistency: Модель сохраняет последовательность персонажей и окружения при смене ракурсов .
  2. Многокамерная съемка из одного кадра: Flow способен сгенерировать 16 различных углов обзора на основе одной исходной сцены .
  3. Ассистент режиссера: Пользователь может отдавать команды голосом (например, «измени это» или «добавь блесток при движении рук»), и модель мгновенно пересобирает видеоряд, сохраняя его целостность [02:56, 18:09].

Логан Килпатрик отметил, что демонстрация этих технологий меняет восприятие ИИ даже у скептиков, так как результат выглядит абсолютно естественным и когерентным .

💼 Агенты и Spark: От чатов к выполнению задач 6:39

Центральным продуктом для реализации «агентской» стратегии стал Gemini Spark — всегда включенный ассистент, работающий в фоновом режиме .

Джош Вудворд описывает работу со Spark как «перекидывание задач через плечо»: пользователь делает «дамп» мыслей или задач, а агент разбивает их на этапы, создает дашборд и приступает к исполнению .

Важные аспекты безопасности и доверия:

Spark будет доступен со следующей недели (после даты конференции) для подписчиков Google AI Ultra, начиная с США .

📈 Масштабирование и дизайн-вызовы 10:44

Google объявила, что приложение Gemini достигло 900 миллионов активных пользователей в месяц . Это создает уникальную дилемму для разработчиков: как создать интерфейс, который будет понятен новичку и при этом удовлетворит «пауэр-юзеров», настраивающих сложные триггеры и расписания.

Джош Вудворд считает, что решением является разработка масштабируемых интерфейсов :

🔮 Прогнозы: 10 000 продуктов или один интерфейс? 22:55

Участники обсудили будущее Google к 2027–2030 годам. Возник спор о том, как человечество будет потреблять софт в будущем.

В завершение Тулси Доши подчеркнула, что видение Демиса Хассабиса о «универсальном виртуальном ассистенте», который проактивно участвует в жизни человека, станет реальностью гораздо быстрее, чем многие ожидают .