Google IO 2025: анонс видеомодели Veo 3, агента Mariner и подписки Ultra

Wes Roth 30,4 тыс. 14 мин 4 мин 21.05.2025
Главное

Компания Google представила масштабное обновление своей экосистемы искусственного интеллекта в рамках конференции Google IO 2025. Главным событием стал запуск премиального плана подписки «AI Ultra», который открывает доступ к новейшим моделям генерации видео, автономным агентам и продвинутым инструментам для разработчиков.

💎 Новый уровень подписки: Google AI Ultra 1:23

В структуре платных сервисов Google произошли значительные изменения. Если ранее пользователям предлагался план Google AI Advanced (теперь переименованный в Google AI Pro), то теперь компания вводит «VIP-план» — Google AI Ultra . По мнению автора канала Уэса Рота, это предложение ориентировано на тех, кто хочет находиться на переднем крае технологий ИИ.

Стоимость и условия подписки Google AI Ultra:

Помимо инфраструктурных бонусов, подписчики Ultra получают эксклюзивный доступ к набору инструментов: приложению Gemini с моделью 2.5 Pro Deep Think, новой видеомодели Veo 3, инструменту для кинопроизводства Flow и ранний доступ к автономному агенту Project Mariner .

🎬 Veo 3 и Flow: Видеогенерация заговорила 0:00

Одним из самых ярких анонсов стала модель Veo 3 (VO3). В отличие от предыдущих итераций, эта модель теперь поддерживает генерацию не только видеоряда, но и синхронизированного звука, включая диалоги и фоновые шумы .

Особенности Veo 3, отмеченные в демонстрации:

Уэс Рот протестировал Flow, создав видео с «тигром из снега, крадущимся в сугробах». Автор отметил, что для получения качественного результата в разрешении 1080p необходимо вручную активировать модель V3 в настройках проекта . По его мнению, визуальное качество генерации на канале «Flow TV» (где крутятся случайные AI-видео) выглядит впечатляюще, напоминая настоящие телевизионные трансляции .

💻 Революция в кодинге: Jules и Gemini Diffusion 3:07

Для разработчиков Google представил два принципиально разных подхода. Первый — это Gemini Diffusion, текстовая диффузионная модель, оптимизированная для написания кода. Уэс Рот цитирует отзывы первых пользователей, называющих работу модели «безумной»: она выдает рабочий код буквально за 3 секунды . По словам автора, сама идея использования диффузионных моделей для программирования выглядит необычно, но эффективно.

Второй инструмент — Jules, автономный агент для разработки на базе Gemini 2.5 Pro :

Рот сравнивает интерфейс Jules с Codex от OpenAI, отмечая, что агент позволяет ставить задачи в очередь, пока он выполняет их в фоновом режиме .

🤖 Project Mariner: ИИ-агент за пультом браузера 9:45

Project Mariner представляет собой «агентивную» систему, которая способна самостоятельно перемещаться по веб-страницам и выполнять действия от лица пользователя. В ходе теста Уэс попросил Mariner найти новости с Google IO 2025 и сохранить их в онлайн-блокнот .

Наблюдения в процессе работы агента:

Автор считает, что использование таких агентов сопряжено с рисками безопасности. Он упомянул, что в рамках экспериментов готов доверить ИИ пароль от сервиса доставки продуктов (например, Instacart), но «проводит черту» на передаче данных кредитных карт, пока технология находится в стадии исследовательского превью . Рот подчеркнул, что создание надежного агента, управляющего компьютером — одна из самых сложных задач в индустрии, которую также пытаются решить OpenAI и Anthropic .

📱 Мультимодальность и Deep Research 5:45

Обновления коснулись и повседневных инструментов. Функция Gemini Live для Android теперь поддерживает совместное использование камеры и экрана. Это позволяет ИИ-ассистенту буквально видеть то, что видит пользователь, и помогать в реальном времени . Также анонсирована интеграция с календарем, задачами и картами Google .

Инструмент Google Deep Research получил важные обновления:

  1. Возможность загрузки собственных файлов и изображений для анализа .
  2. Интеграция с Google Drive и Gmail.
  3. Функция трансформации отчета в полноценную веб-страницу одним нажатием кнопки .

Уэс Рот признался, что впечатлен качеством работы Deep Research от Google, сравнивая его с аналогичным решением от OpenAI. По его словам, оба инструмента хороши каждый по-своему, и он все еще пытается определить, какой из них лучше справляется с конкретными типами задач . Кроме того, сервис Notebook LM скоро получит функцию «видео-обзоров» (Video Overviews), которая дополнит уже существующие аудио-обзоры документов .

💬 Цитаты

«Мы можем говорить. Больше никакой тишины. Мы можем говорить с акцентами.»

«Project Mariner выглядит многообещающе, но разработчики предупреждают: это исследовательское превью, он может ошибаться.»

«Диффузионная модель, создающая рабочий код — в этом есть что-то странное, но это работает.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Project Mariner
Автономный ИИ-агент от Google, способный управлять браузером и выполнять цепочки действий.
Diffusion Model
Тип нейросетей, обычно используемый для генерации изображений, но в данном случае примененный для быстрого написания кода.
Asynchronously
Режим работы, при котором задачи выполняются независимо друг от друга в фоновом режиме.
Agentic
Способность системы ИИ проявлять инициативу и самостоятельно принимать решения для достижения цели.
📊 Цифры
🗓 Хронология
  1. Май 2025 Конференция Google IO и анонс линейки продуктов AI Ultra.
  2. Май 2025 Запуск свободного доступа к генерации изображений Imagine 4 в приложении Gemini.
⚖️ Другая сторона
Искусственный интеллект Google AI Ultra Veo 3 Project Mariner Gemini 2.5 Pro Jules