# Google I/O 2025: ИИ-агенты Mariner, чипы Ironwood и система Android XR

Источник: https://www.youtube.com/watch?v=bDVpI23q8Zg
Канал: The Verge
Опубликовано: 20.05.2025

---

Google представила Ironwood — TPU седьмого поколения с производительностью 42,5 эксафлопса на стойку [0:12]. На конференции I/O 2025 компания анонсировала переход к стратегии ИИ-агентов, представив Project Mariner и новую операционную систему Android XR для очков и гарнитур [23:34].

## 🏗 Инфраструктура и связь: Ironwood и Google Beam
[[JUMP:0:00]]

Новый процессор Ironwood обеспечивает десятикратный прирост производительности по сравнению с предыдущим поколением чипов Google [0:12]. Эти мощности компания планирует использовать для поддержки новых мультимодальных сервисов, включая платформу видеосвязи Google Beam.

Технология Google Beam (ранее известная как Project Starline) трансформировалась в коммерческий продукт:

*   Система использует массив из шести камер для захвата изображения под разными углами [0:38].
*   Алгоритмы ИИ объединяют видеопотоки в реальном времени для отображения на 3D-дисплее.
*   Частота обновления составляет 60 кадров в секунду с точностью отслеживания движений головы до миллиметра [0:52].
*   Первые устройства Google Beam, созданные в партнерстве с HP, поступят заказчикам до конца 2025 года.

Технологии Starline также интегрировали в Google Meet. Сервис получил функцию синхронного перевода речи в реальном времени [1:06]. Подписчикам уже доступен перевод между английским и испанским языками, а корпоративные клиенты получат доступ к расширенному списку языков позже в этом году [1:46].

## 🤖 Эволюция ИИ-агентов: Project Mariner и Astra
[[JUMP:1:55]]

Google переходит от простых чат-ботов к автономным агентам. Project Astra получил функции Gemini Live, что позволяет ИИ анализировать данные с камеры и экрана смартфона в режиме реального времени [2:00].

Ключевым анонсом стал Project Mariner — агент для работы в веб-браузере:

*   Система поддерживает многозадачность, выполняя до 10 процессов одновременно [2:38].
*   Функция «обучение и повтор» (teach and repeat) позволяет пользователю один раз показать алгоритм действий, после чего агент выполняет его самостоятельно [2:51].
*   Google сделала Gemini SDK совместимым с протоколом Model Context Protocol (MCP), представленным Anthropic [3:12]. Это позволяет агентам взаимодействовать со сторонними сервисами.

В приложении Gemini появился «режим агента» (agent mode). В демонстрации ИИ самостоятельно искал объявления о недвижимости на Zillow, применял фильтры и предлагал назначить встречу для просмотра квартиры [3:55]. Функция станет доступна подписчикам в ближайшее время.

## 🧠 Обновление моделей: Gemini 2.5 Flash и Pro
[[JUMP:5:28]]

Google обновила линейку моделей до версии 2.5. Модель Gemini 2.5 Flash оптимизирована для скорости и работы с длинным контекстом [5:28]. Она станет общедоступной в начале июня, а версия Pro последует за ней.

Основные технические новшества:

*   **Нативный аудио-вывод:** модель теперь поддерживает шепот и плавное переключение между 24 языками в рамках одного диалога [6:10].
*   **Бюджеты на размышление (Thinking Budgets):** разработчики могут настраивать баланс между временем ответа, стоимостью и качеством рассуждений [7:19].
*   **Deep Think:** новый режим для Gemini 2.5 Pro, показавший высокие результаты в математическом тесте USA Mo 2025 [9:30].
*   **Thought summaries:** API теперь выдает структурированные логи рассуждений модели с заголовками и деталями вызовов инструментов [7:05].

Для разработчиков представили Jules — автономного агента для написания кода. В демонстрации Jules обновил устаревшую версию Node.js в крупном проекте, самостоятельно спланировав шаги и изменив файлы за несколько минут [8:38].

## 🔍 Трансформация поиска и Gmail
[[JUMP:11:40]]

Google Search запускает «ИИ-режим» (AI mode) для всех пользователей в США [12:12]. Это полное переосмысление поиска, ориентированное на сложные запросы, которые в 2–3 раза длиннее традиционных.

В поиске появятся новые возможности:

*   **Deep Search:** создание экспертных отчетов с цитатами и визуализацией данных (графики, таблицы) на основе разрозненной информации [13:20].
*   **Search Live:** видеозвонок в поиск, где ИИ анализирует картинку с камеры для решения задач.
*   **Виртуальная примерка:** ИИ-модель для фэшн-индустрии реалистично отображает складки и драпировку ткани на фото пользователя [14:43].
*   **Агентская оплата:** интеграция с Google Pay позволяет агенту самостоятельно завершить покупку нужного размера и цвета товара [15:10].

Gmail получил функцию «персонализированных умных ответов» [4:34]. Gemini анализирует прошлые переписки, стиль общения и данные из календаря, чтобы генерировать ответы, имитирующие тон конкретного пользователя [5:17]. Функция заработает летом 2025 года.

## 🎬 Креативные инструменты и партнерство с Аронофски
[[JUMP:16:54]]

Google представила Flow — новое приложение для создания фильмов на базе ИИ [20:52]. Инструмент обеспечивает консистентность персонажей и сцен, позволяя «достраивать» кадры или генерировать новые элементы, например, 10-футовую курицу в салоне автомобиля [21:30].

Обновления медиа-моделей:

1.  **Imagen 4:** генератор изображений в 10 раз быстрее предыдущей версии, значительно улучшена работа с текстом и типографикой [17:40].
2.  **Veo 3:** видеомодель теперь нативно генерирует звуковые эффекты и диалоги персонажей [18:03].
3.  **Lyria 2:** модель для создания музыки профессионального качества с вокалом и сложными аранжировками [19:00].

Кинорежиссер Даррен Аронофски начал использовать инструменты Google в своей студии Primordial Soup для создания короткометражных фильмов [19:57]. Для защиты контента компания расширила систему SynthID, которая теперь распознает невидимые водяные знаки в тексте, аудио и видео, даже если была изменена только часть файла [19:44].

## 🕶 Android XR: очки и гарнитуры
[[JUMP:23:34]]

Google анонсировала операционную систему Android XR, разработанную совместно с Samsung и Qualcomm [24:15]. Платформа предназначена для двух типов устройств: иммерсивных гарнитур и легких смарт-очков.

Первым устройством на базе новой ОС станет гарнитура Project Moohan от Samsung, которая поступит в продажу в конце 2025 года [24:31]. Она предлагает «бесконечный экран» для приложений и интеграцию с Google Maps для виртуальных путешествий.

Дитер Бон и другие участники протестировали прототипы смарт-очков [26:35]. Ключевые функции носимых устройств:

*   **Контекстный поиск:** очки «помнят», какой кофе пил пользователь или какое название было на чеке [27:47].
*   **Навигация:** наложение 3D-карты и указателей поверх реального мира [28:14].
*   **Перевод в реальном времени:** два человека могут говорить на разных языках (в демо — хинди и английский), видя перевод прямо на линзах очков [30:13].

Партнерами по выпуску оправ стали бренды Gentle Monster и Warby Parker [31:19].