# Вес Рот: «Google готовит нечто масштабное к конференции I/O»

Источник: https://www.youtube.com/watch?v=hIbe8wFnP4w
Канал: Wes Roth
Опубликовано: 07.05.2025

---

В преддверии ежегодной конференции Google I/O технологический гигант перешел в режим «ковровых бомбардировок» новыми релизами. Автор канала Wes Roth анализирует участившиеся обновления моделей Gemini и случайные утечки, которые указывают на подготовку компании к анонсу чего-то по-настоящему масштабного — вероятно, Gemini 3.0 и радикального обновления интерфейса Android.

## 🚀 Стратегия «быстрого огня»: почему Google спешит?
[[JUMP:0:00]]

Автор канала Wes Roth отмечает необычную активность Google за считанные недели до конференции Google I/O, которая должна начаться 20 мая [0:26]. По его мнению, компания намеренно выпускает серию обновлений текущих моделей, чтобы «расчистить сцену» для главных анонсов. Эту точку зрения разделяет и автор канала Fireship, на которого ссылается Вес [0:00].

В последние дни Google развернул целый ряд технологий:

*   Обновление модели Gemini 2.5 Pro (версия 0506), которая стала заметным шагом вперед по сравнению с предыдущими итерациями [1:07].
*   Запуск Gemini 2.0 Flash — быстрой и экономичной модели с улучшенной генерацией изображений [3:06].
*   Тестирование моделей под кодовыми именами Claybrook, Night Whisper и Dragon Tale [0:54].

Вес Рот предполагает, что модель под кодовым названием Claybrook — это и есть текущая Gemini 2.5 Pro Preview [1:34]. В то же время в сети циркулируют слухи, что Night Whisper может оказаться еще более мощной Gemini 2.5 Ultra, а на самой конференции мир увидит Gemini 3.0 [1:47].

## 🧠 Названия моделей и «кризис именования»
[[JUMP:2:26]]

Сложная система названий (2.0, 2.5, Pro, Flash, Preview) вызывает путаницу среди пользователей. Вес Рот приводит слова Логана Килпатрика из команды разработчиков Google, который признает, что соблюдение баланса в именовании — сложная задача [2:39]. По мнению Килпатрика, резкая смена названий может дезориентировать тех, кто уже интегрировал модели в свои рабочие процессы.

Тем не менее, Вес Рот придерживается версии, что текущая лавина релизов — это попытка закрыть главу «2.x» [3:30]. Если Google планирует представить Gemini 3.0, логично выпустить все промежуточные обновления сейчас, чтобы они не выглядели устаревшими на фоне новой архитектуры [3:44].

## 📱 Material 3 Expressive: случайная утечка интерфейса
[[JUMP:4:12]]

Одним из ключевых доказательств грядущих перемен стала случайная публикация в блоге Google (впоследствии удаленная), которую успел сохранить сервис Wayback Machine [4:25]. Речь идет о Material 3 Expressive — масштабном визуальном обновлении пользовательского интерфейса Android.

Ключевые факты об обновлении:

*   Дизайн основан на 46 отдельных исследованиях с участием более 18 000 человек по всему миру [5:30].
*   Google использовала технологию айтрекинга (отслеживания взгляда), чтобы понять, как пользователи взаимодействуют с элементами экрана [5:05].
*   Вес Рот считает, что цифра «3» в названии Material 3 может быть напрямую связана с запуском Gemini 3.0, создавая единую экосистему [5:57].

## 👁️ Project Astra: ИИ, который видит мир
[[JUMP:6:11]]

Вес демонстрирует возможности Project Astra — продвинутого ИИ-ассистента, работающего с потоковым видео в реальном времени [6:51]. В ходе тестов Рот показывает ассистенту различные предметы через камеру:

1.  ИИ безошибочно узнает добавку магния и бутылку воды марки Kirkland, делая вывод, что она куплена в Costco [8:41].
2.  Модель успешно идентифицирует упаковку электролитов LMNT после нескольких уточняющих попыток [9:48].
3.  Ассистент демонстрирует культурную осведомленность, распознавая цитату «That’s a bingo!» из фильма «Бесславные ублюдки» [10:54].

При демонстрации экрана ИИ узнал Демиса Хассабиса (главу Google DeepMind) и Сэма Альтмана (главу OpenAI), но не справился с идентификацией Дуэйна «Скалы» Джонсона [12:24]. Интересно, что текущая версия Astra работает на моделях поколения 2.0, что, по мнению Веса, оставляет огромный задел для роста при переходе на Gemini 3.0 [8:00].

## 💻 Firebase Studio: ответ Google на Cursor и Windsurf
[[JUMP:15:42]]

Google активно развивает Firebase Studio — облачную среду разработки (IDE), работающую прямо в браузере [15:54]. Вес сравнивает этот инструмент с популярными AI-редакторами кода:

*   **Cursor:** оценивается в $9 млрд и базируется на VS Code [16:48].
*   **Windsurf:** недавно приобретен OpenAI за $3 млрд [17:13].

Firebase Studio объединяет мощь VS Code с интегрированными моделями Gemini [17:27]. Главным преимуществом инструмента Вес называет бесшовную интеграцию с хостингом и аналитикой Google: развертывание приложения происходит буквально в несколько кликов [18:08]. Хотя на данный момент инструмент кажется автору менее «отполированным», чем конкуренты, владение собственными моделями дает Google стратегическое преимущество [18:22].

## 🎮 ИИ в видеоиграх: от Pokemon до Factorio
[[JUMP:18:35]]

Обсуждение возможностей ИИ затронуло и сферу гейминга. Недавним достижением стало прохождение игры Pokemon Blue моделью Gemini 2.5 Pro [18:51]. Однако Вес Рот призывает к осторожности в оценках:

1.  **Проблема «обвязки» (Harness):** Вес цитирует разработчика Лукаса, который утверждает, что такие успехи на 90% состоят из человеческого кода (своеобразной «дорожки», проложенной для ИИ) и лишь на 10% — из интеллекта самой модели [22:56].
2.  **Визуальное обоснование:** Проект SEMA от Google DeepMind обучается играть в игры (например, Goat Simulator), используя только визуальный ввод и команды на естественном языке, без доступа к внутреннему коду игры [24:43].
3.  **Бенчмарки:** Новым эталоном сложности стала игра Factorio, где ИИ должен строить огромные заводы, что требует долгосрочного планирования [19:42].

Вес предполагает, что на конференции Google I/O мы можем увидеть Project Astra в роли «игрового помощника», который в реальном времени дает советы по стратегии (например, в Clash of Clans) [23:35].

## 📅 Ожидания от Google I/O
[[JUMP:27:36]]

В завершение Вес Рот делает прогноз на основные события конференции:

*   **Основной доклейд (Keynote):** анонс Gemini 3.0 как новой вехи в развитии ИИ [28:01].
*   **Секция разработчиков:** выступление Демиса Хассабиса о границах ИИ [27:48].
*   **Android:** презентация Material 3 Expressive и глубокой интеграции ИИ в систему [28:14].

Автор заключает, что текущий «парад релизов» — это либо признак того, что Google нечего будет показать на самой конференции (вариант А), либо свидетельство того, что все нынешние новинки станут «вчерашним днем» сразу после анонса массовой и мощной Gemini 3.0 (вариант Б, который кажется Весу более вероятным) [27:08].