В преддверии ежегодной конференции Google I/O технологический гигант перешел в режим «ковровых бомбардировок» новыми релизами. Автор канала Wes Roth анализирует участившиеся обновления моделей Gemini и случайные утечки, которые указывают на подготовку компании к анонсу чего-то по-настоящему масштабного — вероятно, Gemini 3.0 и радикального обновления интерфейса Android.
🚀 Стратегия «быстрого огня»: почему Google спешит? 0:00
Автор канала Wes Roth отмечает необычную активность Google за считанные недели до конференции Google I/O, которая должна начаться 20 мая . По его мнению, компания намеренно выпускает серию обновлений текущих моделей, чтобы «расчистить сцену» для главных анонсов. Эту точку зрения разделяет и автор канала Fireship, на которого ссылается Вес .
В последние дни Google развернул целый ряд технологий:
- Обновление модели Gemini 2.5 Pro (версия 0506), которая стала заметным шагом вперед по сравнению с предыдущими итерациями .
- Запуск Gemini 2.0 Flash — быстрой и экономичной модели с улучшенной генерацией изображений .
- Тестирование моделей под кодовыми именами Claybrook, Night Whisper и Dragon Tale .
Вес Рот предполагает, что модель под кодовым названием Claybrook — это и есть текущая Gemini 2.5 Pro Preview . В то же время в сети циркулируют слухи, что Night Whisper может оказаться еще более мощной Gemini 2.5 Ultra, а на самой конференции мир увидит Gemini 3.0 .
🧠 Названия моделей и «кризис именования» 2:26
Сложная система названий (2.0, 2.5, Pro, Flash, Preview) вызывает путаницу среди пользователей. Вес Рот приводит слова Логана Килпатрика из команды разработчиков Google, который признает, что соблюдение баланса в именовании — сложная задача . По мнению Килпатрика, резкая смена названий может дезориентировать тех, кто уже интегрировал модели в свои рабочие процессы.
Тем не менее, Вес Рот придерживается версии, что текущая лавина релизов — это попытка закрыть главу «2.x» . Если Google планирует представить Gemini 3.0, логично выпустить все промежуточные обновления сейчас, чтобы они не выглядели устаревшими на фоне новой архитектуры .
📱 Material 3 Expressive: случайная утечка интерфейса 4:12
Одним из ключевых доказательств грядущих перемен стала случайная публикация в блоге Google (впоследствии удаленная), которую успел сохранить сервис Wayback Machine . Речь идет о Material 3 Expressive — масштабном визуальном обновлении пользовательского интерфейса Android.
Ключевые факты об обновлении:
- Дизайн основан на 46 отдельных исследованиях с участием более 18 000 человек по всему миру .
- Google использовала технологию айтрекинга (отслеживания взгляда), чтобы понять, как пользователи взаимодействуют с элементами экрана .
- Вес Рот считает, что цифра «3» в названии Material 3 может быть напрямую связана с запуском Gemini 3.0, создавая единую экосистему .
👁️ Project Astra: ИИ, который видит мир 6:11
Вес демонстрирует возможности Project Astra — продвинутого ИИ-ассистента, работающего с потоковым видео в реальном времени . В ходе тестов Рот показывает ассистенту различные предметы через камеру:
- ИИ безошибочно узнает добавку магния и бутылку воды марки Kirkland, делая вывод, что она куплена в Costco .
- Модель успешно идентифицирует упаковку электролитов LMNT после нескольких уточняющих попыток .
- Ассистент демонстрирует культурную осведомленность, распознавая цитату «That’s a bingo!» из фильма «Бесславные ублюдки» .
При демонстрации экрана ИИ узнал Демиса Хассабиса (главу Google DeepMind) и Сэма Альтмана (главу OpenAI), но не справился с идентификацией Дуэйна «Скалы» Джонсона . Интересно, что текущая версия Astra работает на моделях поколения 2.0, что, по мнению Веса, оставляет огромный задел для роста при переходе на Gemini 3.0 .
💻 Firebase Studio: ответ Google на Cursor и Windsurf 15:42
Google активно развивает Firebase Studio — облачную среду разработки (IDE), работающую прямо в браузере . Вес сравнивает этот инструмент с популярными AI-редакторами кода:
- Cursor: оценивается в $9 млрд и базируется на VS Code .
- Windsurf: недавно приобретен OpenAI за $3 млрд .
Firebase Studio объединяет мощь VS Code с интегрированными моделями Gemini . Главным преимуществом инструмента Вес называет бесшовную интеграцию с хостингом и аналитикой Google: развертывание приложения происходит буквально в несколько кликов . Хотя на данный момент инструмент кажется автору менее «отполированным», чем конкуренты, владение собственными моделями дает Google стратегическое преимущество .
🎮 ИИ в видеоиграх: от Pokemon до Factorio 18:35
Обсуждение возможностей ИИ затронуло и сферу гейминга. Недавним достижением стало прохождение игры Pokemon Blue моделью Gemini 2.5 Pro . Однако Вес Рот призывает к осторожности в оценках:
- Проблема «обвязки» (Harness): Вес цитирует разработчика Лукаса, который утверждает, что такие успехи на 90% состоят из человеческого кода (своеобразной «дорожки», проложенной для ИИ) и лишь на 10% — из интеллекта самой модели .
- Визуальное обоснование: Проект SEMA от Google DeepMind обучается играть в игры (например, Goat Simulator), используя только визуальный ввод и команды на естественном языке, без доступа к внутреннему коду игры .
- Бенчмарки: Новым эталоном сложности стала игра Factorio, где ИИ должен строить огромные заводы, что требует долгосрочного планирования .
Вес предполагает, что на конференции Google I/O мы можем увидеть Project Astra в роли «игрового помощника», который в реальном времени дает советы по стратегии (например, в Clash of Clans) .
📅 Ожидания от Google I/O 27:36
В завершение Вес Рот делает прогноз на основные события конференции:
- Основной доклейд (Keynote): анонс Gemini 3.0 как новой вехи в развитии ИИ .
- Секция разработчиков: выступление Демиса Хассабиса о границах ИИ .
- Android: презентация Material 3 Expressive и глубокой интеграции ИИ в систему .
Автор заключает, что текущий «парад релизов» — это либо признак того, что Google нечего будет показать на самой конференции (вариант А), либо свидетельство того, что все нынешние новинки станут «вчерашним днем» сразу после анонса массовой и мощной Gemini 3.0 (вариант Б, который кажется Весу более вероятным) .