Вес Рот: «Google готовит нечто масштабное к конференции I/O»

Wes Roth 71,2 тыс. 29 мин 4 мин 07.05.2025
Главное

В преддверии ежегодной конференции Google I/O технологический гигант перешел в режим «ковровых бомбардировок» новыми релизами. Автор канала Wes Roth анализирует участившиеся обновления моделей Gemini и случайные утечки, которые указывают на подготовку компании к анонсу чего-то по-настоящему масштабного — вероятно, Gemini 3.0 и радикального обновления интерфейса Android.

🚀 Стратегия «быстрого огня»: почему Google спешит? 0:00

Автор канала Wes Roth отмечает необычную активность Google за считанные недели до конференции Google I/O, которая должна начаться 20 мая . По его мнению, компания намеренно выпускает серию обновлений текущих моделей, чтобы «расчистить сцену» для главных анонсов. Эту точку зрения разделяет и автор канала Fireship, на которого ссылается Вес .

В последние дни Google развернул целый ряд технологий:

Вес Рот предполагает, что модель под кодовым названием Claybrook — это и есть текущая Gemini 2.5 Pro Preview . В то же время в сети циркулируют слухи, что Night Whisper может оказаться еще более мощной Gemini 2.5 Ultra, а на самой конференции мир увидит Gemini 3.0 .

🧠 Названия моделей и «кризис именования» 2:26

Сложная система названий (2.0, 2.5, Pro, Flash, Preview) вызывает путаницу среди пользователей. Вес Рот приводит слова Логана Килпатрика из команды разработчиков Google, который признает, что соблюдение баланса в именовании — сложная задача . По мнению Килпатрика, резкая смена названий может дезориентировать тех, кто уже интегрировал модели в свои рабочие процессы.

Тем не менее, Вес Рот придерживается версии, что текущая лавина релизов — это попытка закрыть главу «2.x» . Если Google планирует представить Gemini 3.0, логично выпустить все промежуточные обновления сейчас, чтобы они не выглядели устаревшими на фоне новой архитектуры .

📱 Material 3 Expressive: случайная утечка интерфейса 4:12

Одним из ключевых доказательств грядущих перемен стала случайная публикация в блоге Google (впоследствии удаленная), которую успел сохранить сервис Wayback Machine . Речь идет о Material 3 Expressive — масштабном визуальном обновлении пользовательского интерфейса Android.

Ключевые факты об обновлении:

👁️ Project Astra: ИИ, который видит мир 6:11

Вес демонстрирует возможности Project Astra — продвинутого ИИ-ассистента, работающего с потоковым видео в реальном времени . В ходе тестов Рот показывает ассистенту различные предметы через камеру:

  1. ИИ безошибочно узнает добавку магния и бутылку воды марки Kirkland, делая вывод, что она куплена в Costco .
  2. Модель успешно идентифицирует упаковку электролитов LMNT после нескольких уточняющих попыток .
  3. Ассистент демонстрирует культурную осведомленность, распознавая цитату «That’s a bingo!» из фильма «Бесславные ублюдки» .

При демонстрации экрана ИИ узнал Демиса Хассабиса (главу Google DeepMind) и Сэма Альтмана (главу OpenAI), но не справился с идентификацией Дуэйна «Скалы» Джонсона . Интересно, что текущая версия Astra работает на моделях поколения 2.0, что, по мнению Веса, оставляет огромный задел для роста при переходе на Gemini 3.0 .

💻 Firebase Studio: ответ Google на Cursor и Windsurf 15:42

Google активно развивает Firebase Studio — облачную среду разработки (IDE), работающую прямо в браузере . Вес сравнивает этот инструмент с популярными AI-редакторами кода:

Firebase Studio объединяет мощь VS Code с интегрированными моделями Gemini . Главным преимуществом инструмента Вес называет бесшовную интеграцию с хостингом и аналитикой Google: развертывание приложения происходит буквально в несколько кликов . Хотя на данный момент инструмент кажется автору менее «отполированным», чем конкуренты, владение собственными моделями дает Google стратегическое преимущество .

🎮 ИИ в видеоиграх: от Pokemon до Factorio 18:35

Обсуждение возможностей ИИ затронуло и сферу гейминга. Недавним достижением стало прохождение игры Pokemon Blue моделью Gemini 2.5 Pro . Однако Вес Рот призывает к осторожности в оценках:

  1. Проблема «обвязки» (Harness): Вес цитирует разработчика Лукаса, который утверждает, что такие успехи на 90% состоят из человеческого кода (своеобразной «дорожки», проложенной для ИИ) и лишь на 10% — из интеллекта самой модели .
  2. Визуальное обоснование: Проект SEMA от Google DeepMind обучается играть в игры (например, Goat Simulator), используя только визуальный ввод и команды на естественном языке, без доступа к внутреннему коду игры .
  3. Бенчмарки: Новым эталоном сложности стала игра Factorio, где ИИ должен строить огромные заводы, что требует долгосрочного планирования .

Вес предполагает, что на конференции Google I/O мы можем увидеть Project Astra в роли «игрового помощника», который в реальном времени дает советы по стратегии (например, в Clash of Clans) .

📅 Ожидания от Google I/O 27:36

В завершение Вес Рот делает прогноз на основные события конференции:

Автор заключает, что текущий «парад релизов» — это либо признак того, что Google нечего будет показать на самой конференции (вариант А), либо свидетельство того, что все нынешние новинки станут «вчерашним днем» сразу после анонса массовой и мощной Gemini 3.0 (вариант Б, который кажется Весу более вероятным) .

💬 Цитаты

«Нам кажется, что Google просто быстро выкладывает все карты на стол, чтобы подготовиться к чему-то большему.»

«Это 90% обвязки и 10% модели.»

Вес Рот (цитируя Лукаса) 22:56
👥 Спикер
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
IDE
Интегрированная среда разработки — программное приложение, которое предоставляет программистам комплексные средства для разработки ПО.
Мультимодальность
Способность ИИ-модели обрабатывать и понимать информацию разных типов одновременно (текст, видео, аудио, изображения).
Harness (обвязка)
Дополнительный программный код, написанный человеком для упрощения работы ИИ-модели в конкретной среде или игре.
📊 Цифры
🗓 Хронология
  1. Март 2024 Публикация Google DeepMind о SEMA — универсальном агенте для 3D-миров.
  2. 2 мая 2024 Модель Gemini 2.5 Pro завершила прохождение игры Pokemon Blue.
  3. 20 мая 2024 Запланированный старт конференции Google I/O.
⚖️ Другая сторона
Искусственный интеллект Google Gemini Project Astra Firebase Studio Material 3 Expressive Wes Roth