Технологический аналитик Уэс Рот в своем новом обзоре подробно анализирует масштабную перестройку экосистемы Google и ее официальное вступление в «эру автономных агентов». На основе анонсов конференции Google I/O автор разбирает изменение бизнес-модели поискового гиганта, эволюцию нейросетей семейства Gemini и новые инфраструктурные альянсы с Уолл-стрит. Главным сюжетом материала становится переход от простых диалоговых моделей к тотальной автоматизации пользовательских и коммерческих процессов.
🤖 Новое поколение моделей: Gemini 3.5 Flash и концепция Omni 0:13
На конференции Google I/O компания представила обновленную линейку нейросетей. Центральным анонсом стал выпуск модели Gemini 3.5 Flash, которая теперь назначается базовой моделью по умолчанию для приложения Gemini и интеллектуального режима поиска. Разработчики заявляют о следующих ключевых улучшениях:
- Ускоренная генерация ответов и оптимизированный UI.
- Повышенная эффективность при написании программного кода.
- Более глубокая интеграция с агентурными сценариями.
- Улучшенная обработка мультимодальных запросов.
При этом флагманская интеллектуальная модель Gemini 3.5 Pro на данный момент не выпущена официально; компания продолжает ее внутреннее тестирование и планирует релиз в следующем месяце. Полноценным творческим расширением экосистемы призвана стать линейка Gemini Omni и Omni Flash, ориентированная на мультимедийное создание контента. Модели этого семейства способны принимать на вход текст, изображения, аудио- и видеофайлы, а на выходе генерировать редактируемые видеоматериалы, основанные на фактах реального мира. Интеграция Omni планируется через стандартное приложение Gemini, сервис Google Flow и платформу YouTube Shorts.
Параллельно обновился интерфейс самого приложения Gemini, получивший дизайн Neural Expressive с плавными анимациями, тактильным откликом и измененной типографикой. Голосовой режим Gemini Live теперь интегрирован бесшовно и не перекрывает весь экран смартфона. В ответы внедряются интерактивные визуальные элементы, таймлайны и инлайн-изображения, что, по мнению Уэса Рота, напоминает перенос функций аналитического инструмента Notebook LM внутрь потребительского приложения.
🔍 Трансформация поиска: от ссылок к генерации приложений 9:15
Интеллектуальный режим поиска Google переведен на архитектуру Gemini 3.5 Flash. Теперь система способна поддерживать длительный контекст беседы, анализировать загруженные файлы и обрабатывать содержимое открытых вкладок браузера Chrome. Уэс Рот отмечает, что среди экспертов долгое время велись дискуссии о возможном падении поисковой монополии Google под натиском ИИ-технологий. Однако последние финансовые отчеты и звонки с инвесторами демонстрируют обратную тенденцию: продвинутые языковые модели позволяют корпорации эффективнее монетизировать сложные, низкочастотные запросы (long-tail queries) за счет точного понимания намерений пользователя и релевантного размещения рекламы.
Такой подход кардинально меняет структуру интернет-экономики. Рост так называемого «поиска без кликов» (zero-click searches), когда пользователь получает исчерпывающий ответ прямо на главной странице Google, лишает веб-издателей трафика и доходов. Данные сторонних сайтов используются для обучения моделей, в то время как сами площадки отсекаются от аудитории.
По мнению Уэса Рота, традиционный поиск с «10 синими ссылками» превращается в генератор кастомных приложений. Вместо простой выдачи документов алгоритм на лету создает интерфейсы, симуляции и интерактивные инструменты, адаптированные под конкретную задачу.
💼 Экосистема агентов: Gemini Spark и концепция A2A 3:16
Ключевым вектором развития Google провозгласила создание автономных ИИ-агентов, способных выполнять фоновые задачи без постоянного контроля человека. Центральным продуктом в этой категории стал Gemini Spark — персональный агент, интегрированный со всем рабочим пространством Workspace, включая Gmail, Docs, Sheets и Slides. Он функционирует непрерывно в режиме 24/7 на виртуальных машинах Google, независимо от того, включен ли ноутбук или телефон пользователя. Для связи сторонних приложений со Spark внедряется открытый протокол MCP (Model Context Protocol), изначально разработанный компанией Anthropic. На начальном этапе доступ к Gemini Spark получат подписчики тарифного плана Ultra в США.
Для массового сегмента предусмотрен облегченный инструмент Daily Brief — персонализированная ежедневная сводка, которая анализирует почту, календарь и задачи, расставляя приоритеты и предлагая дальнейшие шаги.
Параллельно Google формирует долгосрочную B2B-инфраструктуру для взаимодействия агентов между собой — так называемый слой A2A (agent-to-agent). В рамках этой инициативы компания сотрудничает с Coinbase для интеграции криптовалютного функционала и проведения платежей между автономными алгоритмами. По оценке Уэса Рота, специализированный ИИ-агент на базе открытых систем (например, Open Claw) действует как выделенный цифровой интерн-исследователь, качественно превосходя классические инструменты оповещений вроде Google Alerts.
🛒 Универсальная корзина и аппаратная интеграция Android XR 14:12
В сфере электронной коммерции запущена «Универсальная корзина» (Universal Cart) — платежное решение на базе Gemini, работающее сквозным образом через Поиск, YouTube, Gmail и приложение Gemini. К системе уже подключены крупнейшие ритейлеры и платформы:
Универсальная корзина не просто хранит платежные данные, а обладает агентскими функциями: отслеживает историю цен, ищет купоны, сообщает о скидках и проверяет совместимость товаров. Например, при покупке комплектующих для ПК алгоритм сверяет их с техническим профилем пользователя и может заблокировать заказ неподходящей детали. При этом Уэс Рот делится личным опытом тестирования: при попытке вслепую угадать конфигурацию его компьютера Gemini выдала пугающе точный результат, описав процессор AMD Ryzen, видеокарту RTX 40-й серии, 32 ГБ ОЗУ и чрезмерно шумную механическую клавиатуру, а также упомянув старый ноутбук Lenovo ThinkPad, действительно находящийся в комнате.
Аппаратным продолжением этой среды станут умные очки на базе платформы Android XR, разрабатываемые в партнерстве с Samsung, Qualcomm, Gentle Monster, Warby Parker и Xreal. Релиз намечен на осень текущего года. Первая волна устройств будет исключительно аудио-очками (версия с дисплеем в линзах находится в разработке). Очки обеспечат пользователя голосовым помощником Gemini, функцией синхронного перевода и навигацией. Уэс Рот обращает внимание, что, несмотря на аудиоформат, гаджет оснащен видимыми камерами в оправе, что может вызвать неоднозначную реакцию общества в вопросах конфиденциальности.
💳 Экономика вычислений: новые тарифы и альянс с Blackstone 36:12
Масштабное развертывание ИИ-сервисов требует радикального изменения подходов к монетизации и инфраструктуре. Google меняет схему тарификации ИИ-планов: вместо жесткого лимита на количество запросов в сутки вводится оценка вычислительной интенсивности (compute intensity). Сложные промпты (обработка видео, написание программного кода, глубокие исследования) будут расходовать доступный лимит быстрее, а лимиты будут обновляться каждые 5 часов. Стоимость подписки AI Ultra теперь начинается от $100 в месяц для базового уровня, а продвинутый тариф, ранее стоивший $250, подешевел до $200 в месяц.
Параллельно на Уолл-стрит формируются новые финансовые инструменты. По прогнозу генерального директора BlackRock Ларри Финка, в ближайшее время возникнет фьючерсный рынок на вычислительные мощности. Практически сразу владелец Нью-Йоркской фондовой биржи (NYSE) направил регуляторам на утверждение проект первого фьючерсного контракта на compute.
В рамках этой тенденции Google заключила стратегическое соглашение с инвестиционной компанией Blackstone (активы под управлением — $1,3 трлн, не путать с BlackRock, управляющей $13 трлн) для создания совместного ИИ-облака (Neo Cloud). Blackstone инвестирует $5 миллиардов в капитал предприятия и становится его мажоритарным владельцем. Проект направлен на расширение доступности тензорных процессоров Google (TPU) как услуги (compute as a service). Это позволяет Google резко нарастить капитальные затраты (которые за последние 4 года уже выросли в 6 раз) без перегрузки собственного баланса, привлекая капитал институциональных инвесторов.
🚀 Будущее инфраструктуры: космические дата-центры и хостинг агентов 41:15
В рамках экосистемы обновляются и повседневные приложения. Внедряются функции Keep Live (голосовая организация заметок на базе методологии Getting Things Done Дэвида Аллена) и Docs Live для диктовки и редактирования документов голосом,. Сервис Ask YouTube позволяет вести сложный контекстный диалог с видеороликами, выдавая интерактивные ответы со строгими таймкодами. Уэс Рот сравнивает этот опыт с работой голосового режима сторонних ИИ, который в его практике тестирования базовых запросов демонстрировал смысловые сбои, подчеркивая превосходство текущих моделей Gemini в точности детекции фактов.
Для разработчиков Google предлагает хостинг агентов на виртуальных Linux-машинах (Ubuntu). Компания планирует стать ключевым провайдером инфраструктуры для сторонних ИИ-агентов, взимая плату преимущественно за потраченные вычислительные ресурсы.
Главным вызовом для индустрии остается дефицит мощностей и энергии. По словам Уэса Рота, Google и SpaceX уже проводят технические тесты по развертыванию орбитальных дата-центров в космосе, что выглядит вполне осуществимым решением энергетического кризиса. Статистика роста аудитории Gemini подтверждает масштаб экспансии:
- Май 2025 года: 400 миллионов ежемесячно активных пользователей.
- Сентябрь 2025 года: 650 миллионов.
- Декабрь 2025 года: 750 миллионов.
- Апрель: более 900 миллионов пользователей.
Благодаря колоссальному дистрибьюторскому преимуществу (поисковая система, браузер Chrome, ОС Android), Google обладает уникальным рычагом для захвата лидерства в наступающей «эре агентов».