На ежегодной конференции Google I/O 2026 компания представила масштабное обновление своей экосистемы, окончательно закрепив переход от классических поисковых алгоритмов к концепции «агентов». В центре внимания оказались новые модели семейства Gemini, революционный фреймворк для создания автономных систем Anti-gravity и персональный помощник Spark. Участники презентации подчеркнули, что технологии вплотную приблизились к общему искусственному интеллекту (AGI), который может стать «двигателем человеческого прогресса».
🗺️ «Спроси у карт и YouTube»: ИИ становится собеседником 0:00
Google начинает внедрение функции «Спроси» (Ask) в свои ключевые сервисы. Первым значимым обновлением стали Google Maps, которые теперь способны обрабатывать сверхсложные запросы. В качестве примера приводится ситуация: ребенок упал в пруд с утками, а до свадьбы осталось 30 минут — ИИ мгновенно находит ближайший магазин одежды на пути к торжеству .
Аналогичный подход применили к YouTube:
- Ask YouTube полностью переосмысляет поиск видеоконтента. Пользователь может задать конкретный вопрос (например, как научить ребенка ездить на двухколесном велосипеде, если он уже умеет пользоваться беговелом), и система выдаст не просто список роликов, а структурированные советы с прямыми ссылками на нужные фрагменты видео .
- Система сохраняет контекст беседы, позволяя задавать уточняющие вопросы, например, о выборе типа тормозов, и может оформлять данные в сравнительные таблицы .
В сервисе Docs Live появилась возможность «голосового брейншторма». Пользователь может в реальном времени диктовать хаотичные мысли, а Gemini превращает их в структурированный черновик. В демо-ролике инженер подготовил речь для выпускников, попросив ИИ вытащить данные из резюме на Google Drive, добавить смешные аналогии и оформить логистику мероприятия из электронной почты прямо в шапку документа . В будущем Google обещает полную поддержку редактирования документов исключительно голосом .
🎬 Gemini Omni и редактирование реальности 3:39
Новая модель Gemini Omni позиционируется как мультимодальный гигант, способный создавать любой контент из любого входящего сигнала. Она объединяет интеллект Gemini с возможностями генеративных медиа-моделей, таких как VO, Nano Banana и Genie .
Ключевые особенности Omni:
- Интуитивная физика: Модель демонстрирует понимание кинетической энергии и гравитации при генерации видео, что ранее было слабым местом ИИ-систем .
- Итеративное творчество: Процесс создания видео теперь разговорный. Пользователь может дать Omni свое селфи-видео и попросить изменить стиль, освещение или добавить элементы, буквально «меняя реальность» .
- Контроль подлинности: Через Synth ID и Content Credentials Google внедряет маркировку контента. Прямо в поиске или браузере Chrome можно будет нажать правой кнопкой мыши и узнать, было ли изображение создано или отредактировано нейросетью .
К инициативе Synth ID по маркировке вотермарками присоединились такие игроки, как OpenAI, Kakao и ElevenLabs .
⚡ Gemini 3.5 Flash и фреймворк Anti-gravity 6:56
Google анонсировала Gemini 3.5 Flash — модель, оптимизированную для скорости и выполнения действий. По утверждению компании, Flash превосходит версию 3.1 Pro в большинстве бенчмарков, особенно в кодинге и экономических задачах (тест GDP-val) . Модель в четыре раза быстрее других «фронтирных» моделей по количеству токенов в секунду .
Главным технологическим прорывом стал Anti-gravity 2.0:
- Это специализированная среда (harness) для работы ИИ-агентов.
- Она включает SDK, поддержку CLI и нативную интеграцию с Firebase и Android.
- Система ориентирована на мультиагентную оркестрацию и асинхронное управление задачами .
Чтобы продемонстрировать мощь связки Gemini 3.5 Flash и Anti-gravity, разработчики показали, как агент собрал работающую операционную систему с нуля, на которой удалось запустить игру Doom .
✨ Gemini Spark: персональный агент за $100 в месяц 10:26
Самым амбициозным продуктом стал Gemini Spark — персональный ИИ-агент, работающий 24/7 на выделенных виртуальных машинах в Google Cloud. В отличие от обычных чат-ботов, Spark выполняет длительные задачи в фоновом режиме, даже если ноутбук пользователя закрыт .
Spark интегрируется со всеми инструментами Google и сторонними сервисами через протокол MCP. Примеры задач:
- Найти все встречи с руководством и выделить их в календаре ярко-розовым цветом .
- Написать приглашение соседу на вечеринку.
- Составить список дел для детей до конца учебного года, распределив их по приоритетам и дедлайнам .
Стоимость использования Spark в рамках нового тарифного плана Ultra составит $100 в месяц. Для корпоративных пользователей с максимальными лимитами цена была снижена с $250 до $200 в месяц . Позже в этом году Spark появится прямо в Chrome и станет основой «агентского браузера», а также получит домашнюю базу на смартфонах — Android Halo .
🔍 Эра поисковых агентов и интерактивного UI 13:32
Классическая строка поиска Google претерпела самое значимое изменение за 25 лет. Поиск превращается в систему информационных агентов .
- Фоновое сканирование: Можно поручить агенту непрерывно искать квартиру по заданным критериям (естественный свет, локация) или отслеживать дропы кроссовок, мониторя блоги и форумы в реальном времени .
- Генеративный UI: Благодаря Anti-gravity, поиск теперь может «на лету» кодировать интерактивные виджеты. Например, по запросу об астрофизике Google создает трехмерную модель черной дыры, с которой можно взаимодействовать для понимания искривления пространства-времени .
- Universal Cart: Умная корзина покупок, которая работает во всех сервисах Google. Она автоматически отслеживает падение цен, историю стоимости и наличие товара, позволяя совершать покупки прямо из Gmail или YouTube .
🎨 Креативные инструменты и Neural Expressive 17:41
Визуальный язык Gemini был полностью переработан и получил название Neural Expressive. Дизайн включает плавные анимации, тактильную отдачу и возможность выбора региональных диалектов для голосового общения (например, акцент Ливерпуля) .
В линейке творческих инструментов представлены:
- Google Pix: Инструмент в Workspace для создания и редактирования изображений (флаеры, инфографика) с глубоким пониманием объектов на холсте .
- Google Flow: Позволяет трансформировать видео, менять углы камеры на 360 градусов и выполнять масштабные правки контекста (например, превратить утро в ночь на всех кадрах сразу) .
- Flow Music: Помогает музыкантам создавать демо-записи. Можно напеть мелодию или сыграть рифф, а ИИ превратит это в полноценную аранжировку в выбранном жанре (например, R&B с женским вокалом) .
👓 Очки дополненного слуха и путь к AGI 28:32
Осенью 2026 года Google планирует выпустить свои первые аудио-очки. В устройстве нет дисплея — взаимодействие происходит исключительно через звук. Очки позволяют пользоваться навигацией, совершать звонки и подтверждать заказы в Door Dash голосом, не доставая телефон . Они также интегрируются с умными часами для отображения превью фото, которые можно мгновенно обрабатывать через Nano Banana .
В завершение презентации Сундар Пичаи затронул тему безопасности и будущего:
- AGI и Сингулярность: По мнению Пичаи, человечество находится «у подножия сингулярности». Если AGI будет построен правильно, это приведет к новому золотому веку прогресса .
- Кибербезопасность: Запущен агент Code Mender, который автоматически находит и исправляет уязвимости в коде .
- Наука и медицина: Представлен Gemini for Science и проект Alpha Earth (цифровой двойник планеты). В Isomorphic Labs уже ведутся доклинические испытания лекарств от рака и иммунных расстройств, созданных с помощью ИИ .
По словам главы Google, целью компании остается полное излечение всех болезней в будущем, что еще несколько лет назад казалось невозможным .