# Google I/O: От текстового промпта до готового Android-приложения за 5 минут

Источник: https://www.youtube.com/watch?v=SSe1VmVrtw0
Канал: Google for Developers
Опубликовано: 23.05.2026

---

На конференции Google I/O представители компании представили масштабное обновление экосистемы искусственного интеллекта. Пейдж, руководитель отдела по связям с разработчиками в Google DeepMind, и Амар, отвечающий за продукт и дизайн в AI Studio, продемонстрировали, как нейросети Gemini превращаются из чат-ботов в полноценные инструменты разработки приложений, управления роботами и генерации миров.

## 🚀 Новое семейство моделей Gemini 3.5
[[JUMP:01:06]]

Темпы выпуска новых моделей в 2024 году стали, по выражению спикеров, «беспощадными» [01:06]. Основной акцент Google делает на расширении линейки Gemini 3.5, где каждая модель оптимизирована под конкретные задачи:

*   **Gemini 3.5 Pro:** остается флагманом для решения самых сложных интеллектуальных проблем [01:31].
*   **Gemini 3.5 Flash:** сбалансированная модель по скорости и стоимости, установленная по умолчанию в AI Studio [01:44].
*   **Gemini 3.1 Flash-Lite:** наиболее оптимизированное решение для сценариев с крайне низкой задержкой и минимальными затратами [02:11].

Амар отметил, что мобильное приложение AI Studio, которое выйдет в ближайшие недели, было в значительной степени создано с помощью модели 3.5 Flash [01:57]. Продукты семейства Gemini уже используют такие гиганты, как Databricks, GitHub, Harvey и Warp [02:25]. Ключевым преимуществом моделей является их нативная мультимодальность: они не просто понимают текст, изображения, аудио, видео и код, но и способны выдавать контент в различных форматах [02:37].

## 🧪 Playground: Анализ видео за копейки
[[JUMP:05:51]]

В обновленном интерфейсе Google AI Studio Playground разработчики могут экспериментировать с параметрами моделей и сразу получать готовые фрагменты кода для своих приложений [06:04]. В качестве примера Пейдж продемонстрировала анализ пятиминутного видео с динозаврами:

1.  Модель Gemini 3.1 Flash-Lite обработала видео объемом около 31 000 токенов [07:13].
2.  Система составила таблицу с именами динозавров, временными метками их появления и интересными фактами [07:00].
3.  Стоимость этой сложной операции составила всего около полутора центов [07:27].

Особое внимание уделили функции «Get Code», которая позволяет в один клик экспортировать логику промпта в Python, TypeScript или другие языки, включая настройки инструментов (Tool Calling) и конфигурации безопасности [07:41].

## 🎙️ Gemini Live: Мультимодальное общение в реальном времени
[[JUMP:08:06]]

Одной из самых впечатляющих функций стала Gemini Live, позволяющая вести с моделью живой диалог [08:07]. Система способна «видеть» экран пользователя и обсуждать его содержимое.

В ходе демо Gemini безошибочно распознала таблицу динозавров на экране и по просьбе Пейдж мгновенно перешла с английского на китайский язык, сохранив контекст обсуждения [09:55]. Модель поддерживает более 140 языков и может быть настроена через системные инструкции на использование конкретного диалекта, например, бразильского португальского [10:08].

Для повышения точности ответов Google интегрировала функцию «Grounding with Google Search» [10:23]. Это позволяет Gemini предоставлять актуальную информацию (например, прогноз погоды в Маунтин-Вью) со ссылками на источники данных [11:19].

## 🏗️ Build Mode: Создание приложений «силой мысли»
[[JUMP:11:58]]

Режим Build в AI Studio представляет собой среду «всё включено», где для создания работающего приложения достаточно текстового описания [12:10]. Амар продемонстрировал создание нативного Android-приложения для складного телефона:

*   **Промпт:** Разработка виртуального пианино, где на верхней половине экрана (складного устройства) отображается туториал, а на нижней — клавиши [12:49].
*   **Дизайн:** Система автоматически сгенерировала несколько тем оформления на выбор, включая элегантную темную тему с неоновым свечением [14:08].
*   **Код:** Приложение генерируется на языке Kotlin [14:48].
*   **Развертывание:** Прямо из браузера приложение было установлено на физическое складное устройство по USB за несколько секунд [15:53].

По словам Амара, скоро разработчикам станет доступна прямая дистрибуция созданных таким образом приложений в Play Store [16:42]. Кроме того, AI Studio теперь поддерживает интеграцию с Google Workspace, позволяя создавать инструменты для работы с Gmail и календарем через простые промпты [17:08]. В качестве шуточного примера была показана «Календарная рулетка» — приложение, которое случайным образом удаляет одно из совещаний в расписании пользователя [17:45].

## 🔓 Открытые модели Gemma и инфраструктура
[[JUMP:20:35]]

Помимо закрытых Frontier-моделей, Google активно развивает семейство открытых моделей Gemma. Новая Gemma 4 уже доступна для тестирования в AI Studio [20:48]. Основные характеристики:

*   Контекстное окно объемом 256 000 токенов [21:42].
*   Способность работать локально на ноутбуках (Gemma 4) и даже на мобильных устройствах (Gemma 2 на Pixel) [22:46].
*   Широкая поддержка сообществом на Hugging Face и Kaggle [21:27].

Для обучения и запуска этих моделей Google предлагает полный стек программного обеспечения для своих TPU (Tensor Processing Units). Команда DeepMind эксклюзивно использует библиотеку JAX для создания всей своей инфраструктуры [24:07]. Также были представлены инструменты MaxText для работы с текстом и Tunix для пост-обучения с использованием обучения с подкреплением (RL) [23:53].

В вопросах безопасности Google продвигает технологию SynthID для маркировки контента, созданного ИИ, в партнерстве с другими игроками индустрии [24:46].

## 🤖 Будущее: Робототехника и физические миры
[[JUMP:25:14]]

Будущее ИИ в понимании Google не ограничивается экранами. Модели Gemini уже интегрируются в робототехнику через Gemini Robotics 1.6 [25:54].

В качестве примера был упомянут проект Stanford Pupper — робопёс, детали которого напечатаны на 3D-принтере, а управление осуществляется через Raspberry Pi [26:07]. Благодаря Gemini Live API такой робот может понимать команды на естественном языке, например, «следуй за мной» или «принеси мяч», без специального предварительного обучения [26:47].

Другим прорывным направлением стала модель Genie 3 — семейство «моделей мира», которые понимают физику реальности [27:13]. Она способна генерировать интерактивные видео на основе промптов:

*   Пример с бумажным самолетиком, летящим над водопадом, продемонстрировал реалистичную динамику воды, брызги и корректное отражение света [27:52].
*   Пользователь может буквально «управлять» персонажем в сгенерированном мире с помощью клавиш со стрелками [27:27].

Амар и Пейдж подчеркнули, что мы входим в эру «AI-native» инструментов, где грань между идеей и готовым продуктом стирается [28:42]. По мнению Амара, разработчикам больше не нужно «просить разрешения» у технологий — достаточно просто описать свою мечту в окне промпта [28:55].