Google представила Gemma 4: открытые ИИ-модели с лицензией Apache 2.0

Google for Developers 12,4 тыс. 47 мин 5 мин 22.05.2026
Главное

На конференции Google для разработчиков команда Google DeepMind представила Gemma 4 — новое поколение семейства открытых языковых моделей, спроектированных для максимальной эффективности на локальных устройствах. В центре внимания — переход на открытую лицензию Apache 2.0, значительное расширение контекстного окна и демонстрация работы ИИ в реальных условиях: от управления роботами до помощи слабовидящим бегунам.

🚀 Философия Gemma 4: Интеллект на каждый ватт 0:03

Оливье, продуктовый лидер команды Gemma, подчеркнул, что проект начался в начале 2024 года с простой идеи: создать модель, которую можно запустить где угодно и полностью настроить под свои нужды . Главным приоритетом разработчиков стала эффективность — достижение максимального уровня «интеллекта на ватт» потребляемой мощности. По мнению команды, открытые веса моделей (open weights) позволяют разработчикам гибко проводить дообучение (fine-tuning) под специфические задачи .

В семейство Gemma 4 вошли четыре основных размера моделей:

Одним из самых значимых изменений стал переход с кастомной лицензии Gemma на популярную лицензию Apache 2.0. Оливье отметил, что это даст разработчикам полный контроль при развертывании моделей в продакшене, что было встречено аудиторией с особым энтузиазмом .

🧠 Технологический скачок и бенчмарки 5:43

Технический прогресс семейства Gemma демонстрирует впечатляющую динамику. Оливье привел данные, согласно которым новая модель размером всего 2B параметров в этом цикле разработки сравнялась или даже превзошла по возможностям модель 27B предыдущего поколения . «Это дает мне огромную надежду на будущее. Возможно, в следующем году мы сможем уместить возможности модели 31B в ваш карман для полностью локальной работы на телефоне», — поделился прогнозом спикер .

Ключевые технические обновления Gemma 4:

Для повышения скорости работы была представлена технология MTP Drafter, позволяющая использовать спекулятивное декодирование. По данным Google, это обеспечивает ускорение вывода до 3 раз .

☁️ Развертывание в облаке: от одного клика до полного контроля 9:03

Гас, продуктовый менеджер Gemma, подробно разобрал варианты использования моделей в облачной инфраструктуре Google Cloud. Он выделил три основных сценария, различающихся по сложности и уровню контроля:

  1. Gemini Enterprise Agent Platform (ранее Vertex AI): решение «среднего уровня». Позволяет развернуть модель в один клик, выбрав нужный графический процессор (например, H100 или RTX 6000). Также доступна модель 26B как сервис (Model-as-a-Service) с оплатой за токены .
  2. Google Kubernetes Engine (GKE): вариант для продвинутых пользователей. Дает полный доступ к виртуальным машинам и всем настройкам конфигурации для максимальной оптимизации под конкретные задачи .
  3. Cloud Run: самый простой способ. Позволяет развернуть Gemma всего парой строк кода. Система автоматически масштабируется до нуля, если запросов нет, и может мгновенно развернуться до 100 GPU при пиковых нагрузках .

🛠️ Агенты в действии: от бизнес-аналитики до «вайб-кодинга» 15:44

Одной из самых ярких демонстраций стала работа модели Gemma 31B над задачей оптимизации выручки системы городского проката велосипедов. Модель получила доступ к базе данных BigQuery через сервер MCP (Model Context Protocol).

Ян Валентайн продемонстрировал возможности «вайб-кодинга» (vibe coding) на примере игры AI Venture. В этом ретро-квесте игрок может попросить персонажа-курицу написать веб-приложение. Модель Gemma 4 на лету генерирует HTML, CSS и JavaScript, которые тут же отрисовываются в игровом iframe . Также он показал параллельную работу 15 агентов на одном ноутбуке, которые одновременно генерировали векторную графику и код на разных языках программирования (Rust, JS, Python) .

📱 Локальный ИИ: мобильные устройства и робототехника 27:38

Команда уделила много времени работе ИИ без доступа к интернету. Ян показал работу приложения Google AI Edge Gallery на смартфоне Pixel, где Gemma 4 решала задачи в офлайн-режиме:

В области робототехники была представлена модель Richie Mini (совместная разработка с Hugging Face и Pollen Robotics) — социальный робот, который может видеть шахматную доску, объяснять правила игры и даже расстраиваться из-за проигрыша . Еще более миниатюрный пример — «умные утки» на базе Raspberry Pi 5 и Jetson Orin Nano, которые используют Gemma 4 для общения с окружающими .

Особое внимание уделили прототипу Gemma running agent. Это система для слабовидящих бегунов, которая через умные очки анализирует окружение и дает голосовые подсказки в реальном времени: «держись этой дорожки», «впереди поворот налево», «слева спортивный инвентарь» . По мнению Оливье, именно такое использование ИИ для повышения доступности среды воплощает идею «ИИ во благо» .

🌐 «Gemmaverse»: Экосистема и сообщество 43:23

В завершение Гас рассказал о масштабах экосистемы Gemma. На текущий момент зафиксировано более 500 миллионов загрузок моделей семейства . Сообщество создало более 100 000 вариантов Gemma, адаптированных под специфические нужды.

Примеры успешных модификаций:

Представители Google призвали разработчиков продолжать эксперименты, подчеркнув, что возможности Gemma теперь простираются от крошечных плат Coral для носимых устройств до мощных облачных кластеров .

💬 Цитаты

«Наша философия — дать вам максимально возможную эффективность при запуске ИИ на локальной машине.»

«Модель 2B в этом цикле не уступает или даже превосходит модель 27B прошлого года.»

«Комбинация локального ИИ, работающего офлайн и помогающего людям, — это то, каким должен быть ИИ во благо.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Open weights
Модели с открытыми весами, которые позволяют пользователям запускать и настраивать их на своем оборудовании, в отличие от проприетарных API.
Mixture of Experts (MoE)
Архитектура нейросети, где для каждого запроса активируется только часть нейронов, что ускоряет работу при большом общем количестве параметров.
Speculative decoding
Метод ускорения генерации текста, при котором маленькая модель предсказывает токены, а большая их проверяет.
MCP (Model Context Protocol)
Протокол, позволяющий ИИ-моделям безопасно подключаться к внешним источникам данных и инструментам.
📊 Цифры
🗓 Хронология
  1. Начало 2024 Запуск первой линейки открытых моделей Gemma.
  2. Май 2024 (примерно) Анонс Gemma 2 и расширение семейства.
  3. Текущий момент (2024/2025) Выход Gemma 4 с лицензией Apache 2.0 и улучшенной мультимодальностью.
⚖️ Другая сторона
Искусственный интеллект Google DeepMind Gemma 4 Apache 2.0 Mixture of Experts MTP Drafter