Google запускает Gemini 1.5 Flash и открывает бета-тест Project IDX

Google for Developers 37 млн 5 мин 3 мин 14.05.2024
Главное

На 16-й ежегодной конференции Google I/O команда Google for Developers представила масштабный пакет обновлений своей ИИ-экосистемы, нацеленный на предоставление доступа к генеративному искусственному интеллекту каждому разработчику на планете. В рамках пятиминутного технологического доклада были анонсированы новые инструменты, расширение доступности флагманских моделей и запуск специализированных фреймворков. Главный акцент сделан на поиске баланса между качеством, стоимостью и скоростью вычислений при интеграции нейросетей в реальные продукты.

🌐 Глобальная доступность Gemini и баланс вычислений 0:04

Google продолжает стратегическое развертывание инструментов на базе генеративного ИИ для глобального сообщества разработчиков, насчитывающего миллионы специалистов. С целью упрощения интеграции ИИ в приложения через стандартные API-интерфейсы, модели семейства Gemini были внедрены в ключевые среды разработки и сервисы:

Поиск оптимального ИИ-решения требует от создателей софта балансирования трех критических факторов: качества, стоимости и скорости. В качестве ответа на этот запрос компания открыла доступ к модели Gemini 1.5 Flash. Начать работу с ней можно через Gemini API и платформу Google AI Studio, география присутствия которой расширилась до более чем 200 стран и территорий.

📱 Локальный ИИ и мультимодальные возможности в Android 1:12

Для задач, выполняемых непосредственно на клиентских устройствах, Google предлагает использовать Gemini Nano — наиболее эффективную модель компании для on-device вычислений. Ее запуск на мобильных устройствах обеспечивает минимальную задержку (low latency) при обработке запросов и гарантирует конфиденциальность данных, поскольку информация не покидает девайс. Одним из примеров применения технологии является генерация умных ответов в мессенджерах.

В сфере мобильной разработки были анонсированы следующие важные шаги:

Мультимодальные возможности Gemini 1.5 Pro позволяют обрабатывать сложные входные данные высокого качества. В ходе демонстрации разработчики загрузили в модель изображение чернового интерфейса (wireframe) приложения и отправили текстовый промт с требованием создать экран с помощью Jetpack Compose, максимально приближенный к картинке, используя Material 3 и импортируя необходимые библиотеки. Модель успешно сгенерировала готовый код для Main Activity, который был мгновенно проверен в интерактивном окне предварительного просмотра (composed preview).

Кроме того, начиная с версии Chrome 126, модель Gemini Nano будет встроена непосредственно в десктопный клиент браузера. Это позволит реализовать локальную функцию «Help me write», помогающую пользователям создавать короткие тексты — от отзывов на продукты до постов в социальных сетях и форм обратной связи.

🛠 Развертывание платформ: Публичная бета Project IDX и Firebase Genkit 2:58

Google стремится оптимизировать процессы сборки, тестирования и развертывания приложений с ИИ на Android, в веб-среде и на других платформах. В рамках этой инициативы облачная среда разработки Project IDX была переведена в стадию публичного бета-тестирования без списков ожидания.

Платформа IDX предлагает несколько вариантов быстрого старта:

Параллельно развивается экосистема Firebase. Для ускорения разработки кроссплатформенных ИИ-функций представлен новый фреймворк интеграции — Firebase Genkit. На текущий момент Genkit находится в режиме беты для Node.js, а поддержка языка Go ожидается в ближайшее время. Фреймворк предоставляет унифицированный API для работы с различными большими языковыми моделями (LLM). По утверждению создателей, благодаря Genkit тестирование новой модели сводится к изменению всего одного аргумента в коде.

🔓 Эволюция открытых моделей Gemma 2 4:03

Для сценариев, требующих повышенной гибкости, глубокой настройки (fine-tuning) и заземления (grounding) моделей под специфические бизнес-кейсы, Google развивает семейство открытых моделей Gemma.

В этой линейке произошли существенные изменения:

Главным анонсом в данном блоке стало превью нового поколения моделей — Gemma 2. По заявлениям представителей Google, данное решение обладает совершенно новой архитектурой, которая обеспечивает выдающуюся производительность (stellar performance) и при этом способна эффективно функционировать на одном тензорном процессоре TPU v5e.

💬 Цитаты

«Поиск оптимального ИИ-решения требует от создателей софта балансирования трех критических факторов: качества, стоимости и скорости.»

Ведущий канала Google for Developers 0:46

«Genkit находится в режиме беты для Node.js, а поддержка языка Go ожидается в ближайшее время.»

Ведущий канала Google for Developers 3:50
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
on-device вычисления
Обработка данных непосредственно на устройстве пользователя без отправки на удаленные сервера.
инференс
Процесс работы уже обученной нейросети по выполнению конкретной задачи или генерации ответа.
вайрфрейм (wireframe)
Простой визуальный набросок или макет интерфейса приложения.
TPU (Tensor Processing Unit)
Специализированный тензорный процессор, разработанный Google для ускорения задач машинного обучения.
📊 Цифры
🗓 Хронология
  1. Май 2024 Проведение 16-й конференции Google I/O и анонс широкой доступности Gemini 1.5 Flash.
  2. Апрель 2024 Релиз открытых моделей CodeGemma и RecurrentGemma.
  3. Июнь 2024 (Chrome 126) Планируемый встроенный запуск Gemini Nano в десктопную версию Chrome.
⚖️ Другая сторона
Искусственный интеллект Google I/O Gemini 1.5 Flash Firebase Genkit Project IDX Gemma 2