# Тест Nano Banana: как Gemini 2.5 Flash редактирует фото и дорисовывает реальность

Источник: https://www.youtube.com/watch?v=A_HVAflCg8E
Канал: Wes Roth
Опубликовано: 27.08.2025

---

Компания Google представила новую технологию редактирования и генерации изображений под кодовым названием Nano Banana, которая интегрирована в модель Gemini 2.5 Flash. Ведущий YouTube-канала Wes Roth протестировал возможности нейросети на собственных фотографиях, сделанных на конференции AI4 в Лас-Вегасе, чтобы выяснить, насколько далеко продвинулся искусственный интеллект в понимании контекста, сохранении идентичности персонажей и естественном редактировании сложных сцен.

## 🍌 Что такое Nano Banana: первый взгляд на Gemini 2.5 Flash
[[JUMP:0:00]]

Название «Nano Banana» изначально было внутренним кодовым именем проекта, который теперь представлен как часть возможностей модели Gemini 2.5 Flash по работе с изображениями [0:12]. Инструмент доступен пользователям через платформу Google AI Studio по адресу studio.google.com [0:25]. Одной из ключевых особенностей модели является её способность не просто генерировать картинки с нуля, но и глубоко модифицировать существующие файлы, используя текстовые запросы на естественном языке.

В ходе первых тестов Уэс Рот применил нейросеть к превью (thumbnail) своего видео. Результаты показали следующее:

*   **Сохранение идентичности:** При добавлении «длинных светлых волос» модель сохранила черты лица автора, обеспечив высокую консистентность персонажа [0:38].
*   **Работа с текстом:** Нейросеть успешно изменила надписи на картинке, сохранив оригинальный шрифт и стиль оформления [0:51].
*   **Стилизация текста:** При запросе превратить слово в «граффити» модель справилась с задачей, хотя, по мнению автора, результат выглядел «слишком аккуратным» для уличного искусства [1:03].
*   **Изменение фона:** Модель корректно перенесла объект в космос, создав детализированное изображение черной дыры на заднем плане [0:51].

## 🧑‍🤝‍🧑 Удаление объектов и «достраивание» реальности
[[JUMP:1:30]]

Одним из самых впечатляющих тестов стало редактирование группового фото, на котором были запечатлены Уэс Рот, AI-блогер Дилан Кьюриос (Dylan Curious) и его ассистентка Алисса [1:44]. Автор поставил задачу удалить Алиссу, стоящую в центре между мужчинами.

Результат превзошел ожидания автора: нейросеть не просто удалила человека, но и безупречно восстановила фон [1:57]. Особенно поразила Уэса работа с архитектурными деталями:

1.  В оригинале за спиной Алиссы находилась колонна, основание которой было полностью скрыто [2:22].
2.  Модель Gemini 2.5 Flash проанализировала соседнюю колонну и в точности воссоздала узор на основании скрытой колонны [3:01].
3.  Нейросеть корректно дорисовала плитку на полу и пальмы на заднем плане [3:26].

По мнению Уэса Рота, хотя технология удаления объектов существует с 1940-х годов, современная реализация в исполнении Google поражает своей скоростью (около 13 секунд на сложный запрос) и способностью к логическому выводу о структуре невидимых объектов [2:36], [3:14].

## 🛡️ Броня из бананов и проблемы идентификации
[[JUMP:6:08]]

Экспериментируя с более экстравагантными запросами, Уэс попытался примерить «банановую броню», вдохновившись работами другого блогера — Madvid Pro [6:08]. Этот тест выявил определенные особенности работы модели с несколькими людьми в кадре.

При запросе «заставь меня носить пластинчатую броню, похожую на банан», нейросеть применила эффект к человеку, стоящему справа, предположив, что именно он является автором запроса [6:59]. Когда Уэс уточнил запрос, указав «мужчину справа», модель сгенерировала детализированный и «устрашающий» доспех в ярко-желтых тонах [7:11]. Автор отметил, что модель проявляет определенную «интеллектуальность», интерпретируя даже не совсем точные команды [7:39].

## 📸 Реставрация фото и работа со светом
[[JUMP:4:06]]

Нейросеть была протестирована в задачах улучшения качества старых и дефектных снимков. Результаты оказались неоднозначными:

*   **Исторические фото:** Попытка раскрасить и повысить четкость знаменитого фото Сталина привела к тому, что один из людей на снимке просто исчез [4:47]. Уэс в шутку назвал это «очень сталинским подходом» [4:47].
*   **Исправление дефектов линзы:** На одном из селфи с конференции из-за грязного объектива образовались сильные засветы (lens flares) [11:36]. После нескольких итераций и уточнения запроса («полностью удалить все световые блики»), Nano Banana смогла очистить изображение, сохранив читаемость лиц, хотя мелкий текст на заднем плане был искажен [12:30].
*   **Цветокоррекция:** Модель за 46 секунд успешно удалила сильный красный оттенок с фотографии, сделанной в помещении с плохим освещением, сделав цвета естественными [8:31].

## 🪞 Физика отражений и материалов
[[JUMP:13:25]]

Особое внимание в обзоре уделено способности ИИ имитировать физические свойства поверхностей. В интерьере отеля Bellagio Уэс просил изменить пол:

*   **Зеркальный пол:** Модель хорошо справилась с созданием отражений, хотя иногда путала пол с поверхностью столов [13:37].
*   **Матовый черный:** Запрос на создание покрытия, похожего на матовую краску автомобилей, был выполнен частично — нейросеть закрасила большую часть пола, но оставила пробелы в сложных участках [13:50].
*   **Отражения в броне:** На одном из сгенерированных изображений, где авторы были одеты в блестящие металлические кирасы, Уэс заметил поразительную деталь — в доспехах отражались не только неоновые огни Вегаса, но и силуэт человека, который якобы делает фото [16:37]. В оригинальном снимке этого отражения не было, и нейросеть сама «догадалась», что при наличии фотографа его отражение должно присутствовать на металле [16:51].

## 🚫 Ограничения и этические фильтры
[[JUMP:18:24]]

В процессе тестирования были обнаружены жесткие рамки, установленные разработчиками Google:

1.  **Изменение телосложения:** Уэс попытался создать изображение себя без рубашки («shirtless»). Модель выполнила запрос, создав реалистичное тело, однако наотрез отказалась вносить изменения в мускулатуру [18:52]. Любые попытки добавить «рельефный пресс» или «широкие плечи» игнорировались — нейросеть выдавала практически идентичные варианты с минимальными правками [19:04]. По мнению автора, Google установил очень узкий диапазон допустимых изменений для подобных фото [19:16].
2.  **Итеративное редактирование:** При попытке внести длинную цепочку изменений (например, сначала переместить героев на мостик корабля Enterprise из Star Trek, а затем надеть на них униформу), модель начала терять внешнее сходство с реальными людьми [19:54].
3.  **Водяные знаки:** Все изображения, созданные или отредактированные через этот инструмент, помечаются водяным знаком в нижнем левом углу (технология SynthID) [21:28].

## 🏁 Будущее фоторедактирования
[[JUMP:21:01]]

Подводя итоги, Уэс Рот выразил уверенность, что подобные инструменты скоро заменят Photoshop для большинства обычных пользователей [21:14]. Вместо изучения сложных интерфейсов и инструментов выделения, пользователю достаточно общаться с ИИ на естественном языке.

Ведущий также привел мнение одного из зрителей своего прямого эфира, который считает, что «приложения для знакомств обречены» [22:06]. Возможность легко изменить свою внешность, машину на заднем плане или местоположение создает серьезные риски для верификации реальности в цифровом пространстве. Тем не менее, Уэс признает Nano Banana «чрезвычайно впечатляющей» моделью, которая работает стабильно даже в первый день публичного релиза [21:01].