Почему GPT-4o «плавит» серверы: вирусный тренд Миядзаки и технические прорывы OpenAI

Wes Roth 41,6 тыс. 21 мин 4 мин 28.03.2025
Главное

Вирусный тренд «гиблификации» (превращения обычных фото в кадры в стиле легендарной анимационной студии) захлестнул социальные сети после выхода новой мультимодальной модели GPT-4o от OpenAI. Ведущий канала Wes Roth анализирует, почему этот безобидный на первый взгляд феномен стал критическим испытанием для инфраструктуры компании, как ИИ научился понимать объем без обучения 3D-графике и почему OpenAI сознательно выбрала эстетику Хаяо Миядзаки в качестве «мягкой силы» для запуска своих самых «развязных» технологий.

🌡️ «Плавящиеся» серверы и дефицит мощностей 0:00

Запуск GPT-4o (где «о» означает Omni — всеохватывающий) вызвал беспрецедентный наплыв пользователей, желающих протестировать генерацию изображений . Новая модель обучена не только на тексте, но и на звуке и визуальных данных одновременно, что позволяет ей создавать контент с поразительной точностью. По словам Уэса Рота, спрос оказался настолько велик, что OpenAI была вынуждена ограничить доступ .

Основные факты о текущем состоянии сервиса:

⚖️ Фейковые иски и реальные споры об авторском праве 1:32

В разгар тренда в Twitter завирусился пост пользователя, утверждавшего, что он получил официальное уведомление (Cease and Desist) от Studio Ghibli с требованием прекратить использование их интеллектуальной собственности . Автор поста называл себя «мучеником во имя воображения» и призывал юристов к борьбе.

Однако, как отмечает Уэс Рот, при ближайшем рассмотрении письмо оказалось виртуозным троллингом:

Уэс Рот подчеркивает, что по его мнению, чтение книг или просмотр картин машиной не является нарушением авторских прав, так как индексация данных поисковыми роботами (Google или Bing) давно считается нормой . По словам автора, нарушение происходит только в момент прямого воспроизведения защищенного контента для коммерческой выгоды .

🧠 Технический прорыв: от рекурсии до квантовой физики 3:02

Способность GPT-4o работать с текстом внутри изображений вышла на новый уровень. Основатель Shopify продемонстрировал возможности модели, создав детализированные интерфейсы и сложные визуальные концепции .

Интересные примеры использования:

📐 Как ИИ «понимает» 3D-пространство 8:35

Одним из самых удивительных свойств GPT-4o стала способность генерировать карты глубины (depth maps) . Это означает, что нейросеть понимает, какие объекты находятся на переднем плане, а какие — на заднем, хотя её обучали на плоских 2D-картинках.

Ведущий ссылается на исследование Гарвардского университета «Beyond Surface Statistics» (За пределами статистики поверхности), которое объясняет этот феномен:

🌸 Стратегия OpenAI: «Стиль Миядзаки» как щит 18:11

Уэс Рот обсуждает мнение аналитика Гранта Слейтона о том, что OpenAI невероятно повезло (или это был расчет), что первым вирусным трендом стал именно добрый стиль Studio Ghibli, а не «ужасающие дипфейки» .

По словам ведущего, GPT-4o технически гораздо более «развязана» (unhinged), чем предыдущие модели. Сотрудница отдела безопасности OpenAI в своем блоге подтвердила изменение подхода к «гардам» (защитным фильтрам) :

🎞️ Мнение Хаяо Миядзаки об ИИ 15:49

В завершение статьи стоит упомянуть позицию самого основателя Studio Ghibli. Хотя обсуждение в видео ведется в контексте 2024 года, Уэс Рот напоминает о знаменитом инциденте 2016 года, когда Миядзаки показали ранние наработки ИИ-анимации . Тогда великий аниматор назвал это «оскорблением самой жизни» и заявил, что «чувствует, что конец света близок», если люди собираются заменить человеческие усилия такими машинами. Впрочем, автор видео отмечает, что с тех пор технологии изменились до неузнаваемости.

💬 Цитаты

«Наши GPU плавятся. Мы временно введем ограничения на скорость генерации, пока работаем над эффективностью.»

Сэм Альтман 01:19

«Технические возможности ИИ начинают превосходить способности художников-людей. Это просто фактическое утверждение.»

«Это оскорбление самой жизни. Я твердо убежден, что мы близки к концу света.»

Хаяо Миядзаки 17:21
👥 Спикер
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
GPT-4o
Новая мультимодальная модель от OpenAI, способная обрабатывать текст, аудио и видео в реальном времени.
Linear Probe
Метод анализа нейронных сетей, позволяющий выявить, какие концепции (например, глубина) модель понимает неявно.
Depth Map
Изображение, где яркость пикселя соответствует расстоянию до объекта, используемое для создания 3D-эффектов.
Cease and Desist
Юридическое письмо с требованием прекратить противоправную деятельность.
📊 Цифры
🗓 Хронология
  1. 2016 Хаяо Миядзаки критикует ранние эксперименты с ИИ-анимацией.
  2. Май 2024 Релиз GPT-4o и начало массового тренда на изображения в стиле Ghibli.
  3. Май 2024 Сэм Альтман сообщает о перегрузке GPU-кластеров OpenAI.
⚖️ Другая сторона
Искусственный интеллект OpenAI GPT-4o Studio Ghibli Сэм Альтман Хаяо Миядзаки