Time-Travel Rephotography: как нейросети восстанавливают облик Авраама Линкольна

Two Minute Papers 847 тыс. 6 мин 2 мин 24.02.2021
Главное

🎩 Реконструкция прошлого: как нейросети «оживляют» Авраама Линкольна 0:00

Современные нейросетевые технологии позволяют совершать настоящие путешествия во времени, восстанавливая старинные фотографии и видеозаписи с поразительной точностью. Автор канала Two Minute Papers, доктор Карой Жолнай-Фехер (Károly Zsolnai-Fehér), представляет новую методику, которая объединяет реставрацию, колоризацию и суперразрешение, позволяя по-новому взглянуть на облик исторических личностей, таких как Авраам Линкольн.

🛠 Проблема «пластиковой» кожи и старой оптики 1:13

Старинные снимки часто страдают от множества дефектов: отсутствующих данных, мерцания, избыточной детализации морщин и искаженной цветопередачи. Одной из главных проблем является отсутствие эффекта подповерхностного рассеяния (subsurface scattering) — процесса, при котором свет проникает в кожу, отражается внутри нее и выходит наружу. Именно из-за нехватки этого эффекта лица на старых фото часто выглядят неестественно «пластиковыми».

Ранее попытки реставрации приводили к сохранению этих искажений:

🚀 Time-Travel Rephotography: прорыв в качестве 2:54

Новая технология, получившая название Time-Travel Rephotography, решает эти задачи комплексно. Она не просто восстанавливает пиксели, а фактически «переснимает» исторический кадр с помощью современных алгоритмов.

Преимущества метода:

🧠 Как обучить нейросеть без пары «до и после»? 3:10

Главная сложность обучения заключается в отсутствии «эталонных» пар изображений, где одна и та же историческая личность сфотографирована на старую камеру и современный фотоаппарат. Исследователи применили блестящую стратегию, заменив сложную задачу реставрации более простой задачей морфинга.

Технический процесс выглядит так:

  1. Генерация «двойника»: нейросеть создает фотореалистичное изображение некоего человека, который отдаленно напоминает целевую личность и имеет проработанные детали.
  2. Морфинг: используя технику StyleGAN2, этот «сгенерированный» человек морфится (трансформируется) в Авраама Линкольна.
  3. Использование StyleGAN2: этот инструмент делает процесс морфинга быстрым и эффективным, позволяя избежать трудоемкой ручной реставрации.

📈 Прогрессия возраста и перспективы 4:24

Методика способна на большее, чем просто восстановление одного кадра — она поддерживает прогрессию возраста. Если у исследователей есть несколько фотографий человека (например, Томаса Эдисона) в разные периоды жизни, алгоритм может сгенерировать промежуточные этапы старения.

Несмотря на прогресс, технология еще не идеальна: в некоторых областях все еще могут возникать шум или размытие. Тем не менее, учитывая, что архитектура StyleGAN2 появилась всего чуть больше года назад, достигнутый результат является колоссальным скачком для индустрии.

💬 Цитаты

«Это по-настоящему похоже на то, что это фото было переснято на современную камеру.»

Карой Жолнай-Фехер 02:54

«Обмен сложной задачи на более простую. Абсолютно блестящая идея.»

Карой Жолнай-Фехер 04:09
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Подповерхностное рассеяние (subsurface scattering)
физический эффект проникновения света внутрь полупрозрачного объекта (например, кожи) и его рассеивания, что придает объекту реалистичный вид.
Суперразрешение (super-resolution)
процесс увеличения разрешения изображения с добавлением отсутствующих деталей с помощью алгоритмов.
StyleGAN2
популярная архитектура нейросетей для генерации высококачественных реалистичных изображений, разработанная NVIDIA.
Морфинг
эффект плавной трансформации одного изображения в другое.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект StyleGAN2 Time-Travel Rephotography Авраам Линкольн нейросети реставрация фото