Нейронные клеточные автоматы: как MNIST классифицирует сам себя по мнению Килчера

Yannic Kilcher 13,7 тыс. 30 мин 3 мин 02.09.2020
Главное

Янник Килчер разбирает интригующую работу «Self-classifying MNIST Digits», в которой традиционная задача классификации изображений решается не через глобальный классификатор, а с помощью децентрализованного взаимодействия «умных» пикселей. Авторы исследуют, как локальные правила коммуникации между клетками могут привести к глобальному согласию всей системы о том, какой объект она собой представляет.

🧩 Клеточный разум: как пиксели находят общий язык 0:01

Представьте, что каждый пиксель на изображении — это живая клетка, способная общаться только со своими ближайшими соседями. В этой модели, называемой нейронными клеточными автоматами (NCA), нет центрального процессора, который «видит» всю картинку целиком. Вместо этого клетки обмениваются сообщениями, чтобы прийти к консенсусу: какую именно цифру из набора MNIST они сейчас образуют.

Янник Килчер демонстрирует это на живом примере: когда на холсте рисуется цифра, клетки начинают «пульсировать», передавая сигналы, пока вся область не окрасится в цвет, соответствующий определённому классу (например, серый для семерки или зеленый для тройки). По мнению ведущего, это исследование не ставит целью побить рекорды точности в классификации, а направлено на изучение биологических принципов самоорганизации и регенерации сложных анатомических структур.

🛠 Механика общения: векторы состояния и свертки 5:52

Каждая клетка обладает собственным вектором состояния, который включает:

Классификация считается успешной, когда значение в одном из 10 целевых слотов становится максимальным и совпадает у всех активных клеток. Чтобы обновить своё состояние, клетка анализирует соседей. Биологическая логика здесь в том, что все клетки следуют одному и тому же правилу обновления, независимо от их местоположения.

Технически это реализовано через операцию свертки $3 \times 3$, которая применяется рекуррентно. Янник Килчер подчеркивает, что это фактически рекуррентная нейронная сеть (RNN) с остаточными (residual) связями, где один и тот же обученный фильтр свертки используется на каждом шаге итерации.

🧬 Обучение через мутации и борьба за выживание 14:44

Для того чтобы система была устойчивой к изменениям в реальном времени, авторы применили стратегию «мутаций». Процесс выглядит так:

  1. Клетки инициализируются случайным образом и обучаются распознавать цифру MNIST.
  2. Через 200 шагов итерации цифра на холсте внезапно меняется с вероятностью 90%.
  3. Клетки, которые остались «живыми» (находятся на линиях новой цифры), сохраняют часть старого состояния, а новые клетки инициализируются случайно.

Такой подход заставляет нейросеть постоянно находиться в «состоянии готовности» к изменениям. Однако Янник Килчер отмечает проблему: со временем точность и уровень согласия между клетками могут начать снижаться. Исследователи обнаружили, что значения в векторах состояний имеют тенденцию к бесконечному росту, что в итоге дестабилизирует систему.

📉 Математическая ловушка: почему Softmax взрывает веса 19:31

Проблема кроется в стандартном подходе к классификации — использовании функции Softmax и кросс-энтропийной потери.

Формула Softmax выглядит следующим образом: $$\sigma(\mathbf{z})i = \frac{e^{z_i}}{\sum{j=1}^K e^{z_j}}$$

Янник Килчер объясняет: поскольку экспонента никогда не достигает нуля, функция потерь всегда будет подталкивать «правильный» логит вверх, а остальные — вниз, в область отрицательных значений. В обычной сети, где проход совершается один раз, это не критично. Но в клеточном автомате, где итерации повторяются бесконечно, численные значения весов начинают «взрываться», пытаясь минимизировать потерю до недостижимого идеала.

Чтобы купировать этот эффект, авторы предложили два решения:

🎭 Химеры и скрытые смыслы: что видят клетки

[[JUMP:26:20] ]

Одним из самых интересных свойств модели является её реакция на «химерные» или некорректные изображения. Если нарисовать фигуру, не похожую ни на одну цифру, клетки не смогут договориться и будут постоянно менять своё «мнение», создавая эффект мерцания. Это демонстрирует естественную устойчивость системы к данным, выходящим за рамки обучающей выборки (out-of-distribution).

Визуализация латентных состояний показала, что разные каналы «общения» клеток специализируются на определенных геометрических примитивах:

В завершение Янник Килчер признается, что в восторге от формата публикации в журнале Distill, который позволяет читателю взаимодействовать с демо-версиями прямо в тексте. По его мнению, такие биологически обоснованные модели — это перспективное и крайне эффективное с точки зрения ресурсов направление для современных исследований в области ИИ.

💬 Цитаты

«Это не про современный уровень точности (state-of-the-art) в классификации цифр, это про нейронные клеточные автоматы.»

Янник Килчер 01:20

«Биологическая логика в том, что все клетки следуют одним и тем же правилам, но за счет их общения возникают глобальные паттерны.»

Янник Килчер 11:52

«Формат журнала Distill — это будущее науки, вместо восьмистраничных PDF-файлов вы получаете интерактивное демо.»

Янник Килчер 29:12
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
MNIST
Классический набор данных в машинном обучении, состоящий из 70 000 рукописных цифр.
Нейронные клеточные автоматы (NCA)
Модель, сочетающая принципы клеточных автоматов с нейронными сетями для выполнения сложных вычислительных задач.
Softmax
Функция, преобразующая вектор чисел в вектор вероятностей, где сумма всех элементов равна единице.
L2-потеря
Метод оценки ошибки, основанный на квадрате разности между предсказанным и реальным значением (евклидово расстояние).
Out-of-distribution (OOD)
Данные, которые существенно отличаются от тех, на которых обучалась модель.
📊 Цифры
🗓 Хронология
  1. Ранее Выход первой работы авторов про «растущие» нейронные клеточные автоматы (Growing NCA).
  2. Настоящее время Публикация статьи «Self-classifying MNIST Digits» и её разбор Янником Килчером.
⚖️ Другая сторона
Искусственный интеллект MNIST Neural Cellular Automata Янник Кильхер Machine Learning Distill