Янник Кильхер: «Может ли мозг обучаться методом обратного распространения ошибки?»

🧠 Может ли мозг использовать обратное распространение ошибки? 0:00

Янник Кильхер (Yannic Kilcher) в своем обзоре анализирует научную работу Тимоти Лилликропа (Timothy Lillicrap), Адама Санторо (Adam Santoro), Люка Морриса (Luke Morris), Колина Акермана (Colin Ackerman) и Джеффри Хинтона (Geoffrey Hinton). Исследователи выдвигают гипотезу о том, как мозг может реализовать алгоритм, подобный обратному распространению ошибки (backpropagation), несмотря на давние утверждения о его биологической неправдоподобности.

⚖️ Ограничения традиционных подходов 1:50

Для обучения нейронных сетей существуют различные методы, каждый из которых имеет свои плюсы и минусы:

Обучение по Хеббу (Hebbian learning): Метод, не требующий внешней обратной связи. Он основан на самоподкрепляющихся процессах, где связи между нейронами обновляются на основе их предыдущих состояний. Однако без внешнего сигнала сеть не может «понять» мир.
Обучение с возмущением (Perturbation learning): Использует скалярный сигнал ошибки (например, «хорошо» или «плохо» для всей сети в целом). Проблема этого подхода в отсутствии подотчетности отдельных нейронов: сеть знает, что результат неверен, но каждый узел не получает инструкции о том, как именно ему изменить свои веса.
Обратное распространение ошибки (Backpropagation): Использует градиент ошибки для послойного обновления весов. Каждый нейрон получает точную инструкцию («векторную цель»), как именно изменить выходное значение для минимизации общей ошибки.

Кильхер отмечает, что именно этот метод обеспечивает наиболее быстрое и плавное обучение, и современные исследования показывают: внутренние представления сетей, обученных таким образом, поразительно напоминают нейронные структуры мозга.

🚫 Почему мозг «не мог» использовать backprop 13:28

Долгое время считалось, что backprop невозможен в биологических системах по нескольким причинам:

Синтаксическая симметрия: Для обратного прохода сигнала требуются зеркально симметричные связи между нейронами, что не соответствует реальной анатомии аксонов и дендритов.
Направленность сигналов: Сигналы ошибки в backprop могут быть отрицательными, в то время как нейроны мозга ограничены частотой импульсов (spiking rates), где ноль — это минимальное значение.
Разные типы данных: Прямой проход сети работает с активациями (импульсами), а обратный проход требует передачи градиентов («дельт»), что фундаментально другой тип данных, который нейроны, как считалось, не могут переключать.

🔄 Гипотеза «End-grad» и роль автокодировщиков 18:20

Авторы работы предлагают алгоритм, который обходит ограничения традиционного backprop, используя структуру автокодировщиков. Идея заключается в том, чтобы использовать локальные правила обновления вместо передачи сигнала через всю сеть.

Вместо попытки инвертировать саму ошибку, сеть использует аппроксимацию функции обратного хода (обозначим её как $G$ для функции прямого хода $F$):

Прямой проход: Входные данные проходят через веса $F$.
Обратный проход: Для исправления «ошибок» аппроксимации используется функция $G$, которая позволяет локально вычислить желаемое состояние нейронов в каждом слое.
Локальные обновления: Вся необходимая информация для обновления весов нейронов оказывается внутри одного слоя, что делает процесс биологически правдоподобным.

Кильхер подчеркивает, что этот алгоритм использует только положительные активации, совместимые с биологической природой нейронных импульсов.

🔬 Биологическая реализация 31:20

В завершающей части статьи авторы обращают внимание на современное понимание нейронов. Сегодня вычислительная нейробиология рассматривает нейроны гораздо более дифференцированно: например, разные участки сомы могут выполнять независимые вычисления, что может создавать основу для такого рода «локальных» алгоритмов.

Янник Кильхер заключает, что предложенный авторами алгоритм — это элегантный обходной путь, который позволяет переосмыслить возможности обучения в мозгу без необходимости в «магическом» обратном распространении классического типа.