# Аналоговый ренессанс: почему кремний уступает место физике токов

Источник: https://www.youtube.com/watch?v=GVsUOuSjvcg
Канал: Veritasium
Опубликовано: 01.03.2022

---

Стремительное развитие искусственного интеллекта столкнулось с фундаментальным физическим барьером кремниевой электроники и традиционной архитектуры фон Неймана. Чтобы обучать и запускать современные нейросети, требуются колоссальные объемы энергии, а закон Мура постепенно прекращает свое действие. В поиске выхода из этого технологического тупика инженеры и ученые обращаются к технологии прошлого — аналоговым вычислениям, которые способны выполнять сложнейшие математические операции за доли секунды, используя чистые законы физики.

## 🔌 Возвращение к истокам: что такое аналоговый компьютер
[[JUMP:0:00]]

В течение сотен лет аналоговые компьютеры оставались самыми мощными вычислительными машинами на Земле: они предсказывали затмения, рассчитывали морские приливы и управляли зенитными орудиями во время Второй мировой войны [0:00]. Однако с появлением твердотельных транзисторов цифровые компьютеры полностью вытеснили аналоговые технологии из коммерческого сектора [0:12]. Сегодня ситуация начинает стремительно меняться.

Ведущий канала Veritasium Дерек Мюллер наглядно демонстрирует работу аналогового компьютера [0:26]. Соединяя провода различными способами на коммутационной панели, он программирует устройство на решение сложных дифференциальных уравнений, например, симулируя затухающие колебания массы на пружине [0:26], [0:39]. На экране подключенного осциллографа в реальном времени отображается положение массы, причем Дерек Мюллер может мгновенно менять параметры затухания или жесткость пружины, сразу видя изменения графика [0:39].

Главное отличие аналогового компьютера от цифрового заключается в полном отсутствии двоичного кода — нулей и единиц [0:53]. Вместо этого внутри системы колеблется электрическое напряжение, выступая точным физическим аналогом реального процесса [1:06]. Изменив конфигурацию соединений, аналоговую систему можно перенастроить на расчет хаотического аттрактора Лоренца, моделирующего атмосферную конвекцию [1:19], [1:34].

Основные преимущества аналоговых вычислений перед цифровыми:

*   **Экстремальная энергоэффективность:** Для сложения двух 8-битных чисел цифровому процессору требуется около 50 транзисторов, тогда как аналоговому компьютеру достаточно просто соединить два провода для суммирования токов [2:01], [2:16].
*   **Мгновенное умножение:** Чтобы перемножить два числа, цифровой машине нужно около 1000 постоянно переключающихся транзисторов [2:16]. В аналоговой цепи для этого достаточно пропустить ток через резистор — напряжение на нем будет равно произведению тока на сопротивление ($V = I \times R$), то есть операция умножения происходит мгновенно на физическом уровне [2:28].

Несмотря на свои преимущества, аналоговые компьютеры исторически проиграли цифровую гонку из-за критических недостатков:

*   **Узкая специализация:** Они не являются компьютерами общего назначения; на них невозможно запустить текстовый редактор или операционную систему [2:41].
*   **Погрешность вычислений:** Поскольку входные и выходные сигналы непрерывны, задать абсолютно точные значения невозможно [2:57]. При повторении одного и того же вычисления результат никогда не будет идентичен до последнего знака [2:57].
*   **Погрешность производства:** Из-за физических отклонений в номиналах резисторов или конденсаторов точность вычислений имеет погрешность около 1% [3:10].

По мнению Дерека Мюллера, именно неточность и невозможность идеального воспроизведения результатов стали главными причинами, по которым аналоговые машины уступили место цифровым, как только те стали коммерчески жизнеспособными [3:24], [3:39].

## 🧠 Нейросеть Фрэнка Розенблатта и первый крах ИИ
[[JUMP:03:39]]

Возвращение аналоговых систем началось с расцвета искусственного интеллекта. Понятие «ИИ» было введено еще в 1956 году [3:53]. В 1958 году психолог из Корнеллского университета Фрэнк Розенблатт создал «перцептрон» — устройство, призванное имитировать работу биологических нейронов человеческого мозга [3:53], [4:06].

Принцип работы биологического нейрона относительно прост: он либо возбуждается и передает сигнал дальше (1), либо остается в покое (0) [4:06], [4:19]. Связи между нейронами имеют разную силу — веса [4:19]. Одни связи стимулируют возбуждение (положительные веса), другие тормозят его (отрицательные веса) [4:33]. Нейрон активируется, если взвешенная сумма всех входящих сигналов превышает определенный порог (смещение) [4:46].

Аппаратная реализация перцептрона Розенблатта имела следующие характеристики:

*   **Входная матрица:** Сеть из 400 фотоэлементов (сетка 20х20 пикселей) для распознавания изображений [4:46], [5:02].
*   **Одиночный выходной нейрон:** Соединялся со всеми 400 входами через регулируемые веса [5:16].
*   **Математическая основа:** Вычисление скалярного произведения векторов активации и весов [5:28].

Для обучения перцептрона использовался простой алгоритм [5:53]. Если при показе круга выходной нейрон не срабатывал, значения входных активаций прибавлялись к весам [6:19], [6:32]. Если же он срабатывал при показе прямоугольника (ошибка), эти значения вычитались [6:32], [6:45]. Розенблатт утверждал, что машина способна к оригинальному мышлению, а пресса активно развивала этот нарратив [7:11]. Газета New York Times писала, что ВМС США ожидают от этого изобретения возможности ходить, говорить, видеть, писать, размножаться и осознавать свое существование [7:24].

Однако реальные возможности перцептрона были крайне ограничены [7:38]. В 1969 году выдающиеся ученые из MIT Марвин Минский и Сеймур Пейперт опубликовали книгу «Перцептроны», в которой математически доказали жесткие ограничения подобных однослойных сетей (в частности, неспособность решать задачу XOR) [7:51]. Это привело к первому периоду упадка исследований ИИ, известному как «первая зима искусственного интеллекта» [8:05]. Сам Розенблатт трагически утонул во время плавания на яхте в день своего 43-летия, не дожив до возрождения своих идей [8:05].

## 🚗 Alvin, ImageNet и революция AlexNet
[[JUMP:08:18]]

Новый виток интереса к нейросетям начался в 1980-х годах. Исследователи из Университета Карнеги — Меллона создали Alvin — один из первых прототипов беспилотных автомобилей [8:18], [8:33]. Автомобиль управлялся искусственной нейронной сетью, которая отличалась от перцептрона наличием скрытого слоя нейронов между входом и выходом [8:33].

Архитектура Alvin включала в себя:

*   **Входные данные:** Камера передавала изображение дороги разрешением 30x32 пикселя [8:45].
*   **Скрытый слой:** 4 искусственных нейрона [8:58].
*   **Выходной слой:** 32 нейрона, самый активный из которых определял угол поворота руля [8:58], [9:11].

Сеть обучалась методом обратного распространения ошибки (backpropagation), копируя поведение водителя-человека [9:11], [9:24]. Главной проблемой Alvin была скорость: из-за медленных цифровых матричных вычислений того времени беспилотник мог двигаться с максимальной скоростью всего 1–2 км/ч [10:03].

В 1990-х годах ИИ пережил очередной спад [10:29]. К середине 2000-х годов большинство ученых работало над улучшением алгоритмов, но исследовательница Фей-Фей Ли предположила, что нейросетям просто не хватает данных для качественного обучения [10:42]. С 2006 по 2009 год под ее руководством была создана база данных ImageNet, содержащая 1,2 миллиона размеченных вручную изображений [10:54]. На ее основе с 2010 по 2017 год проводился ежегодный престижный конкурс классификации изображений ImageNet [11:08].

Прорыв случился в 2012 году, когда нейросеть AlexNet, разработанная в Университете Торонто, показала рекордный показатель ошибок Top-5 на уровне 16,4%, разгромив конкурентов (у лучшего алгоритма 2011 года показатель составлял 25,8%) [12:00], [12:13].

Параметры и вычислительная сложность AlexNet:

*   **Структура:** 8 слоев нейронов [12:26].
*   **Сложность:** 60 миллионов весов и смещений [12:26].
*   **Вычисления:** 700 миллионов математических операций для обработки одного изображения [12:39].

Создатели AlexNet совершили революцию, впервые применив графические процессоры (GPU) для параллельных вычислений [12:51]. Статья с описанием их работы на сегодняшний день цитировалась более 100 000 раз [13:05]. К 2015 году за счет увеличения глубины сетей до 100 слоев уровень ошибок на конкурсе упал до 3,6%, что превзошлo возможности человека [13:18], [13:32].

## 🛑 Три барьера современного кремния
[[JUMP:13:32]]

Успех глубоких нейросетей обозначил острую потребность в гигантских вычислительных мощностях. По словам Дерека Мюллера, сегодня индустрия ИИ столкнулась с тремя фундаментальными проблемами [13:32]:

1.  **Энергопотребление:** Обучение одной крупной нейросети требует колоссального количества электричества, сопоставимого с годовым потреблением трех среднестатистических домохозяйств [13:45].
2.  **«Бутылочное горлышко» архитектуры фон Неймана:** В классических цифровых компьютерах данные хранятся в памяти и передаются процессору по шине данных. При выполнении миллиардов матричных умножений основная часть энергии и времени тратится не на сами вычисления, а на постоянное перемещение значений весов из памяти в процессор и обратно [13:59].
3.  **Физические ограничения закона Мура:** Размеры транзисторов на кремниевых кристаллах уже приближаются к размерам отдельных атомов, что создает непреодолимые физические барьеры для дальнейшей миниатюризации цифровой логики [14:11].

В этих условиях аналоговые вычисления выглядят идеальным решением. Нейросетям не требуется абсолютная цифровая точность: для системы распознавания образов не имеет значения, уверена ли она в наличии объекта на 96% или на 98%, — конечный результат (например, распознавание курицы на фото) останется неизменным [14:37], [14:49]. Следовательно, аналоговые флуктуации и погрешности компонентов вполне допустимы.

## ⚡ Как Mythic AI переносит нейросети на аналоговые чипы
[[JUMP:15:02]]

Чтобы увидеть аналоговое будущее ИИ-чипов своими глазами, Дерек Мюллер посетил американский стартап Mythic AI в Техасе [15:02]. Компания занимается созданием специализированных аналоговых чипов для запуска нейросетей и демонстрирует их возможности на примере алгоритмов оценки позы для VR/AR (метаверс-приложения) и определения глубины кадра с одной веб-камеры в реальном времени [15:15], [15:28], [15:40].

Для реализации матричного умножения в аналоговом домене инженеры Mythic AI переосмыслили использование стандартных ячеек флэш-памяти [15:55]. В цифровой технике подача высокого напряжения на затвор заставляет электроны проходить через изолирующий барьер и оставаться на плавающем затворе, блокируя прохождение тока (логический ноль) [16:09], [16:21]. Если электронов нет, ток течет свободно (логическая единица) [16:21].

Технологическое решение Mythic AI состоит в следующем:

*   **Ячейки памяти как переменные резисторы:** Инженеры записывают на плавающий затвор строго определенное количество электронов [16:34], [16:46]. Чем больше электронов заперто на затворе, тем выше сопротивление канала [16:46].
*   **Физическое перемножение:** При подаче небольшого входного напряжения (активации нейрона $V$) сила протекающего тока будет определяться формулой $I = V / R$. Поскольку проводимость ($G$) — это величина, обратная сопротивлению ($1/R$), формула принимает вид $I = V \times G$, где проводимость выполняет роль веса связи ($W$), а напряжение — входного сигнала ($X$). Таким образом, одна аналоговая ячейка мгновенно умножает активацию на вес [16:59], [17:12].
*   **Физическое сложение:** Ячейки объединяются в общие линии так, что токи от отдельных умножений складываются естественным образом, завершая операцию матричного умножения [17:24], [17:37].

Крошечный чип от Mythic AI способен выполнять 25 триллионов математических операций в секунду (TOPS), потребляя при этом всего около 3 Вт энергии [17:37], [17:51]. Для сравнения: современные цифровые системы могут выполнять от 25 до 100 TOPS, но требуют массивного оборудования и потребляют от 50 до 100 Вт [18:04].

Хотя сравнение не совсем прямое — аналоговые чипы предназначены для запуска готовых нейросетей (инференса), а не для их обучения (где по-прежнему лидируют традиционные GPU) — они предлагают огромные преимущества при внедрении ИИ на конечных устройствах [18:04], [18:19]. Такие чипы могут встраиваться в камеры безопасности, беспилотные системы, промышленное инспекционное оборудование (например, для мгновенной отбраковки чипсов на конвейере Frito-Lay) и умные колонки [18:19], [18:33], [18:45].

Тем не менее, аналоговый подход сталкивается со своими трудностями. При проведении последовательности из 50 и более матричных умножений аналоговый сигнал накапливает искажения и полностью разрушается [18:57]. Чтобы решить эту проблему, разработчики используют гибридную схему: сигнал периодически конвертируется из аналогового домена обратно в цифровой с помощью АЦП (аналого-цифровых преобразователей) для очистки от шума, а затем преобразуется обратно в аналоговый для выполнения следующего блока вычислений [19:11].

Дерек Мюллер заключает, что основатель перцептрона Фрэнк Розенблатт, который изначально пытался обучать свою сеть на цифровом компьютере IBM, но из-за нехватки скорости построил собственную аналоговую систему с переменными резисторами и моторчиками, в итоге оказался прав не только насчет нейросетей, но и насчет превосходства аналоговой архитектуры [19:25], [19:38]. Возможно, через 100 лет человечество будет смотреть на цифровую эпоху не как на финал развития технологий, а лишь как на их отправную точку [20:03]. Наш мозг работает гибридно: нейроны выдают бинарные импульсы, но сам мыслительный процесс происходит во всей сети одновременно и непрерывно [20:19]. Для создания истинного искусственного интеллекта человечеству может потребоваться вся мощь аналоговых систем [20:33].