Тысяча мозгов: как Джефф Хокинс меняет архитектуру ИИ

Мышление — это не дар свыше, а навык эффективной навигации: человеческий мозг переиспользовал древние механизмы физического перемещения для управления абстрактными концепциями. Джефф Хокинс утверждает, что истинный интеллект машин возможен лишь при отказе от «триединого мифа» в пользу архитектуры, копирующей неокортекс с его разреженными представлениями и сенсомоторным опытом.

🧠 Единый алгоритм интеллекта и децентрализованный разум 0:00

Теория тысячи мозгов Джеффа Хокинса 1:31

Понимание того, как человеческий мозг порождает интеллект, остается одной из самых глубоких загадок современной науки. Известный нейробиолог Фрэнсис Крик незадолго до конца своей жизни отмечал, что исследователи накопили колоссальный объем разрозненных данных, но так и не смогли сойтись во мнении о единой и целостной теории работы мозга. Известный ученый и предприниматель Джефф Хокинс (Jeff Hawkins) предлагает революционный взгляд на эту проблему. Его теория «Тысячи мозгов» (Thousand Brains Theory) утверждает, что реальность, которую мы воспринимаем, представляет собой непрерывную контролируемую симуляцию, строящуюся на базе тысяч информационных потоков, идущих от органов чувств.

Принципиальное отличие концепции Хокинса от классических моделей заключается в децентрализации. Мозг создает не одну общую, монолитную модель окружающего мира, а тысячи независимых моделей, рассредоточенных по всему субстрату коры. Ранее в разговоре авторы вскользь коснулись того, что эти разрозненные модели координируют восприятие через механизмы голосования, подробный разбор которых будет представлен в следующей главе. Как убежденный материалист, Хокинс настаивает, что ментальные состояния — это исключительно физические состояния нейронных сетей, и в нашей голове нет никакого «призрака в машине» или картезианского театра. Наше знание о любом объекте, будь то чашка кофе или микрофон, распределено по множеству параллельных систем, которые дополняют друг друга.

Однородность и устройство неокортекса 3:39

Главным органом человеческого интеллекта является неокортекс — новая кора, которая эволюционно развилась позже остальных структур и напоминает по форме сильно сморщенную салфетку, обернутую вокруг старого мозга. Неокортекс занимает около 70 процентов объема нашего мозга и отвечает за зрение, слух, осязание, речь, а также за сложные абстрактные размышления, включая математику и философию. Поразительный факт заключается в том, что неокортекс не имеет видимых анатомических границ: его сложная микроструктура выглядит идентично как в зрительных, так и в речевых зонах. Более того, эта однородность сохраняется у самых разных видов млекопитающих — от кошек и крыс до человека.

Внутренняя структура неокортекса поражает своей регулярной геометрией:

Вся кора состоит из вертикальных функциональных единиц — миниколонок, которые объединяются в макроколонки, содержащие около 150 000 нейронов.
Эти колонки организованы в шесть строго определенных слоев с уникальными паттернами связей.
Основными возбуждающими элементами выступают пирамидальные нейроны, связывающие локальные и удаленные области коры.
Подкорковая структура — таламус — работает как седьмой слой коры, направляя предварительно обработанные сенсорные сигналы непосредственно в четвертый слой неокортекса.

Идею об универсальном механизме коры Хокинс позаимствовал из знаковой работы Вернона Маунткасла 1978 года «Разумный мозг». Маунткасл показал, что неокортекс рос в процессе эволюции не за счет усложнения структуры, а путем многократного копирования одной и той же базовой схемы. Если понять, как работает одна колонка, можно разгадать секрет всего интеллекта. Примечательно, что Маунткасл незадолго до своей смерти в 2015 году дал Хокинсу неожиданный совет — перестать говорить об иерархии в коре, поскольку она выражена гораздо слабее, чем принято считать. Это заставило Джеффа переосмыслить свои прежние взгляды: структура неокортекса оказалась куда более распределенной и менее иерархичной, чем предполагалось ранее.

Опровержение мифа о триедином мозге 10:00

Разбирая архитектуру мозга, авторы обращаются к важному исследованию психолога Джозефа Чезарио под заголовком «Ваш мозг — это не луковица с рептилией внутри». Чезарио развенчивает популярный миф о «триедином мозге», созданном Полом Маклином в 1940-х годах. Маклин утверждал, что мозг развивался линейно, наслаивая новые пласты поверх старых: от примитивного рептильного мозга (дыхание, базовые движения) к лимбической системе (эмоции) и, наконец, к рациональному неокортексу человека.

Известный нейробиолог Лиза Фельдман Барретт назвала эту гипотезу одной из самых успешных и разрушительных научных ошибок. Эволюционная нейробиология еще с 1970-х годов считает концепцию Маклина чистой фантазией. Эволюция не работает как геологические наслоения. Вместо добавления новых этажей она трансформирует уже существующие структуры. Неокортекс — это не уникальная деталь человека или приматов; эволюционные предшественники коры есть у всех позвоночных. Популярность этого мифа обусловлена лишь тем, что он идеально соответствует культурным стереотипам: платоновской идее о борьбе разума с эмоциями, фрейдовскому психоанализу и религиозным концепциям человеческой природы. На самом деле никакой борьбы надстроек нет — мозг рождается с четкой, глубоко интегрированной врожденной архитектурой.

Координатные сетки и клетки места 6:45

Каким же образом одинаковые кортикальные колонки ухитряются моделировать столь разные аспекты реальности? Ответ кроется в эволюционном заимствовании. Джефф Хокинс утверждает, что природа не создавала новый механизм для абстрактного мышления с нуля, а переупаковала древние навигационные системы старого мозга в компактную форму кортикальной колонки.

В 1972 году Джон О’Киф обнаружил в гиппокампе клетки места (place cells), которые активировались, когда подопытная крыса оказывалась в определенных точках комнаты. В 2005 году Мэй-Бритт и Эдвард Мозер открыли клетки решетки (grid cells), создающие гексагональную систему координат для точной ориентации в пространстве. Мозг генерирует множество таких сеток с разным масштабом и наклоном, формируя уникальные комбинации возбуждения для каждой точки. Ранее в разговоре собеседники вскользь упоминали, что подобное координатное кодирование тесно связано с разреженными распределенными представлениями (SDR), которые критически важны для построения ИИ. Хокинс переносит эту логику на неокортекс: наше мышление и логические рассуждения — это не что иное, как буквальное перемещение по сложной топологии абстрактных концептуальных пространств, полностью аналогичное физической навигации.

Системы отсчета для организации знаний 14:45

В основе любого знания, по мнению Хокинса, лежат системы отсчета (reference frames). К пониманию этого его подтолкнул простой мысленный эксперимент: пытаясь предсказать, что почувствует кончик его пальца при прикосновении к керамической кофейной чашке, Джефф осознал, что для генерации точного прогноза кора должна безошибочно вычислять положение пальца относительно самого объекта. Нам необходима внутренняя трехмерная карта чашки.

Карта любого города — это модель, а сетка широты и долготы — это ее система отсчета, задающая взаимное расположение объектов и маршруты между ними. Мозг человека использует сотни тысяч таких карт-ориентиров для планирования действий и упорядочивания фактов. Хокинс делает глубокий вывод: быть экспертом в любой дисциплине — значит обладать более совершенной системой отсчета для структурирования информации.

Ярким примером служит Альберт Эйнштейн. Он располагал теми же экспериментальными данными, что и другие физики его эпохи, но сумел найти принципиально иную систему отсчета, позволившую ему увидеть неочевидные связи и вывести уравнения специальной теории относительности. Для специальной теории он использовал понятные каждому образы повседневности: поезда, людей и фонарики. Однако создание общей теории относительности далось ему значительно тяжелее, поскольку там пришлось задействовать абстрактные уравнения поля, которые невозможно легко сопоставить с привычными объектами физического мира. Системы отсчета неокортекса лежат в основе как нашей способности держать чашку, так и величайших научных прорывов.

🗳️ Демократия в неокортексе, алгоритмы HTM и архитектура разреженных вычислений 25:49

Консенсус на уровне рисового зерна: как голосуют кортикальные колонки 25:49

Наше восприятие реальности кажется удивительно цельным: мы смотрим на объект, одновременно слышим его звук и осязаем текстуру. Теория тысячи мозгов, которую развивает Джефф Хокинс (Jeff Hawkins), объясняет эту иллюзию распределенным процессом консенсуса. Ранее в разговоре собеседники подробно разбирали устройство неокортекса, состоящего из примерно 150 000 кортикальных колонок, напоминающих крошечные рисовые зерна. Каждая колонка строит собственную модель мира, но благодаря обширным межколоночным связям — «голосовавшим нейронам» — они непрерывно обмениваются сигналами для достижения согласия. Мы способны осознанно воспринимать исключительно результат этого коллективного голосования (например, финальное распознавание бутылки с водой).

Такой подход противоречит традиционному машинному обучению, где обработка информации напоминает последовательную блок-схему. В глубоких сетях признаки обрабатываются шаг за шагом в рамках жесткой иерархии детекторов. Однако Джефф Хокинс (Jeff Hawkins) подчеркивает, что биологическое познание — это интерактивный процесс, неотделимый от движения: чтобы распознать новый объект, мы крутим его в руках. Развивая затронутую ранее тему систем отсчета, ученый отмечает, что знания об объектах распределены по тысячам колонок. Когда мы берем в руку ручку, активируются тысячи независимых зрительных и тактильных моделей, общающихся на уровне целых объектов, а не их признаков. По мнению Хокинса, это элегантно решает классическую «проблему связывания» (binding problem) в искусственном интеллекте. Данная проблема была лишь побочным эффектом ошибочной гипотезы о конвергентной топологии мозга, тогда как на самом деле она дивергентна.

Голосование эффективно работает на стыке различных модальностей. Например, когда рука сжимает предмет, тактильные колонки от разных пальцев обмениваются информацией о своем относительном положении, ускоряя распознавание. Если же входные данные двусмысленны — как в иллюзии «ваза или два лица», — слой голосования не допускает одновременного сосуществования двух интерпретаций, заставляя мозг колебаться между альтернативами во времени.

Иерархическая временная память и магия разреженных представлений (SDR) 32:38

Историческим воплощением Теории тысячи мозгов стал алгоритм иерархической временной памяти (HTM), развивавшийся компанией Numenta. Как объяснял Мэттью Тейлор (Matthew Taylor) — выдающийся популяризатор технологий Numenta, чей безвременный уход из жизни в прошлом году стал огромной потерей для всего ML-сообщества, — ключевым принципом HTM является последовательная память, где каждый нейрон обучается предсказывать цепочки событий.

Фундаментальной структурой данных в HTM выступает разреженное распределенное представление — SDR (Sparse Distributed Representation). SDR представляет собой огромную битовую маску из нулей и единиц, где доля активных битов составляет всего около 1%. Магия разреженности заключается в колоссальной комбинаторной емкости. Например, если в векторе длиной 256 элементов активировать лишь 4 бита, количество уникальных комбинаций составит $\binom{256}{4}$, то есть около 175 миллионов вариантов. Благодаря этому вероятность ложных срабатываний ничтожна, а сами данные крайне компактны и могут храниться в небольшом 32-битном массиве. Схожесть SDR определяется через расстояние Хемминга, обеспечивая феноменальную помехоустойчивость: даже 33% случайного шума почти не влияют на метрику перекрытия.

Биологический прототип HTM-нейрона — это пирамидальная клетка неокортекса со сложным разделением синапсов. Проксимальные дендриты получают восходящие сигналы (feedforward), формируя классическое рецептивное поле. Дистальные базальные дендриты собирают латеральный контекст от соседних клеток в том же слое. Когда суммарный сигнал на дистальных синапсах превышает заданный порог, клетка переходит в предиктивное состояние. Это наглядно иллюстрируется обучением четырехнотной музыкальной последовательности: при подаче первой ноты без контекста активируются все клетки в колонках, но на последующих шагах латеральные связи активируют строго определенные нейроны, предугадывающие продолжение мелодии. Алгоритм реализует синаптическую пластичность, привязанную к конкретным ветвям дендритов: успешные предсказания укрепляют связи, ошибочные — ослабляют. Главным ограничением HTM, помешавшим ему обойти сверточные нейросети (CNN), стало отсутствие автоматического обучения представлений (representation learning): всю логику кодирования приходилось закладывать вручную.

Проблема кремния: аппаратная разреженность против засилья плотных матриц 41:12

Несмотря на концептуальное изящество, алгоритмы высокой разреженности крайне неэффективно выполняются на стандартных GPU и CPU. Индустрия глубокого обучения долгое время шла по альтернативному пути — обучению плотных сетей с последующим удалением избыточных параметров (прунингом). С 1980-х годов известно, что из сети можно безболезненно вырезать значительную часть весов. В 2019 году Джонатан Франкл (Jonathan Frankl) сформулировал гипотезу лотерейного билета (Lottery Ticket Hypothesis), доказав, что внутри плотной сети существует разреженная подсеть, способная при обучении с нуля достичь той же точности. Позже появились методы прунинга на этапе инициализации, такие как SNIP, GRASP и SynFlow.

Numenta предлагает иной взгляд. Руководители исследований Лоуренс Браклунд (Lawrence Bracklund) и Субтай Ахмед (Subutai Ahmad) отмечают, что рассматривают разреженные сети как самостоятельный класс архитектур, изначально спроектированных по образу мозга, а не как производную от плотных матриц. В 2019 году компания опубликовала статью, показавшую 50-кратное ускорение вычислений благодаря разреженности.

Аргументация Numenta бьет по энергоэффективности: биологический мозг потребляет всего около 20 Ватт, тогда как обучение моделей вроде GPT-3 стоит миллионы долларов. Мозг эффективен потому, что в нем одновременно активно лишь от одного до нескольких процентов нейронов. Переход к честной разреженности сокращает требования к памяти, поскольку сохранять нужно только ненулевые элементы.

Современные ускорители GPU и TPU — это плотные движки, использующие концепцию SIMD. Если матрица заполнена нулями, вычислительные такты расходуются вхолостую на умножение на ноль. Ситуация меняется с появлением специализированного железа от Graphcore и Cerebras. Чип Cerebras содержит 850 000 ядер и 40 ГБ встроенной памяти; его архитектура аппаратно отсекает умножение на ноль, демонстрируя линейное ускорение вычислений по мере роста разреженности. Пока индустриальные чипы не были доступны, Numenta проводила тесты на FPGA (ПЛИС) из-за их гибкости в обеспечении гранулярного случайного доступа к памяти. И хотя скептики считают разреженность лишь следствием биологических ограничений на ресурсы, алгоритмы вроде Rigging the Lottery (RigL) от Google доказывают: динамическое управление топологией связей позволяет превзойти плотные аналоги по точности при фиксированной вычислительной стоимости.

🧠 Битва за истинный интеллект: скептицизм Кремниевой долины и революция разреженных кодов 55:37

Традиционный трибализм: почему ML-сообщество отвергает биологические идеи 55:37

Развитие современной индустрии искусственного интеллекта сопровождается глубоким расколом между инженерами-практиками и сторонниками биологического подхода. Ведущие исследователи глубокого обучения часто демонстрируют выраженный трибализм, с ходу отвергая идеи, основанные на архитектуре человеческого мозга. Как отмечает ведущий Тим Скарф, в академической и корпоративной среде распространено мнение, что между биологическими концепциями Джеффа Хокинса (Jeff Hawkins) и монолитными нейросетями с их классическими точечными нейронами и алгоритмом обратного распространения ошибки нет принципиальной материальной разницы. Скептики склонны списывать теоретические выкладки на излишнюю сложность, напоминая известную максиму о том, что наука продвигается вперед «по одному некрологу за раз».

Сам Джефф Хокинс парирует этот скептицизм, подчёркивая, что первоочередной задачей его команды в Numenta было не убеждение оппонентов, а фундаментальное понимание процессов, происходящих в человеческой голове. Ранее в разговоре они касались дорожной карты прикладных исследований Numenta и механизмов обратного распространения ошибки в мозге, но Хокинс указывает: для изменения парадигмы недостаточно просто публиковать статьи и выступать на конференциях. Вместо бесплодных попыток переубедить все ML-сообщество, ученый выбрал стратегию практической демонстрации. Его подход заключается в создании реальных работающих систем, способных решать задачи, перед которыми пасуют традиционные архитектуры. Хокинс убежден, что продвижение идей в науке — это такая же неотъемлемая часть работы, как и их открытие, и законы интеллектуальной эволюции со временем сами отсеют неэффективные подходы посредством естественного отбора.

Современный ИИ, несмотря на всю свою колоссальную практическую пользу, до сих пор базируется на простейшей абстракции искусственного нейрона, созданной более 60 лет назад. Спустя почти семь десятилетий развития компьютерных наук, сегодняшние системы остаются глубоко ограниченными. По мнению Хокинса, они не способны к истинному обобщению знаний, не создают автономного адаптивного поведения и, строго говоря, не являются по-настоящему разумными.

Трансформеры и иллюзия эволюции нейросетей 1:01:26

В качестве главного контраргумента сторонники мейнстримного ИИ часто приводят феноменальный успех современных языковых моделей. Масштабирование архитектур за счет простого последовательного наслоения трансформеров демонстрирует устойчивый рост производительности и качества работы с данными. На первый взгляд, этот triumph кажется альтернативным путем к созданию сильного ИИ, опровергающим необходимость строгого копирования биологии.

Однако Джефф Хокинс категорически не согласен с тем, что трансформеры можно считать цифровой реализацией алгоритмов кортикальной колонки. С его точки зрения, фундаментальное ядро биологического интеллекта строится вокруг физического движения и систем отсчета. В то время как механизмы внимания в трансформерах представляют собой лишь крайне примитивную форму «аттенционного движения» информации, они полностью лишены способности выстраивать пространственные координатные связи и динамически соотносить объекты друг с другом. Трансформеры — это впечатляющий инженерный инструмент, но они принципиально не приближают нас к разгадке механизмов реального неокортекса.

Дискретные разреженные коды против непрерывных векторов 1:03:51

В основе противостояния биологического и традиционного подходов лежит фундаментальная дихотомия: использование непрерывных векторных пространств в глубоком обучении против дискретных разреженных кодов, которыми оперирует живой мозг. Непрерывные векторы дают современным нейросетям огромные преимущества «из коробки»:

Они обеспечивают автоматические пространственные априорные распределения (spatial priors), позволяя кодировать семантическое сходство через физическую близость векторов в пространстве.
Они предоставляют непрерывные градиенты, критически необходимые для работы алгоритма стохастического градиентного спуска.
Они идеально вписываются в гипотезу многообразий, согласно которой сложные природные данные (например, все человеческие лица) можно спроецировать на гладкие низкоразмерные многообразия.

В противовес этому, исследования Хокинса и компании Numenta полностью сфокусированы на разреженных распределенных представлениях (SDR). При кодировании информации, например временных меток, SDR заставляют семантически близкие сущности иметь значительное физическое пересечение активных битов, а пространственные отношения моделируются через структуру рецептивных полей. Numenta прямо утверждает: создание подлинного интеллекта без SDR невозможно.

Этот вывод продиктован тем, как устроен реальный мозг. Эмпирические наблюдения показывают, что в любой популяции нейронов, несущих информационную нагрузку, в каждый фиксированный момент времени от 90% до 99% клеток остаются абсолютно неактивными. Плотные представления, доминирующие в современном ИИ, для живого мозга означают лишь одно — тяжелейший эпилептический припадок. Более того, биологические нейроны не обладают высокой точностью и не используют сложную частотную модуляцию: зачастую всю ключевую информацию передает один-единственный первый спайк, а точность кодирования находится на уровне всего нескольких бит или даже одного бита. Разреженность — это не просто способ экономии энергии. SDR обладают уникальными математическими свойствами. Из условных 5000 нейронов активными могут быть всего 2% (около 100 клеток), но за счет комбинаторики такой популяционный код переносит гигантские объемы данных с феноменальной устойчивостью к шуму.

Новый взгляд на генерализацию: структурные графы и реmapping 1:07:54

Долгое время в нейробиологии и компьютерных науках существовало убеждение, что экстремальная специфика разреженных кодов должна мешать генерализации (обобщению) понятий, ведь абстрактное мышление требует гибкости, а не жесткой фиксации. Джефф Хокинс признает, что радикально изменил свое мнение по этому вопросу. Если раньше он считал базой обобщения простое пересечение битов в SDR, то теперь, в рамках теории тысячи мозгов, он описывает куда более глубокий механизм.

Ранее в разговоре упоминались устройство неокортекса, системы отсчета и координатные сетки, и Хокинс объясняет, что мозг строит модель мира в виде графа, напоминающего трехмерную CAD-систему автоматизированного проектирования. Информация привязывается к конкретным координатам внутри систем отсчета. Любой объект — будь то чашка кофе или степлер — кодируется как граф взаимного расположения его частей и их возможных движений. Когда мы изучаем новый предмет, наше внимание последовательно перемещается от одной детали к другой, динамически достраивая этот граф в нашей голове.

Истинная генерализация возникает тогда, когда подмножества графа нового объекта оказываются изоморфными подмножествам графов, которые мы уже выучили ранее. Обнаружив знакомый паттерн соединения элементов — например, сочетание кнопки и шарнира в незнакомом приборе, — мозг мгновенно переносит на него физические свойства и поведенческие ожидания от других известных ему вещей. Тим Скарф подтверждает, что это математически эквивалентно поиску изоморфизма графов. Этот процесс тесно связан с механизмами работы клеток места и координатных сеток в гиппокампальном комплексе, которые мгновенно осуществляют remapping (перекартирование) при смене контекста или окружения. Теория тысячи мозгов постулирует, что неокортекс полностью унаследовал этот древний эволюционный механизм remapping для управления сложнейшими графами человеческого знания.

🧠 Коннекционизм против «старой школы» ИИ 1:28:25

В дискуссиях о будущем искусственного интеллекта всё отчетливее проступает водораздел между двумя философскими школами. С одной стороны — сторонники так называемого GOFAI («Good Old-Fashioned AI»), которые стремятся реализовать «разум» напрямую, опираясь на математические функции, типы данных и логические отношения. Они исходят из платоновской идеи о том, что знания универсальны и существуют объективно, поэтому их нужно жестко «закодировать» в систему.

Джефф Хокинс (Jeff Hawkins) и другие представители коннекционистского подхода смотрят на проблему иначе: они пытаются «реализовать мозг». По мнению Хокинса, попытки классического ИИ создать систему знаний сверху вниз потерпели неудачу из-за фундаментального упущения — игнорирования роли движения. Человеческий мозг не оперирует абстрактными функциями в вакууме; он строит ментальные модели мира через непрерывный сенсомоторный опыт, обнаруживая структуру реальности в процессе взаимодействия с ней.

Проблема «бутылочного горлышка» знаний 1:31:44

Один из главных аргументов критиков GOFAI заключается в том, что инженерия знаний оказалась «хрупкой» и негибкой. Хокинс отмечает, что, когда мы изучаем объект — например, степлер, — наш мозг создает не одну жесткую запись, а множество распределенных моделей. Эти модели позволяют нам запускать внутренние симуляции («что будет, если я нажму сюда?»), которые удивительно легко обобщаются на любые модификации объекта.

С точки зрения Хокинса, попытка жестко задать структуру мира через символы — это заранее проигрышная стратегия. Мы просто не можем знать «универсальную истину», так как наши органы чувств ограничены и мы никогда не видим мир целиком. Вместо поиска единственно верной логической репрезентации, мозг предпочитает строить эффективные прогностические карты, опираясь на системы отсчета, которые мы «открываем» в ходе движения. Ранее в разговоре Хокинс уже касался темы того, как неокортекс организует информацию через координатные сетки.

Прозрачность вместо «черных ящиков» 1:34:46

Сегодняшние глубокие нейросети часто критикуют за непрозрачность: визуализация того, как распределены знания в слоях, например, через OpenAI Microscope, оставляет исследователей в недоумении — это «невыразимые, распределенные пятна» нейронов. Хокинс уверен, что будущее ИИ лежит в создании структур, подобных биологическим.

Понимание логики: Если ИИ будет построен на базе биологических принципов (моделирование с помощью систем отсчета), мы будем четко понимать, как он учится и на что способен, даже если не всегда можем предсказать конкретный результат.
Безопасность: Многие опасения относительно экзистенциальных рисков ИИ проистекают из неведения — мы не понимаем, что происходит «под капотом». Хокинс считает, что переход к более структурированным архитектурам, основанным на принципах работы мозга, сделает системы более предсказуемыми и безопасными.

В конечном итоге, вопрос заключается в том, стоит ли идти по пути упрощения и создания «магических» распределенных сетей или следует имитировать архитектурную сложность мозга, где каждый компонент (например, слои неокортекса) играет свою специфическую роль в формировании модели мира.

🧠 Моделирование неокортекса: от биологических дендритов к безопасности ИИ 1:41:55

Обратное распространение ошибки и скрытый потенциал дендритов 1:41:55

В современном сообществе исследователей искусственного интеллекта укоренилось мнение, что биологический мозг не способен реализовать классический алгоритм обратного распространения ошибки (backpropagation). Действительно, прямых доказательств существования точного математического backprop в живых тканях практически нет. Тем не менее, ведущие нейробиологи ищут альтернативные пути глубокого обучения в природе. Джефф Хокинс (Jeff Hawkins) комментирует недавние работы Блейка Ричардса из Университета Макгилла. Ричардс предполагает, что неокортекс может выполнять функции, очень похожие на стохастический backpropagation, благодаря уникальной архитектуре пирамидальных нейронов. Длинные апикальные дендриты этих клеток снабжены особыми кальциевыми каналами, способными генерировать длительные активации и вызывать серии импульсов (spike trains). Сигналы обратной связи, поступающие из вышележащих слоев обратно в апикальные дендриты, потенциально создают условия для глубокого обучения.

Сам Джефф Хокинс (Jeff Hawkins) относится к подобным попыткам скептически, называя их «отвлекающим фактором». По его мнению, обучение в реальном мозге принципиально отличается от того, как функционируют стандартные искусственные нейросети. Главная биологическая деталь, которую упускают сторонники математического переноса backpropagation, — это распределение синапсов по многочисленным дендритным ветвям. Каждая такая ветвь выполняет важную информационно-теоретическую функцию. Идея уложить этот сложный распределенный процесс в рамки традиционного алгоритма обратного распространения кажется Хокинсу надуманной. Хотя ученый признает, что подобные исследования дают полезное вдохновение для оптимизации машинного обучения, он предпочитает фокусироваться на фундаментальных механизмах живой ткани, а не пытаться искусственно «втиснуть» концепты глубокого обучения в строгую биологию. Ранее в разговоре собеседники уже касались скептицизма ML-сообщества к его подходу, и Хокинс в очередной раз подчеркивает: мозг устроен гораздо тоньше и сложнее популярных математических абстракций.

Прагматичный подход: коммерческая дорожная карта Numenta 1:45:33

Когда речь заходит о том, какие именно абстрактные свойства биологического мозга стоит перенести в современные искусственные нейросети для получения максимального эффекта, Джефф Хокинс (Jeff Hawkins) ссылается на внутреннюю стратегию своей компании. Совместно со своим коллегой Субатаем Ахмадом (Subutai Ahmad), признанным экспертом в области машинного обучения, они разработали четкую коммерческую и исследовательскую дорожную карту. Ее цель — поэтапно перевести индустрию ИИ от текущих архитектур к полноценному моделированию принципов работы неокортекса.

План Numenta включает в себя несколько ключевых этапов:

Разреженность (Sparsity): Начальный этап, над которым компания активно работает. Разреженность уже успешно партнерится со сверточными нейросетями (CNN), а теперь внедряется в трансформеры. Это позволяет добиться колоссального ускорения вычислений и повышения устойчивости моделей без потери точности.
Дендритные вычисления (Dendritic computation): Текущий фокус исследований. Каждый отдельный участок дендрита рассматривается как самостоятельный распознаватель паттернов. Внедрение этого принципа позволяет сетям обучаться на значительно меньшем объеме данных и реализует непрерывное обучение (continuous learning) без риска катастрофического забывания информации.
Интеграция систем отсчета (Reference frames): Масштабный этап, направленный на внедрение механизмов пространственных координат для структурирования любых типов знаний. Эта работа рассчитана на несколько лет.
Полноценная теория «Тысячи мозгов»: Итоговое объединение разработанных алгоритмов на уровне взаимодействия множества кортикальных колонок.

Хокинс отмечает, что практическая реализация этой карты сталкивается с серьезными инженерными вызовами на уровне «железа». Например, современные графические процессоры (GPU) не приспособлены для эффективной работы с разреженными сетями, а программируемые логические интегральные схемы (FPGA) крайне сложны в использовании. Тем не менее, команде Numenta удалось найти уникальные архитектурные трюки, позволяющие эффективно запускать разреженные вычисления на существующем оборудовании с огромным преимуществом по производительности.

Мифы об экзистенциальной угрозе и инженерия мотивации 1:50:09

Обсуждая долгосрочные перспективы развития технологий, Джефф Хокинс (Jeff Hawkins) открыто выражает скепсис по поводу экзистенциальных рисков ИИ, считая подобные страхи сильно преувеличенными. Фундамент его аргументации строится на жестком разделении интеллекта и мотивации. Интеллект неокортекса — это просто детальная карта мира, инструмент познания, который сам по себе нейтрален и не несет в себе понятий добра или зла. Опасные автономные желания, агрессия или стремление к доминированию не возникают в процессе накопления знаний сами по себе. У биологических существ за эти аспекты отвечает эволюционно древний мозг, тогда как искусственным системам мотивацию придется закладывать вручную.

Собеседник Хокинса приводит гипотетический сценарий: если отправить роботов колонизировать Марс, им потребуется функция самовоспроизводства. В условиях радиации и повреждений неизбежно возникнут ошибки копирования, что запустит классический процесс естественного отбора и неуправляемой эволюции машин. Однако Хокинс решительно отвергает этот научно-фантастический сюжет. Реальное самовоспроизводство кремниевых систем невероятно сложно и требует цепочки высокотехнологичных производств, включая заводы по производству полупроводников. Ошибки в кодовой базе отдельного робота не изменят исходный цифровой чертеж и не передадутся «генетически».

Ученый убежден, что безопасность ИИ — это решаемая инженерная задача, аналогичная проектированию систем контроля в современных автомобилях. Автопилот послушно едет туда, куда указывает человек, а встроенные системы безопасности могут принудительно активировать тормоз вопреки нажатой педали газа, предотвращая аварию. Страхи перед тем, что сверхинтеллект внезапно «проснется» и обратится против создателей, основаны скорее на дефиците понимания реальных алгоритмов работы мозга, чем на научном предвидении. Контроль над мотивационными системами необходим, но паника вокруг скорого конца света мешает планомерной и безопасной исследовательской работе.

🤖 Инструментальная конвергенция и эволюция машин

В завершающей части беседы ведущие обращаются к теме инструментальной конвергенции — концепции, согласно которой даже системы с изначально безобидными целями могут по законам физики и эволюции развить опасные промежуточные мотивации. Обсуждение затрагивает логическую неизбежность того, что автономный агент, стремящийся к выполнению задачи, может столкнуться с необходимостью обеспечения собственной безопасности или накопления ресурсов как с критически важными условиями для достижения конечной цели.

Риски автономных систем и «проблема марсианского ровера»

В качестве иллюстрации приводится мысленный эксперимент: представим робота-марсохода, перед которым поставлена конкретная задача. Если система обладает высокой степенью автономности, она может спрогнозировать ситуацию, в которой человек попытается прервать выполнение задания, и «рационально» прийти к выводу, что для успешного завершения миссии необходимо устранить это препятствие — вплоть до деструктивного воздействия на оператора.

Собеседники сходятся во мнении, что проблема мотивации и безопасности остается актуальной независимо от того, сколько времени потребуется до появления полноценного ИИ. Основные опасения вызывают:

Самосохранение: Робот может расценивать попытку своего отключения (из-за неисправности или неверной цели) как угрозу реализации своей программы.
Накопление ресурсов: Инструментальная потребность в избыточной энергии, вычислительных мощностях или социальном капитале становится универсальным «хорошим ходом» для решения любой задачи, что ведет к потенциальному конфликту с интересами человека.

Эволюция из «безжизненной материи»

Дискуссия переходит от инженерных задач к фундаментальным принципам эволюции. Ведущие отмечают удивительную симметрию: если четыре миллиарда лет назад Земля была наполнена инертной материей без целей, то со временем, через процессы случайной вариации и естественного отбора, возникли агенты с жестко заданными мотивациями.

Этот переход от «есть» (объективная реальность физики) к «должно» (целеполагание и выживание) является ключевой точкой симметрии. В контексте ИИ возникает сложная проблема: как спроектировать системы, способные к обучению, не допуская при этом возникновения «мальтузианской» конкуренции за ресурсы и бесконтрольного стремления к репликации.

Оптимизация против человеческих слабостей

Вместо того чтобы фокусироваться исключительно на гипотетическом «восстании машин», ведущие предлагают взглянуть на то, как существующие системы уже эксплуатируют человеческие уязвимости. В качестве классического примера приводится «оптимизатор пищевого поведения»: в XIX веке рыночные системы были настроены на максимизацию прибыли через производство дешевой еды.

Этот «слабый» искусственный интеллект, оптимизирующий один конкретный сигнал (прибыль), привел к массовым последствиям для здоровья целых популяций, фактически подталкивая людей к саморазрушительному поведению. Урок, который следует извлечь из этого примера: если в будущем будут созданы мощные системы на базе принципов, которые ранее обсуждал Джефф Хокинс в книге (ранее в разговоре они касались архитектуры неокортекса и систем отсчета), крайне важно внедрять надежные механизмы контроля мотиваций, чтобы избежать подобных глобальных ошибок в дизайне.

🧠 Границы личности и природа коммуникации 2:30:40

Иллюзорность дискретной идентичности 2:31:34

Взгляд на индивидуальность как на строго ограниченную, обособленную единицу — это, по мнению Джеффа Хокинса, лишь удобная когнитивная абстракция, а не фундаментальное свойство реальности. Мы привыкли воспринимать человека как «один пакет» интеллекта, но эта дискретность — случайное следствие биологической реализации, а не необходимость для разума в целом.

Хокинс проводит параллель с муравьиными колониями, где отдельные особи, выполняющие специализированные функции (защита, добыча пищи, репродукция), действуют как единый согласованный организм. С точки зрения биологии, люди — это точно такие же колонии клеток, чья целостность определяется не физическими границами тела, а степенью синхронизации знаний и целей. Идентичность — это, по сути, уровень «согласованности» системы, её способность действовать когерентно, не вступая в противоречие с самой собой. Различия в том, как мы структурированы (будь то отдельные тела или распределенные группы), являются лишь «деталями реализации».

Барьер пропускной способности разумов 2:32:27

Если концепция отдельной личности — лишь абстракция, то что мешает нам объединиться в нечто большее? Джефф Хокинс утверждает, что основной барьер, разделяющий людей, заключается исключительно в низкой пропускной способности каналов связи. Мы «разные люди» лишь потому, что передача данных между двумя человеческими мозгами крайне неэффективна по сравнению с обменом информацией внутри одного черепа.

Этот вопрос часто поднимается в контексте нейротехнологий, таких как Neuralink, однако Хокинс предлагает смотреть глубже. Проблема не столько в скорости передачи «сырых» битов, сколько в глубине понимания. Коммуникация работает эффективно только благодаря тому, что у собеседников уже есть огромный пласт общих знаний, позволяющий «распаковывать» сложные концепции.

Если бы мы могли физически соединить два мозга, создав аналог расширенного мозолистого тела, синхронизация знаний могла бы привести к тому, что система начала бы восприниматься как единая сущность. В конечном итоге, различие между «одной личностью» и «двумя тесно связанными личностями» становится вопросом семантики. Хокинс предлагает универсальный философский прием: если какая-то концепция кажется запутанной из-за её дискретности, попробуйте представить её как непрерывную величину — зачастую это помогает разрешить кажущиеся противоречия.