Как ИИ от Google помогает ученым составить полную карту мозга

Сконструировать полную карту нейронных связей головного мозга — задача, которая долгое время казалась областью научно-фантастической литературы. В новом выпуске подкаста Eye on AI ведущий Крейг Смит беседует с руководителем команды коннектомики в Google Research Виреном Джайном о том, как технологии искусственного интеллекта помогают воссоздать трехмерную архитектуру нервной системы. Исследователи стоят на пороге масштабного прорыва: от ручного раскрашивания бумажных снимков червя они перешли к суперкомпьютерному анализу терабайтных массивов данных, способному перевернуть медицину и современные подходы к обучению ИИ.

🧠 От микроскопа Кахаля до цифрового «склада серверов»: история коннектомики 4:03

История изучения структуры мозга уходит корнями в глубокое прошлое. Около 150 лет назад выдающийся испанский ученый Сантьяго Рамон-и-Кахаль, разглядывая окрашенные ткани в оптический микроскоп, совершил фундаментальное открытие. По словам Вирена Джайна, Кахаль первым обратил внимание на то, что нейроны обладают уникальными и разнообразными формами. Именно эти геометрические особенности поддерживают общий организационный принцип биологического мозга: клетки формируют сложные направленные соединения друг с другом для передачи информации.

В 1970-х годах Сидней Бреннер, выдающийся ученый из Лаборатории молекулярной биологии MRC в Лондоне, решил развить эту гипотезу экспериментально. Он выдвинул новаторскую для того времени идею: полностью составить карту связей небольшого живого организма. В качестве объекта исследования Бреннер выбрал круглого червя C. elegans (нематоду), нервная система которого насчитывает всего 302 нейрона.

Процесс картирования того времени Джайн описывает как невероятно трудоемкий и архаичный по современным меркам:

Тело червя было разрезано примерно на тысячу тончайших слоев.
Каждый срез детально сфотографировали с помощью электронного микроскопа.
Полученные снимки в буквальном смысле распечатали на листах бумаги.

После этого группа ученых на протяжении 5–10 лет вручную обводила и прослеживала пути прохождения каждого нервного волокна от страницы к странице. Результатом этой титанической работы стал первый в мире «коннектом» — полная схема химических синаптических связей червя. Данная карта до сих пор активно используется биологами, однако колоссальные временные затраты на ее создание на несколько десятилетий охладили пыл научного сообщества. Никто не решался повторить подобное с более крупными организмами.

Ситуация коренным образом изменилась около 20 лет назад, примерно в 2004 году. Произошло долгожданное возрождение коннектомики, обусловленное двумя факторами. Во-первых, инженерам удалось автоматизировать процессы нарезки биологических тканей и их последующего сканирования. Во-вторых, вычислительные мощности компьютеров наконец достигли уровня, позволяющего не просто хранить гигантские массивы изображений, но и выводить их на экраны мониторов для цифрового анализа. За последние два десятилетия эта область сделала огромный шаг вперед.

🔬 Масштабы данных: один кубический миллиметр как вызов для суперкомпьютеров 7:58

Современный этап коннектомики характеризуется переходом к экспоненциально более сложным биологическим системам. Команда Вирена Джайна в Google Research принимала активное участие в проекте по успешному картированию полного мозга плодовой мушки (дрозофилы). Следующим технологическим вызовом стало моделирование фрагментов мозга млекопитающих и человека.

В сотрудничестве с лабораторией профессора Джеффа Лихтмана из Гарвардского университета специалисты Google провели цифровую реконструкцию всего одного кубического миллиметра ткани человеческого мозга. Этот проект стал одним из крупнейших датасетов в истории современной биологии, потребовав для хранения 1400 терабайт (1,4 петабайта) данных. При этом Вирен Джайн подчеркивает шокирующую пропорцию: один кубический миллиметр составляет всего лишь одну миллионную часть от общего объема мозга взрослого человека.

Технические сложности масштабирования этой технологии Джайн называет колоссальными. На текущий момент мировое научное сообщество сошлось во мнении, что следующим ключевым рубежом должно стать детальное картирование мозга мыши. Мозг мыши примерно в 1000 раз больше мозга мухи, но при этом в 1000 раз меньше человеческого, что делает его идеальным промежуточным объектом для фундаментальной биологии.

Процесс получения исходных данных базируется на физической нарезке подготовленной ткани мозга на ультратонкие слои толщиной от 10 до 15 нанометров, что значительно тоньше человеческого волоса. В индустрии существуют два основных конкурирующих технологических подхода:

Метод серийных срезов (Serial section approach): ткань нарезается на независимые деликатные пластины (по аналогии с промышленной нарезкой деликатесов в гастрономе), после чего каждая пластина сканируется под электронным микроскопом отдельно.
Блок-фейс подход (Block face approach): электроны бомбардируют поверхность цельного блока ткани, фиксируя изображение верхнего слоя, после чего этот слой сбривается специальным лезвием или буквально испаряется лазером (абляция), обнажая следующий уровень для сканирования.

По аналогии с тридцатилетней историей развития секвенирования генома, коннектомика сейчас переживает период жестких технологических споров о том, какой метод обеспечит наивысшую пропускную способность при минимальной стоимости.

🖥️ Алгоритмы вместо бумаги: как ИИ распутывает «мыслительное спагетти» 11:45

Благодаря технологическому прогрессу исследователям больше не приходится иметь дело с бумажными распечатками, однако проблема интерпретации цифровых снимков стоит крайне остро. Для объяснения сути задачи Вирен Джайн предлагает наглядную аналогию: представьте себе серверный шкаф, под завязку забитый тысячами переплетенных проводов. Если сделать черно-белую фотографию этого шкафа сзади, у вас не будет ни цветовой кодировки кабелей, ни маркировки с номерами портов. Единственный способ понять схему соединений — это взять один конкретный провод и непрерывно прослеживать его взглядом от точки начала до точки подключения к другой машине.

Biological мозг под электронным микроскопом выглядит именно как такой трехмерный серверный шкаф, где миллиарды «проводов» (аксонов и дендритов) имеют толщину в десятки нанометров, но простираются на миллиметры и сантиметры сквозь ткань. Все они хаотично перемешаны в гигантский «клубок спагетти». Автоматизация процесса их отслеживания оказалась невероятно сложной задачей, для решения которой Google разрабатывает специализированные алгоритмы машинного обучения.

Тем не менее, современные нейросети пока не идеальны. Финальный этап работы по-прежнему требует колоссального участия человека. Специально обученные аннотаторы вручную исправляют ошибки, допущенные алгоритмами. Как отмечает Джайн, этот этап сейчас является главным «узким горлышком» всей коннектомики: на верификацию одной нервной системы уходят сотни тысяч часов человеческого труда. Ключевая исследовательская задача Google заключается в том, чтобы с каждой новой итерацией снижать долю ручного труда, стремясь сократить время верификации как минимум на 90%.

Отвечая на вопрос ведущего о возможном применении состязательных систем или дебатирующих друг с другом ИИ-агентов для поиска ошибок (по аналогии с борьбой против галлюцинаций в больших языковых моделях), Джайн выразил скептицизм. Практика показывает, что если базовая архитектура алгоритма ошибается на сложном участке изображения, то и другие диверсифицированные модели с высокой долей вероятности допустят там же аналогичную ошибку из-за двусмысленности самих визуальных данных. Наиболее эффективной стратегией на данный момент признан сбор ручных исправлений от людей с целью последующего дообучения исходного алгоритма на этих трудных кейсах.

🐭 Инициатива NIH и геометрия научного прогресса 16:01

Новым мощным импульсом для индустрии послужило недавнее масштабное объявление Национальных институтов здравоохранения США (NIH) о запуске и финансировании серии грантов для технологического скачка в области коннектомики млекопитающих. До настоящего момента все мировые успехи в картировании мозга мыши ограничивались объемами в тот самый один кубический миллиметр. Учитывая, что весь мозг мыши составляет около 500 кубических миллиметров, ученые пока воссоздали лишь 1/500 его часть.

Новая программа NIH, в которой команда Google Research выступает технологическим партнером одного из консорциумов, ставит цель реконструировать от 10 до 15 кубических миллиметров мышиного мозга в течение ближайших пяти лет. Это позволит получить детальную карту нескольких процентов органа. По словам Джайна, если этот этап подтвердит масштабируемость и надежность выбранных технологий, правительство США планирует запустить вторую пятилетнюю фазу, направленную уже на полное и безоговорочное картирование всего мозга мыши целиком.

Размышляя о темпах этого развития, исследователь проводит параллель с проектом «Геном человека» (Human Genome Project) из 1990-х годов. За первые 7–8 лет работы в рамках этой государственной инициативы ученые смогли расшифровать скромные 2–3% генома. Однако за это время были настолько кардинально усовершенствованы сами методы секвенирования и компьютерного анализа, что оставшиеся 97% работы были молниеносно завершены в последние пару лет действия проекта. Джайн считает, что коннектомика сейчас находится на пороге аналогичного геометрического или даже экспоненциального ускорения, когда через несколько лет технологии позволят делать в 10 раз больше работы за то же время. Впрочем, построение полной карты человеческого мозга, по его осторожным оценкам, все еще остается задачей на несколько десятилетий вперед, поскольку человеческий мозг в миллион раз больше того объема, который ученые способны обработать сегодня.

🧬 Структура против функции: эволюция типов клеток 17:47

Критики коннектомики нередко указывают на то, что этот метод фиксирует исключительно статическую физическую структуру ткани, полностью игнорируя динамическую биохимию, экспрессию генов и текущую электрическую активность живых клеток. Вирен Джайн признает эти ограничения, однако аргументирует ценность статических карт на конкретных примерах. Коннектом червя C. elegans полностью перевернул экспериментальную нейробиологию: ученые сразу увидели, какие именно нейроны находятся посередине цепочек обработки информации между сенсорным входом и моторным выходом. Карта мозга мухи позволила буквально пошагово проследить, как сигнал от рецепторов обоняния идет в отделы памяти, а затем в зоны принятия решений и инициации физического действия.

Однако при переходе к крупным млекопитающим интерпретация усложняется. Главное отличие человека и мыши от червя или мухи заключается в колоссальном объеме прижизненного обучения. Червь в значительной степени рождается с уже жестко запрограммированным набором поведенческих паттернов. Человек же, напротив, формирует свои ключевые поведенческие алгоритмы в процессе накопления опыта и обучения после рождения.

Высшие отделы мозга млекопитающих, такие как кора больших полушарий (кортекс), по мнению Джайна, на первом приближении напоминают устройство классического компьютера. Там есть огромные массивы стандартизированных, «типовых» элементов, которые могут соединяться миллионами разных способов в зависимости от индивидуального опыта индивида.

Важнейшей задачей коннектомики Джайн называет классификацию так называемых «типов клеток» (cell types). Нейробиологи пытаются сгруппировать миллиарды нейронов в понятные категории на основе их формы, связности и генетического профиля. С эволюционной точки зрения структура мозга развивалась следующим образом:

Нервная система круглого червя: представляет собой уникальную «бутиковую аналоговую схему». Из-за малого количества элементов (302 нейрона) эволюция гипер-оптимизировала каждый из них, заставив одну и ту же клетку играть множество ролей одновременно.
Головной мозг человека: содержит около 100 миллиардов нейронов. Геном физически не способен закодировать индивидуальную траекторию для каждой такой клетки. Поэтому мозг человека устроен модульно: существует относительно небольшое число типов клеток (возможно, несколько тысяч), которые многократно дублируются, образуя повторяющиеся структурные мотивы.
Мозг плодовой мушки: занимает промежуточное положение, сочетая жестко детерминированные генетические типы клеток с первыми признаками пластичности и обучаемости.

Джайн убежден, что статическая анатомическая структура мозга макроскопически стабильна на протяжении десятилетий, обеспечивая непрерывность нашей физиологии и долговременной памяти. Для изучения процессов обучения коннектомика начинает применять сравнительный анализ — например, исследуя тонкие различия в картах мозга двух мух, обладавших принципиально разным жизненным опытом.

Более того, современные электронные микроскопы с разрешением 5–10 нанометров на пиксель позволяют заглянуть внутрь самих нейронов. На получаемых цифровых снимках отчетливо видны клеточные органеллы: митохондрии, ядра, микротрубочки и даже отдельные синаптические везикулы (пузырьки с нейромедиаторами). Понимание того, как распределение этих внутренних структур влияет на функционал конкретного синапса, — одно из самых интригующих направлений текущих исследований.

🏢 Роль Google и инфраструктурный побочный эффект 35:03

Вирен Джайн четко разграничивает зоны ответственности в масштабных международных консорциумах. Команда Google Research самостоятельно не занимается физическим сбором биоматериала и его нарезкой на микротомах. Эту сложнейшую и грязную работу выполняют их партнеры — лаборатория Джеффа Лихтмана, Институты Макса Планка или Медицинский институт Говарда Хьюза (HHMI). Google занимает позицию аналитического и вычислительного ядра: ИТ-гигант забирает колоссальные объемы сырых снимков с микроскопов, выравнивает их в единую трехмерную координатную сетку, запускает алгоритмы ИИ для трассировки нейронов и аннотирует типы клеток.

Для Google участие в проектах NIH — это чистая некоммерческая исследовательская деятельность (pro bono). Джайн объясняет глобальную мотивацию руководства компании понятным историческим вектором: Google всегда превосходно справлялся с масштабным упорядочиванием информации. Компания успешно нанесла на карту глобальную сеть (поисковик Google) и физическую поверхность планеты (Google Earth) — картографирование устройства человеческого мозга выглядит абсолютно логичным следующим шагом для компьютерных наук.

Кроме того, решение столь сложных научных задач неизбежно порождает мощные технологические спин-оффы, полезные для основного бизнеса компании. Так, для хранения, визуализации и менеджмента миллионов многомерных синаптических изображений ИТ-инженерам пришлось с нуля разработать специализированную распределенную систему TensorStore.

Впоследствии оказалось, что созданная для нужд нейробиологии TensorStore идеально подходит для совершенно другой утилитарной задачи внутри Google — эффективного сохранения и динамической загрузки миллиардов весов и параметров огромных коммерческих больших языковых моделей (LLM). Как формулирует Джайн, если вы выбираете по-настоящему фундаментальную и хардкорную научную проблему, вы гарантированно изобретете в процессе ее решения инструменты, которые изменят всю индустрию компьютерных наук.

🐦 Птичьи песни против обратного распространения ошибки: как учится мозг 39:54

Один из самых интригующих аспект коннектомики — проверка фундаментальных математических гипотез о принципах работы интеллекта. Ведущий Крейг Смит упомянул свои регулярные беседы с «патриархом ИИ» Джеффом Хинтоном. Хинтон на протяжении десятилетий выражал фрустрацию из-за того, что классический алгоритм обратного распространения ошибки (backpropagation), на котором держится все современное глубокое обучение, биологически неправдоподобен. В живом мозге просто нет симметричных обратных путей для точного прохождения градиента ошибки через те же самые синапсы. В качестве альтернативы Хинтон недавно предложил концепцию Forward-Forward алгоритма.

Вирен Джайн поделился уникальными данными текущего проекта Google Research, который призван пролить свет на эту загадку на примере исследования зебровых амадин (zebrafinch). Эти птицы примечательны тем, что рождаются, не умея петь. В течение первых недель жизни они внимательно слушают песню своего отца-тутора и постепенно разучивают ее. С точки зрения нейробиологии это изолированная, идеальная модель процесса обучения. Птица начинает с хаотичного «лепета» (babbling), совершая массу вокальных ошибок, но изо дня в день целенаправленно корректирует параметры своей песни, делая ее все более точной.

Команда Джайна полностью картировала структуру нейронных контуров в той зоне мозга птицы, которая отвечает за этот вокальный прогресс. В опубликованном препринте исследователи зафиксировали сенсационный факт: архитектура синаптических связей птицы предоставляет прямые анатомические доказательства работы алгоритма под названием node perturbation (узловое возмущение). Этот математический метод оптимизации был предложен теоретиками еще 40 лет назад как альтернатива backpropagation. Он основан на том, что отдельные узлы совершают случайные флуктуации (возмущения) своего выхода, а глобальная система подкрепления оценивает, улучшился ли общий результат, и на основе этого корректирует веса.

Джайн подчеркивает, что биологический интеллект демонстрирует недостижимую для современных дата-центров эффективность:

Энергопотребление: весь человеческий мозг в момент пиковой интеллектуальной работы потребляет около 20 Ватт энергии, что эквивалентно тусклой лампочке накаливания.
Объем данных: птице или ребенку требуется в миллионы раз меньше примеров и итераций для освоения сложнейших навыков (таких как речь или полет), чем искусственным нейросетям.

Комментируя замечание Смита об алгоритмах временных различий (Temporal Difference learning), разработанных пионером обучения с подкреплением Ричем Саттоном, Джайн уточнил важный нюанс. Алгоритмы Саттона (TD-learning) отлично описывают работу глубинных, подкорковых структур человеческого мозга, когда речь идет о выборе высокоуровневых стратегий поведения в условиях редкой и расплывчатой обратной связи от среды (например, максимизация награды или избегание боли).

В случае же с зебровой амадиной мы имеем дело с совершенно другим типом обучения — тончайшей низкоуровневой настройкой моторных таймингов и мышечных активаций в гигантском пространстве параметров. Мозг человека совмещает оба этих подхода: мы используем TD-style планирование для решения жизненных задач и механизмы типа node perturbation для того, чтобы физически научиться управлять собственным телом, ходить и артикулировать звуки.

🔮 Будущее технологий и медицинский триумф 53:06

Несмотря на очевидные успехи классического метода, коннектомика активно ищет альтернативные физические способы сканирования. Нарезка ткани алмазными ножами на нанометровые слои необратимо разрушает биологический образец. Как рассказывает Джайн, сегодня ученые экспериментируют с синхротронами — гигантскими кольцевыми ускорителями частиц, позволяющими получать высокоинтенсивное рентгеновское излучение. С его помощью можно бесконтактно сканировать трехмерную структуру ткани на наноуровне. Также развиваются передовые методы оптической микроскопии, использующие фотоны вместо электронов. Джайн не исключает, что через 5–10 лет сырые данные для карт мозга будут собираться принципиально иным, куда более эффективным способом.

В то же время исследователь весьма дипломатично прокомментировал деятельность компании Илона Маска Neuralink. По мнению Джайна, Neuralink решает принципиально иную задачу. Они создают интерфейс для долгосрочного считывания и стимуляции электрической активности живых клеток, но их электроды, пронизывающие кору, физически не способны дать детальную карту межнейронных синапсов. Существуют и другие методы прижизненной съемки — например, световая микроскопия плоскостного освещения (light sheet microscopy), позволяющая снимать полноценное видео работы каждого нейрона в теле прозрачного малька рыбы в реальном времени. Однако масштабировать подобную технологию на непрозрачный и огромный мозг человека в обозримом будущем технически невероятно.

Конечная амбиция коннектомики лежит далеко за пределами академического любопытства или создания цифровых копий мышей в компьютерах. Главный приоритет — это радикальное улучшение здоровья человека и революция в медицине. Джайн констатирует печальный факт: текущие методы лечения ментальных расстройств и тяжелейших нейродегенеративных заболеваний (таких как болезнь Паркинсона или Альцгеймера) остаются крайне неэффективными, а сама фармакология в этой сфере принципиально не менялась последние несколько десятилетий. Врачи до сих пор действуют вслепую, поскольку не понимают, что именно ломается в тонкой архитектуре связей при этих патологиях.

Появление реалистичных цифровых моделей нейронных сетей способно оказать на медицину такой же эффект, какой недавний прорыв в предсказании трехмерной структуры белков (AlphaFold) оказал на молекулярную биологию. Фармацевтические компании смогут на компьютерах моделировать и мгновенно тестировать миллионы вариантов точечного терапевтического воздействия на поврежденные нейросети.

Что касается обратного влияния коннектомики на индустрию ИИ, здесь Джайн сохраняет сдержанный реализм. Исторически базовая идея глубокого обучения родилась благодаря тому, что Джефф Хинтон вдохновлялся фундаментальными принципами устройства биологической коры. Потребуются ли разработчикам ИИ новые инсайты из биологии в ближайшие 20 лет — вопрос открытый. Если инженеры ИИ упрутся в технологический тупик по эффективности или масштабированию современных LLM, им придется прийти к нейробиологам за подсмотренными у эволюции секретами энергоэффективности. Если же текущие ИТ-архитектуры продолжат линейно и беспрепятственно развиваться, искусственный интеллект вполне может обойтись без детального копирования человеческой анатомии.