# Искусственный интеллект научился превращать активность мозга в текст

Источник: https://www.youtube.com/watch?v=laZ7ym4NBQc
Канал: World Science Festival
Опубликовано: 26.07.2024

---

С самого появления человечества наши мысли оставались последним бастионом абсолютной приватности — «священным убежищем», по выражению Шарлотты Бронте, куда невозможно войти без приглашения. Однако стремительное развитие нейробиологии и искусственного интеллекта ставит этот статус-кво под угрозу. Сегодня исследователи в Техасе и Сиднее демонстрируют технологии, способные превращать активность мозга в связный текст, фактически открывая доступ к внутреннему монологу человека без хирургического вмешательства.

## 🧠 Чтение мыслей: от френологии к ИИ-декодерам
[[JUMP:02:14]]

Попытки связать физические параметры мозга с психическими процессами предпринимались еще в XIX веке. Брайан Грин напоминает о френологии Франца Йозефа Галля — ошибочной теории, пытавшейся связать форму черепа с интеллектом и характером [02:40]. Несмотря на отсутствие научной строгости, она заложила основу для последующих попыток квантификации разума через психометрику и тесты IQ.

Настоящий прорыв произошел в конце XX века с появлением инструментов неинвазивного сканирования:

*   **ЭЭГ (электроэнцефалография):** фиксирует электрические сигналы мозга через электроды на коже головы, замеряя электромагнитный «отпечаток» мысли [03:57].
*   **фМРТ (функциональная магнитно-резонансная томография):** измеряет кровоток как косвенный показатель нейронной активности [05:15].

Современный подход основывается на гипотезе, что каждая уникальная мысль имеет свой специфический электромагнитный или метаболический «отпечаток пальца». Задача ученых — составить «словарь», связывающий эти сигналы с конкретными словами и смыслами [04:50].

## 🏗️ Метод Университета Техаса: 16 часов подкастов
[[JUMP:07:47]]

Джерри Танг, ведущий автор исследования из Техасского университета в Остине, представил систему декодирования естественного языка на базе фМРТ. Его метод представляет собой двухэтапный процесс: обучение модели на реакциях мозга конкретного пользователя и последующее предсказание новых мыслей [10:55].

Ключевые детали исследования:

*   **Обучающая выборка:** пользователи слушали 16 часов разговорных подкастов, лежа внутри сканера [11:35]. По словам Танга, это значительно превышает объем данных в типичных нейробиологических экспериментах.
*   **Специфика данных:** фМРТ обладает высоким пространственным разрешением (кубы 3x3x3 мм), что критически важно, так как языковые значения распределены в мозгу очень тонким и точным образом [16:02].
*   **Индивидуальность:** на данном этапе невозможно обучить модель на одном человеке и применить её к другому [12:54]. Каждый «словарь мыслей» уникален, хотя общая организация зон мозга схожа.

Танг отмечает, что хотя мозг испытуемых иногда «блуждал» во время прослушивания [16:30], использование увлекательных нарративных историй и огромный объем данных позволили ИИ отфильтровать шум и найти закономерности.

## 🎙️ От смысла к тексту: точность против сути
[[JUMP:13:47]]

Одной из главных особенностей техасского декодера является его способность передавать «суть» (gist), а не дословный перевод. Танг продемонстрировал примеры, где фраза «мы начали обмениваться историями из жизни» была расшифрована ИИ как «мы начали говорить о нашем опыте» [14:13].

Результаты экспериментов показывают:

1.  **Декодирование воображаемого:** система работает, даже если человек не слышит текст, а просто представляет, как рассказывает историю в своей голове [19:18].
2.  **Метрики успеха:** для оценки качества используются нейронные сети, измеряющие семантическую похожесть предложений. В тестах с вопросами на понимание декодированного текста испытуемые смогли дать верные ответы в 9 случаях из 16 [22:28].

## 🧢 Подход Сиднея: портативность и ЭЭГ
[[JUMP:23:48]]

Профессор Майкл Блуменштейн из Технологического университета Сиднея (UTS) работает над более практичным решением — специальной шапочкой с датчиками ЭЭГ [24:15]. В отличие от громоздкого и дорогого фМРТ, этот метод портативен, хотя и дает более «грубый» сигнал.

Команда UTS использует технологию под названием **DeWave**:

*   **Самообучение:** система применяет self-supervised learning, что позволяет уменьшить зависимость от огромных размеченных датасетов [25:21].
*   **Интеграция с LLM:** декодированные сигналы мозга (токены) подаются на вход большой языковой модели (по аналогии с ChatGPT), которая интерпретирует их и выстраивает в грамматически верные предложения [31:40].
*   **Нормализация данных:** подход Блуменштейна позволяет частично нивелировать индивидуальные различия между людьми, делая шаг к универсальному декодеру [27:18].

Блуменштейн продемонстрировал видео, где мысли испытуемого о «тарелке куриного супа» декодировались как «тарелка говяжьего супа» [29:34], а абстрактные описания сказочного леса передавались с высокой точностью контекста [29:49].

## ⚖️ Будущее и этика: конец приватности?
[[JUMP:32:00]]

Оба ученых признают, что технология находится в начале пути. Текущая точность оценивается Блуменштейном примерно в 60% [38:21], но прогресс ИИ и алгоритмов хранения данных неизбежно приведет систему к уровню 90% и выше.

Перспективы и риски технологий чтения мыслей:

*   **Голос для безгласных:** основная гуманитарная цель — общение с парализованными людьми и пациентами после инсульта [41:51].
*   **Ментальная приватность:** Джерри Танг подчеркивает, что никто не должен подвергаться декодированию без полного сотрудничества. Однако Брайан Грин выражает опасение, что «святость разума» может быть нарушена в мире тотальной слежки [07:07].
*   **Конвергенция технологий:** Блуменштейн считает, что через 5 лет устройства станут дешевле, точнее и доступнее, превратившись из медицинского оборудования в пользовательские интерфейсы [34:28].

Ученые сошлись во мнении, что успех технологии будет зависеть от синергии нейробиологии и ИИ. По мнению Блуменштейна, для достижения точности в 90%+ потребуется фундаментальный сдвиг в архитектуре ИИ — переход от простого сопоставления паттернов к пониманию того, как биологический мозг реально генерирует смыслы [37:15].