Искусственный интеллект научился превращать активность мозга в текст

С самого появления человечества наши мысли оставались последним бастионом абсолютной приватности — «священным убежищем», по выражению Шарлотты Бронте, куда невозможно войти без приглашения. Однако стремительное развитие нейробиологии и искусственного интеллекта ставит этот статус-кво под угрозу. Сегодня исследователи в Техасе и Сиднее демонстрируют технологии, способные превращать активность мозга в связный текст, фактически открывая доступ к внутреннему монологу человека без хирургического вмешательства.

🧠 Чтение мыслей: от френологии к ИИ-декодерам 2:14

Попытки связать физические параметры мозга с психическими процессами предпринимались еще в XIX веке. Брайан Грин напоминает о френологии Франца Йозефа Галля — ошибочной теории, пытавшейся связать форму черепа с интеллектом и характером . Несмотря на отсутствие научной строгости, она заложила основу для последующих попыток квантификации разума через психометрику и тесты IQ.

Настоящий прорыв произошел в конце XX века с появлением инструментов неинвазивного сканирования:

ЭЭГ (электроэнцефалография): фиксирует электрические сигналы мозга через электроды на коже головы, замеряя электромагнитный «отпечаток» мысли .
фМРТ (функциональная магнитно-резонансная томография): измеряет кровоток как косвенный показатель нейронной активности .

Современный подход основывается на гипотезе, что каждая уникальная мысль имеет свой специфический электромагнитный или метаболический «отпечаток пальца». Задача ученых — составить «словарь», связывающий эти сигналы с конкретными словами и смыслами .

🏗️ Метод Университета Техаса: 16 часов подкастов 7:47

Джерри Танг, ведущий автор исследования из Техасского университета в Остине, представил систему декодирования естественного языка на базе фМРТ. Его метод представляет собой двухэтапный процесс: обучение модели на реакциях мозга конкретного пользователя и последующее предсказание новых мыслей .

Ключевые детали исследования:

Обучающая выборка: пользователи слушали 16 часов разговорных подкастов, лежа внутри сканера . По словам Танга, это значительно превышает объем данных в типичных нейробиологических экспериментах.
Специфика данных: фМРТ обладает высоким пространственным разрешением (кубы 3x3x3 мм), что критически важно, так как языковые значения распределены в мозгу очень тонким и точным образом .
Индивидуальность: на данном этапе невозможно обучить модель на одном человеке и применить её к другому . Каждый «словарь мыслей» уникален, хотя общая организация зон мозга схожа.

Танг отмечает, что хотя мозг испытуемых иногда «блуждал» во время прослушивания , использование увлекательных нарративных историй и огромный объем данных позволили ИИ отфильтровать шум и найти закономерности.

🎙️ От смысла к тексту: точность против сути 13:47

Одной из главных особенностей техасского декодера является его способность передавать «суть» (gist), а не дословный перевод. Танг продемонстрировал примеры, где фраза «мы начали обмениваться историями из жизни» была расшифрована ИИ как «мы начали говорить о нашем опыте» .

Результаты экспериментов показывают:

Декодирование воображаемого: система работает, даже если человек не слышит текст, а просто представляет, как рассказывает историю в своей голове .
Метрики успеха: для оценки качества используются нейронные сети, измеряющие семантическую похожесть предложений. В тестах с вопросами на понимание декодированного текста испытуемые смогли дать верные ответы в 9 случаях из 16 .

🧢 Подход Сиднея: портативность и ЭЭГ 23:48

Профессор Майкл Блуменштейн из Технологического университета Сиднея (UTS) работает над более практичным решением — специальной шапочкой с датчиками ЭЭГ . В отличие от громоздкого и дорогого фМРТ, этот метод портативен, хотя и дает более «грубый» сигнал.

Команда UTS использует технологию под названием DeWave:

Самообучение: система применяет self-supervised learning, что позволяет уменьшить зависимость от огромных размеченных датасетов .
Интеграция с LLM: декодированные сигналы мозга (токены) подаются на вход большой языковой модели (по аналогии с ChatGPT), которая интерпретирует их и выстраивает в грамматически верные предложения .
Нормализация данных: подход Блуменштейна позволяет частично нивелировать индивидуальные различия между людьми, делая шаг к универсальному декодеру .

Блуменштейн продемонстрировал видео, где мысли испытуемого о «тарелке куриного супа» декодировались как «тарелка говяжьего супа» , а абстрактные описания сказочного леса передавались с высокой точностью контекста .

⚖️ Будущее и этика: конец приватности? 32:00

Оба ученых признают, что технология находится в начале пути. Текущая точность оценивается Блуменштейном примерно в 60% , но прогресс ИИ и алгоритмов хранения данных неизбежно приведет систему к уровню 90% и выше.

Перспективы и риски технологий чтения мыслей:

Голос для безгласных: основная гуманитарная цель — общение с парализованными людьми и пациентами после инсульта .
Ментальная приватность: Джерри Танг подчеркивает, что никто не должен подвергаться декодированию без полного сотрудничества. Однако Брайан Грин выражает опасение, что «святость разума» может быть нарушена в мире тотальной слежки .
Конвергенция технологий: Блуменштейн считает, что через 5 лет устройства станут дешевле, точнее и доступнее, превратившись из медицинского оборудования в пользовательские интерфейсы .

Ученые сошлись во мнении, что успех технологии будет зависеть от синергии нейробиологии и ИИ. По мнению Блуменштейна, для достижения точности в 90%+ потребуется фундаментальный сдвиг в архитектуре ИИ — переход от простого сопоставления паттернов к пониманию того, как биологический мозг реально генерирует смыслы .