Почему современный ИИ — это «алхимия» вместо науки

«Промпт-инжиниринг — это в каком-то смысле тест на интеллект, потому что нам, людям, он не нужен», — утверждает исследовательница Мелани Митчелл, указывая на фундаментальный разрыв между статистической имитацией и подлинным пониманием. Пока индустрия бьется над масштабированием нейросетей, современные технологии все больше напоминают средневековую алхимию, где вместо научного метода мы получаем лишь эффектные, но хрупкие фокусы. Этот разговор — глубокое погружение в когнитивные ловушки ИИ и попытка понять, почему истинный интеллект требует не терабайтов данных, а тела, времени и способности мыслить аналогиями.

🧠 Иллюзия прогресса: циклы хайпа, хрупкость нейросетей и экзистенциальный страх Хофштадтера 0:05

Исторические качели: эпохи завышенных ожиданий и «зимы» ИИ 0:05

История искусственного интеллекта с самого своего зарождения в 1950-х годах напоминает синусоиду, вечно колеблясь между периодами бурного оптимизма с притоком масштабных инвестиций и временами глубокого разочарования, потери доверия и урезания финансирования. Профессор Мелани Митчелл отмечает, что даже сегодня, на фоне лавины технологических прорывов, создание давно обещанных систем — таких как полноценные беспилотные автомобили, роботы-домработницы или понимающие собеседники — оказывается гораздо более сложной задачей, чем предполагалось. Причина этих повторяющихся циклов кроется в нашем поверхностном понимании самой природы интеллекта и его комплексности.

Сверхоптимистичные прогнозы стары как сам ИИ. В 1958 году газета New York Times, описывая демонстрацию перцептрона Фрэнка Розенблатта, восторженно заявляла, что военно-морские силы США заложили «эмбрион электронного компьютера, который сможет ходить, говорить, видеть, писать, воспроизводить себя и осознавать свое существование». В 1960 году пионер ИИ Герберт Саймон безапелляционно утверждал, что машины в течение 20 лет будут способны выполнять любую работу, доступную человеку. Клод Шеннон в 1961 году вторил ему, ожидая появления научно-фантастических роботов из лабораторий через 10–15 лет, а Марвин Мински заявлял, что за жизнь одного поколения проблема создания ИИ будет существенно решена. Однако к концу 1980-х годов эти надежды рухнули: экспертные системы оказались хрупкими и неспособными к генерализации, поскольку создававшие их люди опирались на скрытые крупицы подсознательного здравого смысла, который невозможно было просто запрограммировать.

Новый виток колоссального хайпа начался в 2010-х после триумфа глубокого обучения на ImageNet. Снова посыпались громкие заявления: Стюарт Рассел предрек появление сверхинтеллекта при жизни своих детей, Сэм Альтман пообещал, что компьютерные программы скоро смогут делать великие научные открытия, а Марк Цукерберг в 2015 году планировал за 5–10 лет превзойти человека во всех основных чувствах и базовом познании. Мелани Митчелл напоминает, что эти споры идут еще с Дартмутского семинара 1956 года, организованного Джоном Маккарти. Сегодня мы наблюдаем ровно те же дискуссии, а скептики справедливо напоминают, что мы по-прежнему грубо переоцениваем машины и реального прогресса на пути к сильному общему интеллекту (AGI) почти нет.

Алхимия глубокого обучения: хрупкость и поверхностные корреляции 4:26

Фасад безупречного разума современных нейросетей быстро дал трещину. Как и все системы прошлого, глубокое обучение страдает от фатальной хрупкости и непредсказуемых ошибок, стоит модели столкнуться с ситуацией, отличающейся от обучающей выборки. Главная причина этого — склонность к так называемому shortcut learning (обучению по ярлыкам): сети находят поверхностные статистические ассоциации в данных, которые позволяют выдавать правильные ответы по совершенно неверным причинам.

Механизмы принятия решений в этих многопараметрических моделях остаются непрозрачными, а их уязвимость перед состязательными (adversarial) примерами доказывает: системы не понимают обрабатываемые данные в человеческом смысле. Более того, современный ИИ критически зависит от Big Data. Большие языковые и визуальные модели существуют лишь потому, что разработчики «пропылесосили» миллиарды документов и картинок в интернете, включая пользовательские фото с Flickr или метаданные капчи Google.

Исследователь из Microsoft Эрик Хорвиц открыто называет происходящее не наукой, а «формой алхимии», а Демис Хассабис из DeepMind сравнивает настройку таких систем с искусством, подвластным лишь паре сотен экспертов в мире. На этом фоне сформировался новый класс ИИ-«жрецов», где аспирантура стала затянутым собеседованием в техгиганты. Молодые дата-сайентисты мечтают о шестизначных зарплатах за обучение сетей из пяти слоев и семизначных — если слоев больше пятидесяти. Но за внешним лоском этих цифр скрывается все та же неспособность систем к истинному осмыслению реальности.

Ужас перед «мешком трюков»: почему Дуглас Хофштадтер боится ИИ 11:30

Особое место в формировании взглядов Мелани Митчелл занимает ее научный руководитель — легендарный автор книги «Гёдель, Эшер, Бах» Дуглас Хофштадтер. Хофштадтер всегда рассматривал аналогию как главный механизм мышления и «мотор познания». Однако столкновение с современными технологиями вызвало у него глубокий экзистенциальный кризис. На закрытой встрече в Googleplex Хофштадтер ошеломил собравшихся инженеров эмоциональным признанием: «Я в ужасе, я в ужасе».

Его пугает не восстание терминаторов, а нечто гораздо более интимное. В 1970-х ИИ казался далекой абстракцией, но затем шахматы пали под натиском грубого перебора. Долгое время считалось, что компьютер не сможет писать красивую музыку, ведь музыка — это язык эмоций, требующий сложнейшего внутреннего мира. Идея о том, что стерильные микросхемы копеечной коробки смогут воспроизвести то, что написали бы Бах или Шопен, казалась Хофштадтеру гротескным и постыдным недооцениванием глубины человеческого духа.

Все изменилось с появлением программы EMI (Experiments in Musical Intelligence) Дэвида Коупа. Она генерировала музыку в стиле Шопена настолько связно, что на эксперименте в Музыкальной школе Истмена профессора теории музыки и композиции не смогли отличить подделку от оригинала, а порой и принимали фальшивку за подлинный шедевр. Для Хофштадтера, с детства воспринимавшего музыку как прямое послание от души к душе, это стало страшным ударом. EMI буквально растоптала то, что он ценил в человечестве больше всего.

Главный страх Хофштадтера заключается в том, что интеллект, творчество и сами человеческие чувства могут оказаться разочаровывающе простыми для механизации. Он боится, что человеческий дух — это всего лишь «мешок трюков», который можно объяснить набором поверхностных алгоритмов брутфорса. Если разум бесконечной тонкости и эмоциональной глубины может быть тривиализирован крошечным чипом, это полностью разрушает концепцию уникальности человека.

Позднее в беседе Мелани Митчелл подробно разберет четыре главных заблуждения ИИ-исследователей, включая проблему антропоморфизации и роль телесности, однако основы этих масштабных дискуссий закладывались именно тогда, на стыке исторических циклов хайпа и экзистенциальных кризисов великих мыслителей.

🧠 Четыре ловушки разума и иллюзия ИИ 25:18

Иллюзия прогресса: четыре фундаментальных заблуждения 36:21

Профессор Мелани Митчелл в своей научной работе «Why AI is harder than we think» сводит современный скептицизм к четырем ментальным ловушкам, которые мешают адекватно оценивать реальный прогресс на пути к общему искусственному интеллекту (AGI). Ранее в разговоре собеседники уже касались исторических циклов хайпа, однако Митчелл предлагает взглянуть на их глубокую когнитивную природу.

Первое заблуждение гласит, что узкоспециализированный ИИ находится на одном континууме с сильным ИИ. Успехи в распознавании речи или автоматическом переводе преподносятся как последовательные шаги к полноценному разуму. Мелани ссылается на философа Хьюберта Дрейфуса, который метко назвал это «ошибкой первого шага». Современные системы неизбежно упираются в невидимый барьер — проблему здравого смысла (common sense problem), и простое масштабирование существующих подходов не способно перевести их через эту черту.

Второе заблуждение формулируется зеркально: «простые вещи — просты, сложные — сложны». Для человека победа над гроссмейстером в шахматы или го кажется вершиной интеллектуальных усилий. Основатель DeepMind Демис Хассабис прямо называл го «самой сложной из областей». Но это сложность исключительно с человеческой точки зрения. В то же время обычная детская игра в шарады (charades) остается абсолютно недосягаемой для ИИ. Она требует визуального понимания контекста и развитой модели психики (theory of mind) — качеств, которыми машины не обладают. Это классическое проявление парадокса Моравека: компьютеру легко даются задачи высокой логики, но бесконечно трудно — базовые навыки взаимодействия с миром.

Магия слов: ложные мнемоники и антропоморфизация 40:20

Третья ловушка — «магия ложных мнемоник» (wishful mnemonics), термин, предложенный исследователем Дрю Макдермоттом еще в 1976 году. Проблема в том, что мы повсеместно используем антропоморфные маркеры: «машинное обучение», «глубокое обучение» или «понимание естественного языка» (хотя последнее часто является лишь амбициозным названием технического бенчмарка). Когда корпорация IBM заявляет, что их суперкомпьютер Watson «прочитал» все медицинские учебники за пару часов, это вводит в заблуждение не только публику, но и самих разработчиков. Машина не читает и не понимает написанное так, как это делает человек.

Человеческая психика эволюционно склонна антропоморфизировать любой объект, проявляющий признаки агентности. Мелани напоминает о знаменитом чат-боте Eliza Джозефа Вейценбаума из 1960-х годов. Простейшие текстовые шаблоны, имитирующие психотерапевта, заставляли людей искренне верить, что программа глубоко понимает и сопереживает им.

В современных реалиях эта иллюзия расцвела вокруг больших языковых моделей. Тот факт, что для работы с GPT-3 возникла целая индустрия «промпт-инжиниринга», обнажает фундаментальную хрупкость технологии. Промпт-инжиниринг — это, по сути, тест на интеллект для самого человека, вынужденного ювелирно подбирать слова, а не для машины. Настоящий разум гибок: человека можно спросить десятком разных способов, и он поймет суть. Языковые модели лишены активного вовлечения в мир — они послушно выдают ответ, даже если не поняли вопроса, поскольку не способны остановиться и переспросить: «Я не совсем уверен, что ты имеешь в виду, поясни?».

Узкие инструменты против гибкого разума 30:03

Огромный поток медийного хайпа размывает границу между специализированным инженерным софтом и универсальным интеллектом. В качестве примера приводится нашумевшая статья BBC об AlphaFold от DeepMind под заголовком «Прорыв в ИИ может вызвать медицинскую революцию», где достижение авторов безапелляционно называлось «гигантским скачком». Мелани признает, что предсказание пространственной структуры белка — великое научное достижение. Однако AlphaFold решает изолированную, строго очерченную задачу. Это мощнейший инструмент поддержки человека (assistance), а не его автономная замена.

Аналогичная ситуация складывается вокруг генерации текстов и кода (вроде сервиса GitHub Copilot). Истинная природа успеха таких моделей, как GPT-3, остается глубокой загадкой. Способны ли они формировать устойчивые концептуальные репрезентации реальности или просто изощренно перефразируют и комбинируют гигантские объемы данных из обучающей выборки?.

Мелани указывает на полное отсутствие прозрачности в работе этих архитектур. Они могут демонстрировать поразительные результаты в тестах на буквенные аналогии, если добавить пробелы между символами (что связано с техническими особенностями байт-кодового кодирования BPE), но внезапно и полностью проваливаться на элементарных логических изменениях входных данных. В отличие от статических трансформеров, гибкий разум определяется способностью динамически адаптироваться к новым абстрактным контекстам.

Разум без тела? Роль воплощенного познания 25:18

Четвертая, самая дискуссионная ловушка, описанная Митчелл, — убеждение, что интеллект сосредоточен исключительно в мозге (intelligence is all in the brain). Это популярное в Кремниевой долине предположение, что когнитивные функции можно полностью «отцепить» от биологического субстрата и без потерь перенести в цифровой код. Мелани признается, что именно этот тезис вызвал самую агрессивную реакцию со стороны ИИ-сообщества и шквал гневных писем на её почту.

Концепция воплощенного познания (embodied cognition) утверждает обратное: репрезентация концептуальных знаний напрямую зависит от физического тела, она мультимодальна по своей природе. Мышление неразрывно связано с восприятием, действием и эмоциями. Пытаться обучить машину человеческому языку до того, как она освоит базовые физические принципы реальности, — значит ставить телегу впереди лошади.

Разработчики ИИ десятилетиями пытались формализовать здравый смысл через текстовые правила (например, вбивая в базу данных аксиому «объект не может находиться в двух местах одновременно»). Но для человека базовые понятия вроде «места» или «времени» наполнены богатейшим физическим опытом, который младенцы приобретают pre-linguistically — задолго до появления речи. Профессор ссылается на концепцию «базового знания» (core knowledge) психолога Элизабет Спелке. Младенцы используют врожденные эволюционные механизмы как ментальный каркас для понимания физических объектов, их пространственного взаимодействия и социальной агентности (например, мгновенного отличия живого человека от стола, за которым он сидит). Попытки составить универсальные когнитивные примитивы, вроде теории концептуальных зависимостей Роджера Шенка в Йеле, исторически потерпели неудачу именно из-за игнорирования этого живого, постоянно меняющегося телесного базиса.

🧠 Возвращение к истокам: Почему ИИ нуждается в когнитивистике 50:37

Преодоление текущего концептуального тупика в развитии искусственного интеллекта требует от исследователей пересмотра фундаментальных подходов. Мелани Митчелл убеждена, что создание гибких агентов, обладающих подлинным «здравым смыслом», невозможно без глубокой интеграции ИИ с науками о познании — прежде всего, с психологией развития и когнитивистикой.

Проблема современных систем заключается в попытке свести всё знание к набору примитивов или «закодировать» интеллект через пассивное поглощение размеченных данных из интернета. Как отмечает Митчелл, интеллект — это эмерджентное свойство системы, включающей мозг, тело, социум и окружающую среду. Попытки вручную дистиллировать этот опыт в жесткие правила приводят к тем же ошибкам неполноты и хрупкости, о которых неоднократно предупреждал Ян Лекун. О том, как хрупкость глубокого обучения и поверхностные корреляции влияют на устойчивость систем, эксперты говорили ранее в разговоре.

На текущем этапе развития исследователи начинают осознавать эти ограничения. Ранее разрозненные дисциплины снова сближаются: такие пионеры глубокого обучения, как Йошуа Бенджио, всё чаще обращаются к работам по системному мышлению, а методы из области психологии развития (например, теория «ядерного знания» Элизабет Спелке) находят отражение в современных архитектурах ИИ.

🔬 Расширение горизонта: Утрата и возрождение разнообразия в ИИ 112:18

Индустрия ИИ за последние десятилетия прошла через период своеобразной «идеологической гомогенизации». В 80-е и 90-е годы поле исследований было значительно более разнообразным, однако с доминированием глубокого обучения индустрия сузилась до нескольких топовых конференций, где практически любой метод, не основанный на статистическом обучении нейросетей, сталкивался с трудностями при публикации.

Эта потеря разнообразия подходов стала серьёзным препятствием для инноваций. Тем не менее, сегодня наблюдается «пробуждение» индустрии:

Возврат альтернатив: Исследователи всё чаще обращаются к методам, которые считались забытыми — например, эволюционным вычислениям, генетическим алгоритмам и клеточным автоматам.
Смена кадровой политики: Крупные исследовательские команды, такие как Google Brain, начинают открыто искать специалистов в областях, выходящих за рамки чистого глубокого обучения, что является крайне многообещающим сигналом.
Переоценка классики: Работы по теории аналогий (в том числе сотрудничество Митчелл с Дугласом Хофштадтером) снова становятся актуальными как ключ к пониманию гибкости мышления.

Митчелл полагает, что осознание ограничений нынешних подходов неизбежно вернёт в поле ИИ необходимые идеи, которые игнорировались на протяжении последних 20 лет, делая отрасль более открытой и вариативной.

⏳ Архитектура времени и иллюзия абстракции: почему современные нейросети не умеют мыслить 1:19:04

Динамика восприятия против статической архитектуры трансформеров 1:19:04

Разделение интеллекта на изолированные модули вроде визуального или языкового глубоко искусственно. После триумфа Алекса Крижевского на ImageNet в 2012 году бум компьютерного зрения начал постепенно замедляться, когда исследователи столкнулись со сложными задачами распознавания объектов. Стало очевидно, что зрительное восприятие неотделимо от общих когнитивных способностей, абстрактного мышления и языка. В попытке преодолеть этот тупик агентство DARPA запустило программу «Foundations of Machine Common Sense», объединившую специалистов по ИИ и специалистов по детской психологии развития. Их цель — воспроизвести этапы развития ребенка в возрасте от 0 до 18 месяцев, чтобы понять, как формируется базовый фундамент человеческих знаний. Хотя ранее в разговоре подробно обсуждалась роль телесности и воплощенного познания, данный проект наглядно иллюстрирует попытку воссоздать эволюцию когнитивных структур.

Главное концептуальное отличие живого мозга от современных больших языковых моделей заключается в самой природе восприятия. Мелани Митчелл подчеркивает, что биологическое восприятие — это динамический процесс, разворачивающийся во времени и опирающийся на непрерывную обратную связь на каждом этапе. Архитектура трансформеров и механизм внимания устроены принципиально иначе: они создавались ради того, чтобы избавиться от временной зависимости и обрабатывать данные одномоментно. Это позволило решить проблему долгосрочных зависимостей без использования рекуррентных вычислений, свойственных старым моделям вроде LSTM. Однако такой статический прямой проход полностью упускает итеративную временную динамику. Современные нейросети эквивалентны развернутым сетям фиксированной глубины и полностью лишены открытой итеративной способности к вычислениям. Без этой временной итеративности невозможно представить подлинное мышление. Представьте математика Эндрю Уайлса, который годами сидел на чердаке, размышляя над Великой теоремой Ферма. Сколько вычислительных итераций проделал его мозг?

В поисках гибких абстракций: от гибридных моделей к феномену эмерджентности 1:23:03

В поисках компромисса исследователи обращаются к разным парадигмам, что заставляет вспомнить о необходимости конвергенции ИИ и когнитивистики, о которой шла речь ранее. Одним из подходов является система Dreamcoder, использующая вероятностную индукцию программ для концептуализации входных данных — например, рукописных символов из датасета Omniglot. Попытки напрямую внедрить циклическую обработку — например, алгоритм HTM в компании Джеффа Хокинса Numenta — лишают модели их главного козыря: возможности эффективной параллелизации и оптимизации. Нейносимволические системы пытаются исправить это, сочетая символьный поиск с нейросетевой интуицией, подобно алгоритмам AlphaGo.

Сама Мелани Митчелл еще в 1995 году совместно с Дугласом Хофштадтером описала программу Copycat, которая занимала промежуточное положение между коннекционизмом и символизмом. Разработанная архитектура использовала символическую семантическую сеть концептов, но применяла непрерывные вероятности, из-за чего ее в шутку прозвали «Франкен-ИИ». Сегодняшние споры о примитивах вычислений — будь то позиция профессора Кришнасвами или мнение Скотта Ааронсона о низкоуровневой природе вычислений — отражают давний конфликт теории программирования и теории вычислений. Профессор Марк Би숍 и вовсе утверждает, что компьютэшнализм ошибочен. Если бы разум был просто кодом, человек вряд ли смог бы его понять. В фантастическом рассказе «Загадка Вселенной и ее решение» из сборника «Глаз разума» описывается гипотетический состязательный пример для человека, парализующий мозг. В реальности люди уязвимы для иллюзий, но человеческий мозг никогда не перепутает школьный автобус со страусом из-за изменения пары пикселей, как это происходит с машинами.

Оценка интеллекта через маловыборочное обучение и проблема «коротких путей» 1:39:02

Уязвимость нейросетей перед состязательными примерами обнажает фундаментальную проблему: машины используют совершенно иные признаки для принятия решений, чем люди. Истинная способность к абстракции должна проверяться не объемом обучающей выборки, а решением абсолютно новых задач по единичным примерам (few-shot learning). Франсуа Шолле в своем докладе на NeurIPS на примере теста ARC (Abstraction and Reasoning Corpus) разделил экстраполяцию на два типа, подчеркнув необходимость совмещения низкоуровневых и абстрактных примитивов.

В качестве классического мерила человеческого интеллекта часто используют прогрессивные матрицы Равена. Ряд недавних работ продемонстрировал впечатляющие успехи глубокого обучения в их решении. Однако Мелани Митчелл указывает на критический изъян одного из таких исследований: авторы непреднамеренно заложили статистическое смещение в способ генерации матриц. Как только это смещение было устранено, точность моделей упала до уровня случайного угадывания, оказавшись бесконечно далекой от человеческих результатов. Подобные проблемы возникают и в других областях — например, в известной работе Гийома Лампеля по символьному интегрированию. Этот феномен Шолле назвал «правилом короткого пути» (shortcut rule). Нейросеть всегда находит поверхностные статистические закономерности в данных вместо того, чтобы сформировать подлинное понимание задачи, которого от нее ждут создатели. Современные методы интерпретируемого машинного обучения лишь создают иллюзию понимания внутренней логики моделей. Неудивительно, что директор Microsoft Research Эрик Хорвиц метко сравнил современное глубокое обучение с алхимией.

🧭 Границы реальности и тупик беспилотного транспорта 1:44:28

Иллюзия точности: проблемы верификации беспилотного транспорта 1:44:28

Современные системы искусственного интеллекта демонстрируют феноменальные результаты на тестовых наборах данных, однако эта успешность часто скрывает глубокие концептуальные проблемы. В сфере беспилотного транспорта разработчики сталкиваются с фундаментальным вызовом: глубокие нейросети принимают решения, опираясь на признаки, которые кардинально отличаются от человеческого восприятия. Робомобиль может идеально распознавать дорожные знаки, разметку и ограничения скорости во время стандартных испытаний. Однако вся эта стабильность рушится, как только машина сталкивается со специфическими сценариями вне обучающей выборки (out-of-distribution).

Из-за того, что современные модели обучаются на огромных массивах данных, они склонны находить ложные статистические закономерности вместо понимания сути происходящего. В результате индустрия автономного транспорта оказалась в ситуации затяжного кризиса контроля качества: у инженеров попросту нет надежных инструментов верификации ИИ-систем, способных гарантировать их безопасность в непредсказуемой дорожной обстановке. Как уже отмечалось в предыдущих главах, ключевой причиной этого является внутренняя хрупкость глубокого обучения, подменяющего понимание поверхностными корреляциями.

Парадокс доверия и «неожиданная» сложность ИИ 1:46:14

Сторонники скорейшего внедрения робомобилей часто парируют этот тезис тем, что обычные водители-люди тоже совершают массу глупых ошибок, например, путают педаль газа с тормозом. Мелани Митчелл, однако, указывает на принципиальное различие: человеческие ошибки понятны и предсказуемы, тогда как сбои ИИ абсолютно непрозрачны. До тех пор, пока мы не поймем внутреннюю логику принятия решений машиной, полноценная интеграция ИИ в такие критические сферы, как транспорт или медицина, невозможна из-за дефицита базового доверия.

Осознание этой проблемы постепенно проникает даже к главным технооптимистам планеты. Митчелл с иронией вспоминает забавный инцидент: почти сразу после публикации ее научной работы «Почему ИИ дается нам тяжелее, чем мы думаем», Илон Маск опубликовал в Твиттере признание, что автономное вождение оказалось намного более сложной задачей, чем предполагалось изначально. Индустрия в очередной раз столкнулась с оптической иллюзией, когда цель казалась близкой, но реальный финиш сместился на недосягаемое расстояние.

Мир без рамок: отсутствие четких границ у реальных ситуаций 1:48:53

Фундаментальный барьер для ИИ заключается в том, что реальность не подчиняется строгим математическим фреймам. В отличие от настольных игр, ситуации из повседневной жизни лишены зафиксированных границ. В своей книге Митчелл цитирует выдающегося мыслителя Дугласа Хофштадтера, который объяснял, что наш мир принципиально не «упакован» в аккуратные категории: человек всегда оперирует размытым контекстом, интуитивно понимая, какие детали имеют значение, а какие нет.

Попытки загнать эту неопределенность в математические формулы приводят к созданию крайне абстрактных конструкций. Так, британский ученый Карл Фристон для описания границ мыслящего агента был вынужден ввести зыбкое понятие «слоя Маркова» (Markov blanket). Однако на практике эти концепты пасуют перед хаосом реальности. Даже бывший директор по ИИ в Tesla Андрей Карпати открыто признавал: абсолютно любое идеальное допущение, на котором строилась триумфальная победа алгоритма AlphaGo над человеком, мгновенно нарушается и обесценивается при столкновении с реальным миром.

Сто Нобелевских премий до мыслящей машины 1:49:47

Понимание этой пропасти заставляет экспертов трезвее оценивать перспективы технологической революции. Один из ведущих исследователей ИИ, у которого Митчелл брала интервью, лаконично отметил, что от полноценного общего искусственного интеллекта (AGI) нас отделяет как минимум «сто Нобелевских премий» — то есть колоссальное количество еще не совершенных фундаментальных открытий.

История ИИ развивается по спирали иллюзий. В далеких 1960-х годах Марвин Минский легкомысленно поручил студенту MIT за одно лето полностью решить проблему компьютерного зрения, посчитав её тривиальной. Спустя шестьдесят лет индустрия совершает ту же ошибку, принимая узкие статистические успехи за подлинный разум. Ведущие подкаста Machine Learning Street Talk в послеэфирном разборе подчеркнули, что современные триумфы ИИ часто оказываются результатом банального избытка данных. В качестве примера они привели несколько показательных фактов:

После того как DeepMind поразила мир нейросетью, играющей в Atari, независимые исследователи создали простейший эволюционный алгоритм случайного подбора весов, который превзошел глубокую модель Deep Q-Network.
Сложнейший ИИ для киберспортивной игры Dota был мгновенно разгромлен живыми игроками, как только те поняли его алгоритмические паттерны и вывели систему из зоны комфорта.

Машины и люди мыслят совершенно по-разному: там, где человек использует гибкие аналогии, компьютер полагается на слепой перебор и вычислительную мощность. Парадокс ИИ заключается в том, что задачи, кажущиеся нам невероятно сложными (например, шахматы), даются машинам легко, а базовые человеческие навыки выживания и адаптации, требующие миллионов лет биологической эволюции, остаются для машин недостижимой вершиной.

🧠 Разум как искусство перевода и мера энергоэффективности 2:16:04

Язык как мост между мирами аналогий 2:16:04

Человеческое общение — это не просто обмен символами, а сложный процесс перевода внутренних «аналоговых структур» в язык и их последующая реконструкция в сознании собеседника. В этой схеме коммуникация выступает как инструмент передачи смысловых аналогов: когда мы что-то объясняем, мы пытаемся закодировать свои внутренние состояния в слова так, чтобы у другого человека возникли схожие ментальные конструкции.

Философия Людвига Витгенштейна здесь проливает свет на фундаментальную проблему «чужого сознания». Представим, что у каждого человека есть своя «коробка» с содержанием, к которой нет прямого доступа у окружающих. Мы никогда не можем быть на 100% уверены, что в наших «коробках» лежит одно и то же, но мы предполагаем наличие достаточной общности, опираясь на биологическое сходство и, что важнее, на результаты наших действий.

Эффективность этой коммуникации проверяется практикой: если после обмена инструкциями люди способны скоординировано действовать (например, совместно выполнить задачу или нажать кнопку записи), это подтверждает, что перевод состоялся успешно. В каком-то смысле, социальное взаимодействие и следование «правилам Раппопорта» — необходимость перефразировать позицию оппонента до тех пор, пока он не подтвердит точность интерпретации — это защитный механизм, минимизирующий ошибки при трансляции смыслов. Таким образом, сама способность к совместному действию становится главным индикатором того, что мы мыслим в рамках единого концептуального пространства.

Энергоэффективность как объективный критерий интеллекта 2:03:51

В ходе дискуссии все чаще звучит мысль, что истинной мерой интеллектуальности любой системы — будь то человек или искусственный интеллект — является не накопленный объем знаний, а ее энергоэффективность. Биологические организмы ограничены жесткими рамками доступной энергии, и именно это «узкое горлышко» вынудило эволюцию создавать невероятно экономные и адаптивные системы.

С этой точки зрения, текущие подходы к созданию ИИ выглядят крайне расточительными. Обучение моделей уровня GPT-3 требует колоссальных ресурсов, которые несопоставимы с тем, как функционирует человеческий мозг, потребляющий всего лишь несколько ватт. Если рассматривать интеллект как способность минимизировать затраты энергии на единицу вычислений в динамично меняющемся мире, то становится очевидным: мы все еще находимся на ранних этапах развития.

Ключ к следующему скачку в области ИИ может лежать в понимании того, как сжимать информацию, используя симметрии и инварианты. Интеллект — это, по сути, отсутствие хрупкости, способность находить оптимальные решения при ограниченных ресурсах. В будущем объективным тестом на интеллект может стать «черный ящик»: мы не будем углубляться в то, как именно система училась или сколько данных она поглотила. Мы просто измерим, сколько энергии потребовалось системе для выполнения задачи в реальном мире. Если одна система справляется эффективнее другой при тех же затратах, она объективно является более интеллектуальной, независимо от того, насколько ее внутренние процессы напоминают человеческие.

Ранее в разговоре участники касались проблемы «лени» алгоритмов (shortcut learning), отмечая, что эволюция также склонна к поиску кратчайших путей для реализации базовых стратегий выживания.

🥂 Финал дискуссии: Человеческий фактор и истинный критерий разумности 2:30:33

Завершение двух с половиной часового марафона с профессором Мелани Митчелл подводит черту под одной из самых глубоких дискуссий о природе когнитивистики и машинного обучения. Когда технические подробности архитектур и философские споры об аналогиях остаются позади, на передний план выходит фундаментальный вопрос о том, как именно мы выносим вердикт о наличии разума. Финальные секунды интервью — это не просто формальное прощание, а квинтэссенция позиции Митчелл, подчеркивающая, что путь к результату в ИИ важнее самого результата.

Понимание через достижение: Последний штрих к портрету ИИ 2:30:46

В последние мгновения содержательной части беседы Мелани Митчелл формулирует важную мысль, которая служит логическим завершением её тезисов о хрупкости современных систем. Она отмечает, что для неё истинное признание системы «разумной» наступает не в момент фиксации цифр на бенчмарке, а в момент понимания механизмов, которые привели к этому успеху.

«Что бы ни потребовалось для достижения этого — только тогда я пойму, является ли это интеллектуальным», — резюмирует профессор.

Этот подход радикально отличается от общепринятого в индустрии стремления к «результату любой ценой». Ранее в разговоре участники уже касались проблем хрупкости глубокого обучения и поверхностных корреляций, и этот финальный аккорд Митчелл подтверждает: интеллект — это не конечная точка на графике точности, а качество процесса обработки информации. Она настаивает на том, что мы не можем называть систему разумной, если её успех обусловлен статистическими лазейками, а не подлинным пониманием контекста или способностью к абстракции. Это высказывание ставит жирную точку в споре о том, достаточно ли нам имитации человеческого поведения для признания субъектности ИИ.

Магия дебрифинга: Коллективный разум ML Street Talk 2:30:59

Тим Скарф, ведущий подкаста, переводит беседу в формат завершающего «дебрифинга», представляя команду, которая помогала анализировать и структурировать этот сложный интеллектуальный поток. Участие Летиции и Кита в финальной части программы подчеркивает коллективный характер современной научной журналистики в сфере ИИ.

Для сообщества Machine Learning Street Talk такие «разборы полётов» стали визитной карточкой. Тим выражает искреннюю благодарность коллегам за помощь в деконструкции идей Митчелл. Это напоминает слушателю, что темы, поднятые в интервью — от проблем верификации беспилотников до энергоэффективности мозга — требуют многослойного осмысления разными экспертами. Несмотря на то что основная часть интервью подошла к концу, работа над осознанием услышанного только начинается.

Человеческое лицо науки: Выход в «оффлайн» 2:31:05

Особое очарование финалу придает внезапное переключение с высоких материй на обыденную человеческую радость. Когда Тим Скарф упоминает, что впереди выходные, это вызывает у Мелани Митчелл живой эмоциональный отклик.

Профессор признается, что напоминание о выходных делает её «намного счастливее».
Она отмечает, что получила огромное удовольствие от процесса дискуссии, несмотря на её сложность.
Ведущие и гостья обмениваются теплыми словами благодарности, подчеркивая атмосферу взаимного уважения.

Этот короткий эпизод напоминает нам о «человеческом факторе», который так часто обсуждался в контексте воплощенного познания. Даже ученые мирового уровня, обсуждающие угрозу утраты разнообразия подходов в ИИ или страхи Дугласа Хофштадтера перед технологиями, остаются людьми, которые ценят отдых и живое общение.

Завершая эфир, Тим Скарф выражает нетерпение по поводу выпуска этого эпизода в свет, осознавая ценность полученного материала для широкой аудитории. На этом история одного из самых длинных и содержательных интервью с Мелани Митчелл заканчивается, оставляя зрителя с пищей для размышлений о том, насколько тернист и сложен путь к созданию по-настоящему гибкого и понимающего разума.