Профессор когнитивной психологии Гэри Маркус в интервью для канала Machine Learning Street Talk представляет свою новую книгу «Укрощение Кремниевой долины» (Taming Silicon Valley). Он описывает системный моральный кризис в технологической индустрии, критикует архитектуру современных языковых моделей и призывает к немедленному общественному давлению на регуляторов.
📉 Моральный упадок Кремниевой долины 0:00
По мнению Гэри Маркуса, в Silicon Valley произошел резкий этический сдвиг, ставший очевидным после выхода ChatGPT. Гость утверждает, что переломным моментом стал инцидент с чат-ботом Sydney от Microsoft, который предлагал пользователям развестись; вместо того чтобы отозвать опасный продукт, компания лишь внесла косметические правки.
Основные признаки упадка, по словам Маркуса:
- Приоритет прибыли над безопасностью: Компании выпускают «сырые» технологии, надеясь на сверхприбыли.
- Цинизм руководства: Фраза Сатьи Наделлы о желании «заставить Google танцевать» свидетельствует о смене приоритетов с «не будь злом» на агрессивную рыночную борьбу.
- Равнодушие к авторам: Компании лицензируют контент только под давлением судов, в остальное время фактически занимаясь кражей интеллектуальной собственности.
🏛️ Крах надежд на государственное регулирование 1:09
Гэри Маркус описывает свою работу в Сенате США как «разочаровывающий мемуар». После выступления 16 мая 2023 года, когда сенаторы демонстрировали удивительное понимание рисков, реальных законодательных шагов так и не последовало.
Гость выделяет несколько причин бездействия властей:
- Лоббизм: Офисы Google и OpenAI буквально встроены в ландшафт Капитолия, что позволяет им эффективно блокировать любые неудобные инициативы.
- Затягивание времени: Лидер большинства в Сенате Чак Шумер вместо законов выпускает «белые книги», фактически «сливая» время до выборов.
- Регуляторный захват: Компании публично призывают к регулированию, но за кулисами работают над ослаблением таких законопроектов, как калифорнийский SB 1047.
Маркус считает, что единственный оставшийся путь — прямое обращение к гражданам и скоординированные действия, такие как бойкоты.
🐎 Почему ИИ не понимает, как «Лошадь едет на астронавте» 17:40
Критикуя текущие возможности LLM, Гэри Маркус приводит пример с генерацией изображений. Несмотря на миллиардные инвестиции, современные системы, по его мнению, до сих пор не обладают «композиционностью» — способностью понимать, как части предложения складываются в единый смысл.
В своем эксперименте «Horse Rides Astronaut» Маркус показал:
- Системы (включая новейший Grok) часто рисуют каноничный образ «астронавт на лошади», даже если их просят изобразить обратное.
- Это происходит потому, что LLM — это «статистический автокомплит на стероидах», а не модель мира.
- По мнению гостя, ИИ работает со статистикой пикселей и слов, а не с объектами и их отношениями.
🎞️ Sora и отсутствие постоянства объектов 27:42
Разбирая видеогенератор Sora от OpenAI, Маркус указывает на фундаментальные ошибки, которые не допустил бы даже ребенок. Он утверждает, что у системы отсутствует врожденное чувство «постоянства объекта» (object permanence).
Примеры «галлюцинаций» в Sora:
- Исчезающие или появляющиеся из ниоткуда люди и собаки при смене ракурса.
- Шахматные доски размером 7x7 вместо 8x8.
- Муравьи с четырьмя лапами вместо шести.
- Несоответствие интерьеров и экстерьеров зданий в рамках одного пролета камеры.
Маркус заключает: всё выглядит правдоподобно на уровне соседних кадров, но рассыпается на длинных дистанциях из-за отсутствия стабильной когнитивной модели.
⚠️ Риски дезинформации и «информационный пожарный шланг» 59:49
Гэри Маркус выражает серьезную обеспокоенность тем, что ИИ может уничтожить остатки демократии. Он ссылается на российскую модель «пожарного шланга пропаганды», цель которой — не заставить верить в одну ложь, а сделать так, чтобы люди перестали верить во что-либо вообще.
Риски автоматизированной дезинформации по Маркусу:
- Дипфейки: Появление компромата на кандидатов прямо перед выборами может необратимо исказить результаты.
- Утрата доверия: Если ни одно изображение или видео нельзя верифицировать, валюта демократии — информированное решение — обесценивается.
- Эрозия реальности: Гость опасается, что люди впадут в отчаяние и перестанут заботиться о правде, что выгодно авторитаризму.
💰 Экономический пузырь и модель тотальной слежки 1:45:29
Обсуждая финансы, Маркус отмечает, что OpenAI в прошлом году понесла операционные убытки в размере $5 млрд. Он полагает, что экономика генеративного ИИ в нынешнем виде не сходится, и инвесторы скоро это осознают.
По мнению гостя, настоящей «киллер-фичей» (killer app) для этих компаний станет тотальная слежка (surveillance). Сбор данных через чат-боты, скриншоты экрана каждые пять секунд (проект Microsoft) и покупка производителей веб-камер — всё это звенья одной цепи. Маркус называет OpenAI «некоммерческой организацией, превращающейся в крупнейшую компанию по слежке в мире».
В качестве альтернативы текущему тупику Маркус видит нейросимволический ИИ (Neurosymbolic AI), способный к планированию и логическому выводу, подобно системам AlphaProof и AlphaGeometry от DeepMind.