Майкл Джордан: «Создание автоматизированных копий человека ничего не изменит»

Eye on AI 4,9 тыс. 1 ч 6 мин 10 мин 09.08.2023
Главное

В новом выпуске подкаста Eye on AI ведущий Крейг Смит беседует с Майклом Джорданом, профессором Калифорнийского университета в Беркли и одним из самых авторитетных мировых ученых в области искусственного интеллекта. В центре дискуссии — критический анализ современных трендов вокруг больших языковых моделей, глубинная связь машинного обучения с экономической теорией и необходимость перехода от простой имитации человеческого разума к проектированию сложных децентрализованных систем.

🛠️ Миф о критике глубокого обучения: взгляд статистика 4:06

В академической среде и прессе нередко звучит мнение, будто Майкл Джордан скептически относится к нейросетевым технологиям. Однако сам ученый категорически опровергает статус критика глубокого обучения. По его словам, этот метод представляет собой эффективный алгоритм градиентного спуска, который отлично аппроксимирует данные и успешно обобщает их в высокоразмерных пространствах.

Майкл Джордан настаивает на том, что глубокое обучение по своей сути является сугубо статистическим методом. Оценка качества обобщения модели относительно неизвестного распределения в реальном мире — это классическая задача математической статистики. В настоящее время исследователь сам активно занимается интеграцией методов квантификации неопределенности (uncertainty quantification) в работу глубоких нейросетей.

Проблема заключается не в самой технологии, а в попытках позиционировать ее как панацею. Майкл Джордан сравнивает глубокое обучение с хорошим молотком в арсенале инженера-строителя. Ошибка кроется в неверной формулировке глобальной задачи, когда один удачный инструмент пытаются выдать за решение абсолютно всех существующих проблем. Между статистическим мышлением и глубоким обучением нет абсолютно никакого конфликта.

🧠 «Семантика для бедных»: реальные возможности и ограничения LLM 5:56

Бурное развитие больших языковых моделей (LLM) и мультимодальных систем заставляет общество говорить о прорыве в понимании человеческого языка. Майкл Джордан призывает снизить градус восторженности вокруг моделей с миллиардами параметров. Он отмечает, что человеческий язык строится на глубоком понимании смыслов и прагматике общения. В то же время в визуальных сценах и текстах присутствует огромное количество низкоуровневых корреляций.

По мнению эксперта, современные технологии глубокого обучения совершают то, что можно назвать «семантикой для бедных» (poor man's semantics). Нейросети успешно улавливают колоссальные объемы неочевидных статистических связей между пикселями или словами, которые человек даже не замечает или игнорирует. Однако эта статистика не имеет ничего общего с подлинным пониманием.

Майкл Джордан подчеркивает, что текущие модели ИИ принципиально не способны выполнять следующие задачи:

В процессе человеческого общения собеседники выстраивают в сознании динамическую модель ситуации, учитывающую социальный контекст, эмоции и общую предысторию. Компьютеры пока бесконечно далеки от подобного уровня взаимодействия. Глубокое обучение — это лишь первый шаг на пути к решению сложнейшей проблемы, но сам по себе градиентный спуск на гигантских массивах данных не является финальным ответом.

Кроме того, современные нейросети по-прежнему демонстрируют крайне слабые результаты в критически важных для реальной жизни направлениях:

🕸️ Смена парадигмы: почему имитация человека — ложная цель для ИИ 12:20

Идея прохождения теста Тюринга и создания машины, способной полностью имитировать человека в языковой среде, зародилась в 1940–1950-х годах. В ту эпоху появление компьютерного железа и программного обеспечения вызвало естественный азарт: ученые пытались переложить философские вопросы о природе разума на язык математических алгоритмов. На этом видении выросли целые поколения исследователей, включая самого Майкла Джордана.

Тем не менее эксперт задается прагматичным вопросом: зачем сегодня пытаться слепо копировать человека? На планете живут миллиарды людей, и создание еще нескольких автоматизированных систем с человеческими когнитивными функциями мало что изменит в глобальном масштабе. Попытки заявить, что ИИ станет «лучше человека», по мнению Джордана, уводят дискуссию в область чистой научной фантастики.

Вместо попыток вдохнуть «разум в коробку с проводами» ИИ-сообществу необходимо сосредоточиться на принципах управления масштабными сетевыми взаимодействиями. Компьютерные технологии сегодня пронизывают финансовые рынки, транспортные системы, коммерцию, образование и здравоохранение. Главная задача современности — понять, как строятся потоки данных, как меняются условия в этих сетях и какие стимулы заставляют участников эффективно взаимодействовать друг с другом. К сожалению, большинство разработчиков ИИ пока не привыкли мыслить категориями масштабных сетевых систем.

🌾 Уроки экономики: Нью-Йорк, децентрализация и критика тотальной оптимизации 16:00

Комментируя популярный тезис о том, что ИИ способен стать идеальным инструментом глобальной оптимизации — например, собрать все переменные и рассчитать бесконфликтное решение для геополитического кризиса уровня противостояния России и Украины — Майкл Джордан высказывает жесткое несогласие.

Подобный взгляд он называет утопической научной фантастикой. Ошибка кроется в самом понимании слова «система». Для компьютерных специалистов система — это программа в коробке, принимающая решения. Однако с точки зрения экономической науки истинная система — это децентрализованная сеть, такая как механизм ежедневного снабжения Нью-Йорка продовольствием.

Если бы за Землей наблюдали марсиане, они сочли бы систему снабжения мегаполиса признаком сверхразума. Миллионы людей каждый день получают еду, хотя процессом не управляет ни один человек, министерство или центральный компьютер. Система функционирует не за счет тотальной сквозной оптимизации, а за счет постоянного поиска рыночного равновесия (включая равновесие по Парето) и баланса интересов.

Сквозная оптимизация сложных социальных и геополитических процессов невозможна из-за неустранимой асимметрии информации. Участники скрывают свои истинные мотивы, состояние ресурсов или здоровье. В условиях скрытой информации невозможно построить точную математическую модель для оптимизации. Человечество выживает благодаря созданию стимулов, которые подталкивают децентрализованных агентов к нахождению устойчивого компромиссного равновесия.

Реальный прорыв на стыке ИИ и экономики происходит прямо сейчас благодаря внедрению адаптивного анализа данных в такие механизмы, как:

Современные смартфоны превратили людей в одновременных производителей и потребителей ценности. Нам предстоит создать масштабную инженерную дисциплину, способную регулировать эти замкнутые системы больших данных, учитывая экономические факторы.

📦 Логистика Amazon и истинное происхождение облачных вычислений 26:00

Разговоры о создании ИИ, способного отслеживать цепочки поставок и решать логистические кризисы, часто подаются как технологии будущего. Майкл Джордан напоминает, что эти механизмы успешно работают еще с конца 1990-х и начала 2000-х годов.

Ни один человек физически не способен координировать продажу и доставку миллиарда товаров для сотен миллионов клиентов — этот процесс в Amazon полностью контролируется алгоритмами машинного обучения. Уже на рубеже веков системы обрабатывали информацию о забастовках в Китае или штормах в Индийском океане, адаптивно корректируя маршруты судов. Без этого существование таких гигантов, как Amazon или Alibaba, было бы технически невозможным.

С этим фактом связана малоизвестная технологическая деталь: индустрия облачных вычислений возникла как прямое следствие задач машинного обучения, а не наоборот. Около 2000 года Amazon построила колоссальные вычислительные мощности исключительно для внутренних нужд: анализа логистических цепочек и обработки коммерческих данных.

В определенный момент руководство компании осознало, что их инфраструктура способна эффективно масштабироваться для параллельного анализа данных на 10 000 серверов. Они решили сдавать эти избыточные мощности в аренду сторонним клиентам. Так родился современный Cloud Computing, выросший из утилитарных задач предиктивной логистики.

🏥 Децентрализованное здравоохранение и информационные цепочки поставок 29:48

Принципы распределенной логистики можно перенести на некоммерческие и социально значимые сферы, в первую очередь — на здравоохранение. Медицину можно представить как гигантскую цепочку поставок информации о геномах, опухолях, методах лечения и результатах клинических испытаний. Пандемия COVID-19, унесшая миллионы жизней, наглядно показала несовершенство текущей системы и критическую нехватку оперативного обмена данными.

Развитие машинного обучения ведет к формированию полноценной персонализированной медицины. Когда пациент приходит к врачу, его текущие показатели мгновенно сопоставляются с массивом данных миллионов других людей, обследованных за последние годы, и историей эффективности их лечения. На основе этого алгоритмы выдают точные предиктивные рекомендации врачу.

Майкл Джордан особо подчеркивает, что подобная глобальная информационная сеть не требует создания жесткого единого центра управления. Для этого существуют технологии федеративного обучения (federated learning) и пиринговые (peer-to-peer) методы, позволяющие узлам сети безопасно учиться друг у друга.

В будущем инженеры будут использовать эти адаптивные принципы для проектирования локальных систем в самых разных сферах — от реформирования образования в Юго-Восточной Азии до реализации программ по смягчению последствий изменения климата. Подобно тому, как в химической промышленности не бывает двух абсолютно одинаковых заводов, в ИИ-инженерии будущего каждая система будет создаваться под уникальные условия конкретной отрасли.

📜 Статистическая теория контрактов и стратегические агенты 38:35

Главная сложность построения масштабных сетей — это асимметрия информации и эгоистичное поведение участников. В экономике для решения таких проблем применяется теория контрактов. Ранние концепции ИИ предполагали, что все пользователи будут беспрепятственно отдавать свои данные в единый центр ради общего блага, но в реальности люди и организации всегда действуют стратегически. Они не станут делиться информацией, если не видят прямой выгоды или опасаются за приватность.

Майкл Джордан приводит пример из американской практики: процесс одобрения медицинских препаратов Управлением по санитарному надзору за качеством пищевых продуктов и медикаментов (FDA). FDA проводит дорогостоящие клинические испытания стоимостью в десятки миллионов долларов. Фармацевтические компании выступают в роли стратегических агентов: они тестируют молекулы внутри себя и, зная, что успешный препарат принесет миллиарды долларов, кровно заинтересованы отправить на проверку в FDA как можно больше кандидатов.

Если регулятор напрямую спросит компанию, насколько качественный кандидат ей отправлен, она утаит негативные данные или солжет, поскольку это естественное поведение человека или бизнеса в ситуации стратегического выбора. В экономике это называется проблемой неблагоприятного отбора (adverse selection) и морального риска (moral hazard).

Чтобы преодолеть этот тупик, исследовательская группа Майкла Джордана разработала статистическую версию теории контрактов. Они объединили экономический инструмент «меню вариантов» с математической статистикой:

Аналогичный подход необходим в банковской сфере при оценке кредитных рисков. Если заемщики знают, какой именно алгоритм логистической регрессии или нейросети использует банк, они начинают умышленно искажать подаваемые данные, чтобы казаться более благонадежными. Система машинного обучения должна изначально проектироваться с учетом стратегического противодействия со стороны пользователей.

🚗 Аватары на дорогах: будущее регулирования трафика через микроаукционы 48:39

Классическим примером сбоя систем, игнорирующих теорию игр, является современная городская навигация. Когда водитель строит маршрут до аэропорта, приложение выдает ему самый быстрый путь на основе исторических данных. Проблема в том, что алгоритм направляет по этой улице тысячи водителей одновременно, мгновенно создавая искусственный затор.

Майкл Джордан видит решение в создании рыночного экономического слоя над транспортными потоками. У разных людей в один и тот же момент принципиально разная ценность времени:

Разумеется, человек не может лично сидеть за рулем и торговаться с другими участниками движения за право проезда. По прогнозу Джордана, в ближайшие 10 лет городская логистика перейдет под управление цифровых «аватаров» — вычислительных агентов-брокеров, действующих от имени и в интересах каждого конкретного водителя.

Эти аватары будут собирать внутренние предпочтения владельцев и проводить мгновенные, верифицируемые микроаукционы между собой прямо во время движения. Это позволит распределять дорожный трафик не директивно сверху вниз, а через гибкий внутренний рынок, создавая колоссальную общественную и экономическую ценность.

🎵 United Masters и революция в креативной экономике 53:45

Свои теоретические выводы Майкл Джордан проверяет на практике. Один день в неделю он работает в качестве научного консультанта (Amazon Scholar) в компании Amazon, что позволяет ему видеть реальные инженерные вызовы индустрии. Другим важным практическим проектом для ученого стало участие в совете директоров музыкальной платформы United Masters, где он работает последние 4–5 лет.

Компанию возглавляет легендарная фигура в мире хип-хопа Стив Стаут. На сегодняшний день платформа объединяет более 2 миллионов молодых независимых музыкантов. Традиционная модель музыкальной индустрии и крупных лейблов долгие годы работала против начинающих авторов, не позволяя им зарабатывать напрямую. United Masters превратила этот бизнес в прозрачный трехсторонний рынок, связывающий артистов, слушателей и крупные бренды (например, Национальную баскетбольную ассоциацию — NBA).

Главное отличие этой системы от стриминговых гигантов вроде Spotify заключается в предоставлении артистам полноценной экономической субъектности и прозрачных данных. На Spotify музыкант загружает трек «вслепую» и получает незначительные отчисления от общей подписки, не имея представления о своей аудитории.

Алгоритмы анализа данных United Masters позволяют исполнителю детально видеть свою географическую популярность. Если 16-летний музыкант из Балтимора обнаруживает, что в городе Дейтон (штат Огайо) его трек за неделю послушали 10 000 человек, он получает мощный инструмент монетизации:

  1. Артист напрямую предлагает владельцам концертных площадок в Дейтоне организовать выступление.
  2. Платформа точечно уведомляет именно тех 10 000 локальных слушателей о грядущем концерте.
  3. Исполнитель оперативно зарабатывает, например, $20 000 за вечер.
  4. Параллельно запускаются прямые продажи мерча (например, брендированных кепок) конкретным фанатам.

Такой подход формирует настоящую «экономику создателей» (Creator Economy). Технологии ИИ и анализа сетевых предпочтений должны использоваться не для автоматизации человеческих рабочих мест, а для создания миллионов новых точек экономической активности, когда люди могут монетизировать свое творчество напрямую, минуя глобальных корпоративных посредников.

💬 Цитаты

«Глубокое обучение — это семантика для бедных, поскольку оно улавливает мелкие корреляции, о которых большинство из нас даже не подозревает.»

Майкл Джордан 07:17

«Облако появилось благодаря рабочим нагрузкам машинного обучения, а не наоборот.»

Майкл Джордан 29:34

«У нас есть миллиарды людей, и создание еще нескольких автоматизированных копий принципиально ничего не изменит.»

Майкл Джордан 14:44
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Сдвиг распределения (Distribution shift)
Изменение статистических свойств входных данных во времени, из-за которого обученные модели ИИ начинают совершать ошибки.
Теория контрактов (Contract theory)
Раздел экономической теории, изучающий, как проектировать соглашения и стимулы в условиях, когда стороны скрывают важную информацию.
Асимметрия информации
Ситуация в экономических или сетевых системах, при которой одни участники обладают важными данными, а другие — нет.
Экономика создателей (Creator economy)
Экономическая модель, позволяющая авторам контента монетизировать свое творчество напрямую с помощью цифровых платформ, минуя классических посредников.
📊 Цифры
🗓 Хронология
  1. Конец 1990-х годов Начало активного внедрения алгоритмов машинного обучения в логистические процессы и цепочки поставок компании Amazon.
  2. Около 2000 года Масштабирование инфраструктуры обработки данных Amazon до 10 000 компьютеров, заложившее основу для индустрии облачных вычислений AWS.
  3. 2021–2022 годы Майкл Джордан в течение 4–5 лет состоит в совете директоров музыкальной платформы United Masters, помогая развивать Creator Economy.
⚖️ Другая сторона
Искусственный интеллект Майкл Джордан глубокое обучение теория контрактов United Masters Amazon