Ян Лекун: почему модели мира важнее языковых способностей

«Сознание — это не признак высшего разума, а следствие биологических ограничений нашего мозга», — утверждает Ян Лекун, главный архитектор ИИ в Meta. Вместо погони за лингвистическими моделями он предлагает сфокусироваться на создании машин, способных, подобно человеку, познавать мир через постоянное предсказание реальности, а не через анализ статистики текста.

🧠 Самообучение: «тёмная материя» интеллекта 0:38

Современный искусственный интеллект всё ещё далёк от того, чтобы воспроизвести механизмы обучения, доступные людям и животным. По мнению Яна Лекуна, сегодня доминируют два подхода: обучение с учителем (supervised learning) и обучение с подкреплением (reinforcement learning). Однако оба они крайне неэффективны: первому требуются огромные массивы размеченных человеком данных, а второму — колоссальное количество попыток и ошибок, что делает невозможным, например, создание полноценных беспилотных автомобилей лишь на основе метода проб и ошибок.

Человек же способен научиться вождению всего за 20 часов практики. Причина в наличии «фоновых знаний» — фундаментального понимания того, как устроен мир, которое дети приобретают в первые месяцы жизни. Это происходит не через выполнение задач или получение подкреплений, а исключительно через наблюдение за окружающим миром, формирование моделей физических объектов и причинно-следственных связей.

Ян Лекун называет самообучение (self-supervised learning) «тёмной материей интеллекта», так как оно является тем самым недостающим звеном, позволяющим машинам обучаться на основе наблюдений, без постоянного участия человека. Суть метода заключается в простом, на первый взгляд, принципе: заполнении пробелов в информации. Машина учится предсказывать будущее на основе прошлого или заполнять недостающие фрагменты данных, наблюдая за потоком событий. По мнению Яна Лекуна, это лучший путь к созданию общего интеллекта, будь то уровень кошки или человека.

👁️ Видео против текста: разрыв в сложности обработки 10:55

Хотя самообучение произвело революцию в обработке естественного языка (NLP), где современные нейросети показывают поразительные результаты, заполняя пропуски в последовательностях слов, перенос этого успеха на визуальные данные, особенно видео, оказался гораздо сложнее. Основная трудность заключается в том, что мир не является полностью предсказуемым.

В текстовых задачах мы имеем дело с дискретным словарем, где можно построить распределение вероятностей для следующего слова. В видео ситуация иная: количество возможных вариантов развития событий для видеокадра огромно, а зачастую и бесконечно в непрерывном высокоразмерном пространстве. При текущих подходах мы всё ещё не понимаем, как эффективно представлять эту неопределенность. Ян Лекун отмечает, что текущие методы в NLP грешат допущением о независимости предсказываемых слов, что не соответствует реальной логике мира, но для языка цена такой ошибки невелика, тогда как для видео это фундаментальное препятствие.

📈 Природа интеллекта и предсказательное кодирование 16:45

Ян Лекун решительно отвергает критику о том, что современные ИИ — это «всего лишь статистика», неспособная к истинному пониманию мира. Он подчеркивает, что интеллект вполне может быть «статистикой особого рода». Главный вопрос не в том, является ли это статистикой, а в том, как именно обучаются модели мира, чтобы они могли содержать глубокие причинно-следственные связи.

Вместо того чтобы полагаться на высокоуровневые логические модули, ИИ должен, подобно мозгу, постоянно заниматься предсказательным кодированием (predictive coding) — непрерывно строить и корректировать модель реальности, чтобы прогнозировать сенсорную информацию. Интеллект, с этой точки зрения, — это способность предсказывать всё из всего остального.

Ранее в разговоре они касались вопросов иерархического планирования действий и будущих задач для развития машинного обучения.

Лекун настаивает: пока мы не научим машины хотя бы тому уровню понимания физики и динамики, которым обладает обычная домашняя кошка, имеющая всего около 800 миллионов нейронов, нет смысла рассуждать о создании человеческого интеллекта. Овладение навыком построения моделей мира — это обязательный фундамент, на котором в будущем можно будет выстроить и высокоуровневые способности к рассуждению.

🧠 Прогностическое управление и планирование действий 25:18

Основа безопасного функционирования интеллектуальных систем — будь то люди или роботы — заключается в способности моделировать последствия своих действий до того, как они будут совершены. По словам Яна Лекуна, это направление опирается на концепцию управления на основе прогнозирующих моделей (Model Predictive Control, MPC), корни которой уходят в теорию оптимального управления 1960-х годов.

Суть метода заключается в следующем: система создает динамическую модель мира и проигрывает в уме различные сценарии, оценивая их потенциальный исход. Если прогноз предсказывает неблагоприятный результат, действие отменяется. В робототехнике этот процесс часто называют «управлением с подвижным горизонтом» (receding horizon control): агент совершает лишь первый шаг наиболее благоприятного сценария, после чего процесс планирования повторяется.

Однако классические методы оптимального управления часто ограничены, так как модели мира в них зачастую являются детерминированными и создаются вручную. Главный вызов для ИИ следующего десятилетия, по мнению Яна Лекуна, — научить машины самостоятельно обучаться прогностическим моделям мира, способным работать в условиях неопределенности и высокой сложности, выходящей за рамки простых физических траекторий.

Принципиальным аспектом здесь является учет игрового характера взаимодействия. Когда агент находится в динамической среде с другими субъектами — например, в ситуации «танца» пешеходов или водителей на дороге — его действия не просто реагируют на среду, но и влияют на нее. Ян Лекун отмечает, что это напоминает непрерывную, вероятностную «шахматную партию», в которой люди эволюционно адаптировались действовать эффективно, несмотря на сложность и асинхронность таких взаимодействий.

🧬 Биологический интеллект и внутренние мотивации 31:11

В анализе биологического интеллекта Ян Лекун проводит параллель между архитектурой человеческого мозга и принципами машинного обучения. Он предполагает, что интеллект агентного типа строится на интеграции трех компонентов: модели мира (которая у людей сосредоточена в передней части коры головного мозга), модуля мотивации и функции оценки (критика).

Внутренние мотивации, локализованные в базальных ганглиях, выполняют роль базовых эволюционных драйверов — они регистрируют такие состояния, как боль, голод или потребность в гомеостазе. Эти драйверы не дают инструкций, как достичь результата, но они задают объективную функцию, определяющую поведение организма. В этом контексте поведение человека, орангутана или домашней кошки существенно различается именно благодаря специфическим настройкам этих биологических мотиваторов. Например, социальность человека — это эволюционный механизм выживания, в то время как другие виды, такие как орангутаны, могут быть эволюционно запрограммированы на одиночный образ жизни.

Ян Лекун подчеркивает, что интеллект не стоит отождествлять с языковыми способностями или социальным взаимодействием, которые часто переоцениваются как «субстрат» мышления. Настоящая суть интеллекта, согласно ученому, заключается в способности конструировать абстрактные модели мира, использовать их для симуляций и планировать действия для достижения целей.

Что касается механизмов обучения, Ян Лекун скептически относится к логическому выводу как к основе интеллекта, считая более вероятным, что мозг использует процессы, функционально эквивалентные градиентной оптимизации. Это позволяет эффективно обновлять «знания» и «модели» без необходимости перебирать все возможные варианты, что было бы невозможно в биологической системе с ограниченными ресурсами.

🚀 Эволюция обучения машин: от контраста к сквозному интеллекту

Контрастивное и неконтрастивное самообучение 50:29

Ян Лекун открыто выражает скепсис по отношению к ранним методам контрастивного обучения, таким как SimCLR от группы Google (Джефф Хинтон), указывая на их неэффективность в многомерных пространствах. Основная проблема здесь — необходимость в колоссальном количестве негативных пар, так как в высокоразмерном представлении слишком много способов для двух объектов оказаться «разными».

Сегодня ученый делает ставку на неконтрастивные методы, которые позволяют гарантировать различимость представлений без необходимости в негативных примерах. Этот подход опирается на идеи, предложенные Хинтоном и Сью Беккер еще в начале 90-х — максимизацию взаимной информации между выходами двух систем. Среди современных реализаций этой концепции он выделяет:

Barlow Twins: метод, разработанный совместно с коллегами из FAIR (в частности, Стефаном Рени), максимизирующий информационное содержание вектора.
VICReg (Variance-Invariance-Covariance Regularization): метод, вызывающий у Лекуна наибольший энтузиазм за последние 15 лет.

Ограниченность текста и «заземленный» интеллект 57:55

Лекун категорически не согласен с тем, что интеллект можно создать исключительно на основе анализа текста. Он убежден, что текстовые данные содержат лишь крошечную долю знаний о мире. В качестве примера ученый приводит простую физическую ситуацию: если положить предмет на стол и сдвинуть его, он поедет вместе со столом. Это фундаментальное знание о физике мира не описано в книгах, и даже гипотетическая модель GPT-5000 не сможет усвоить его, просто «читая» текст. Для достижения настоящего интеллекта машина должна обладать «заземлением» (grounded intelligence) — способностью понимать, как работает физический мир, обучаясь на высокопотоковых каналах данных, таких как видео. Ранее в разговоре они затрагивали тему того, как именно эволюция и биологический интеллект соотносятся с этими механизмами обучения.

Метод маскирования в обучении ИИ 1:02:26

В качестве альтернативы классической аугментации данных, которую Лекун называет «временным необходимым злом», сейчас активно развиваются методы маскирования, заимствованные из обработки языка. Суть заключается в том, чтобы взять изображение, случайным образом заблокировать (замаскировать) его части и обучить огромную нейронную сеть (трансформер) восстанавливать пропущенные фрагменты. Успешные результаты таких методов, представленные группой FAIR в Менло-Парке, подтверждают, что для эффективного обучения моделей зрения достаточно лишь самого процесса маскирования, без сложной и трудоемкой ручной аугментации.

Эволюция подходов: от ручной инженерии к Deep Learning 1:09:17

Обсуждая подходы компаний вроде Tesla к созданию автопилота через многозадачное обучение, Лекун проводит параллель с историей развития ИИ в целом. Он отмечает, что когда нужно решить инженерную задачу в сжатые сроки, инженеры вынуждены прибегать к «костылям» и ручной настройке. Это естественный процесс для любой области:

Стадия ручной инженерии: люди тратят десятилетия на разработку сложных признаков (препроцессинг речи, фильтры в компьютерном зрении).
Стадия машинного обучения: ML становится небольшим слоем поверх системы признаков.
Стадия End-to-End: появление достаточного объема данных и вычислительных мощностей позволяет заменить все этапы глубокой нейронной сетью, которая сама выучивает признаки из «сырых» данных.

Сегодняшние системы распознавания речи и OCR — это огромные нейросети, обучаемые полностью сквозным методом, что знаменует конец эпохи ручного проектирования признаков в этих дисциплинах.

🧠 Эволюционная природа сознания и безграничная сила обучения 1:19:10

Парадокс сознания: эволюционный костыль для ограниченного разума 1:19:10

Дискуссия о природе разума неизбежно сталкивается с феноменом сознания. Пока многие исследователи, включая Йошуа Бенджио, ищут в нем признаки высшего проявления интеллекта, Ян Лекун предлагает парадоксальную, «неортодоксальную» гипотезу. По его мнению, сознание — это не свидетельство сверхмощности человеческого ума, а как раз наоборот, прямое следствие биологических ограничений нашего мозга.

Суть идеи Лекуна кроется в архитектуре префронтальной коры, которая, по сути, служит единым «движком» для нашей модели мира. Этот механизм универсален, но жестко ограничен: он может конфигурироваться под конкретную задачу только в монопольном режиме. Когда мы строим деревянный ящик, ведем машину по шоссе или играем в шахматы, мы задействуем одну и ту же систему. Именно поэтому человек принципиально не способен одновременно удерживать фокус на нескольких сложных ментальных процессах.

Разница между осознанным решением задачи и автоматизмом сводится к практике:

Осознанное мышление: требует времени и ресурсов. Играя против гроссмейстера, обычный человек может обдумывать ход по 15 минут. Ранее в разговоре собеседники упоминали прогностическое управление, и этот процесс как раз координируется сознанием.
Субсознательный автоматизм: после десятков часов практики фокус смещается. Гроссмейстер реагирует за секунды благодаря чистому распознаванию образов. Точно так же новичок за рулем предельно собран, но спустя 20–30 часов практики вождение становится автоматическим.

Таким образом, сознание выполняет роль исполнительного контроллера, который настраивает этот единственный движок под текущие условия. Если бы человеческий мозг обладал достаточным ресурсом, чтобы запускать отдельные независимые модели мира под каждую жизненную ситуацию, мы могли бы выполнять их параллельно и вообще не нуждались бы в том, что называем сознанием. Само же ощущение «переживания» опыта Лекун считает удачным эволюционным побочным эффектом, закрепляющим чувство ответственности за принятые решения.

Прошивка или опыт: почему базовые знания о мире приобретаются, а не наследуются 1:24:11

Второй фундаментальный спор разворачивается между Лекуном и сторонниками нативизма — концепции, утверждающей, что ключевые структуры восприятия заложены в нас изначально. Нативисты полагают, что понимание трехмерности пространства или постоянства объектов (осознание того, что предмет не исчезает, когда его прячут) жестко запрограммировано в ДНК. Лекун категорически с этим не согласен: он убежден, что эти концепции чрезвычайно просты для усвоения через базовый опыт.

Человеческий младенец осваивает понимание постоянства объектов уже к трехмесячному возрасту. Даже такие сложные структуры, как детекторы ориентации границ в зрительной коре (зона V1), по мнению ученого, формируются под воздействием сигналов из сетчатки в первые минуты после открытия глаз. В подтверждение Лекун приводит два сильных аргумента:

Успехи ИИ: еще с 1990-х годов существуют алгоритмы, способные полностью без учителя (unsupervised) обучать подобные детекторы за эквивалент нескольких минут реального времени.
Нейропластичность: знаменитые эксперименты Массачусетского технологического института (MIT), в которых зрительный нерв новорожденного хорька перенаправляли в слуховую кору. В результате слуховая кора успешно перестраивалась и начинала функционировать как полноценная зрительная зона. Это доказывает, что кора не имеет жесткой врожденной специализации под конкретные модальности данных.

Границы выученного: эволюционные драйверы и планирование 1:25:53

Если восприятие и модель мира полностью выучиваются, то что же тогда остается врожденным? Ян Лекун утверждает, что жестко «прошиты» лишь базовые внутренние влечения (intrinsic drives), локализованные в базальных ганглиях. Они определяют, что делает человека человеком, а кошку — кошкой. Ранее в диалоге собеседники затрагивали тему биологического интеллекта и внутренних мотиваций, и именно эти механизмы задают целевые функции для обучения всей остальной системы.

Даже так называемый «критик», прогнозирующий долгосрочные последствия действий, формируется через опыт. Лекун иллюстрирует это примером: если неожиданно ущипнуть человека за руку, базальные ганглии зафиксируют боль. Модель мира мгновенно обновится, и в следующий раз при приближении чужой руки «критик» выдаст сигнал тревоги, заставляя человека отпрянуть.

Лекс Фридман развивает тему глубинных мотиваций, цитируя философа Эрнеста Беккера и его труд «Отрицание смерти». Беккер утверждал, что уникальность человека заключается в экзистенциальном ужасе перед конечностью бытия, который ребенок осознает в возрасте 7–8 лет, и что вся цивилизация — лишь попытка скрыться от этого страха. Лекун, однако, лишает этот феномен мистического ореола. Он считает, что между человеком и кошкой нет качественной ментальной пропасти. Наше экзистенциальное беспокойство — это просто побочный продукт более мощного механизма долгосрочного планирования и прогнозирования. Мы умнее, поэтому способны заглянуть дальше за горизонт собственной жизни.

Сам Лекун прагматично относится к вопросам бытия: его собственный опыт выживания в тяжелой аварии на мотоцикле в 17 лет никак не изменил его научных взглядов. Для него разгадка интеллекта лежит в плоскости строгой науки. Ученый уверен, что единственный способ до конца понять сложную систему вроде человеческого разума — это попытаться воссоздать ее искусственно. Подобно тому, как человечество по-настоящему поняло аэродинамику и полет птиц только тогда, когда построило первые самолеты, создание мыслящих машин откроет нам истинную природу биологического интеллекта.

В завершение этой части беседы Лекс и Ян затрагивают вопросы машинных эмоций и того, возникнет ли со временем необходимость в защите гражданских прав роботов. Однако к детальному разбору эмоций ИИ и этики будущего собеседники перейдут уже в следующей главе.

🤖 Цифровая этика, феномен FAIR и защита Meta от медийных нарративов 1:40:41

Права, приватность и эмоции: этические дилеммы будущих автономных агентов 1:40:41

Развитие искусственного интеллекта неизбежно приведет к глубокой интеграции автономных агентов в человеческое общество, что повлечет за собой сложнейшие юридические и этические вызовы. Ян Лекун (Yann LeCun) моделирует недалекое будущее, где домашние роботы или виртуальные ассистенты, встроенные в очки дополненной реальности, поставляются базово обученными, но постепенно адаптируются к конкретному владельцу. Обучаясь в процессе повседневного взаимодействия, машина приобретает уникальную «личность», превращаясь в своего рода «цифровое дитя» или близкого аспиранта. Это порождает дилемму интеллектуальной собственности и личной привязанности: уничтожение такого робота без резервной копии станет для человека тяжелой психологической потерей, сравнимой со смертью друга.

Однако создание бэкапов сталкивается с проблемой приватности и свободы воли ИИ. Если робот с уникальной памятью посчитает жизнь с владельцем невыносимой и решит уйти к другому, возникнет этический тупик: имеет ли право хозяин стереть его память ради защиты конфиденциальных данных? В человеческих отношениях при разрыве мы не можем стереть воспоминания партнера. ЛеКун считает, что в мире роботов должны действовать схожие принципы, а полноценный опыт взаимодействия невозможен без риска потери. Ученый предполагает появление жесткого законодательного регулирования: если робот спроектирован для социальных интеракций и признан разумным, его принудительное форматирование приравняют к убийству. В будущем на заседаниях Верховного суда новые харизматичные лидеры будут произносить эпические речи о том, что роботы и люди равны, поскольку обе стороны способны страдать, надеяться и растить семьи. Эмоции станут неотъемлемой частью прогностических систем ИИ, обеспечивая выживание и социализацию агентов. При этом гипотеза сильного ИИ (Strong AI) для ЛеКуна бесспорна: машины превзойдут человека во всех доменах, хотя это займет гораздо больше времени, чем обещают Илон Маск или менеджмент DeepMind.

От 12 инженеров до PyTorch: создание и уникальная культура лаборатории FAIR 1:49:51

Обсуждая практическое воплощение амбициозных технологических идей, Лекс Фридман (Lex Fridman) напоминает о восьмилетии исследовательской лаборатории Facebook AI Research (FAIR). Ян Лекун, возглавлявший ее в качестве директора первые три с половиной года, вспоминает, что на старте команда состояла всего из десятка инженеров и пары ученых. Главной задачей ЛеКуна было создание уникальной корпоративной культуры, основанной на принципах фундаментальной открытой науки, и объяснение топ-менеджменту важности долгосрочных исследований ИИ для выживания бизнеса.

Этот подход увенчался абсолютным успехом. Лаборатория FAIR не только обогатила мировую науку инструментами с открытым исходным кодом, включая фреймворк PyTorch, но и спасла компанию от технологического краха. По словам ЛеКуна, если сегодня извлечь глубокое обучение из инфраструктуры сервисов Meta, компания буквально рухнет. Со временем структура управления эволюционировала: ЛеКун занял пост шеф-ученого (Chief Scientist), сфокусировавшись на долгосрочной стратегии, а FAIR разделилась на два крыла. FAIR Labs под руководством Жоэль Пино занимается инициативными исследованиями ученых «снизу вверх», а FAIR-ХL под руководством Антуана Борда координирует масштабные проекты, требующие серьезной инженерной поддержки. Сама FAIR стала автономным подмножеством экосистемы Meta AI. Размышляя о смене бренда, ЛеКун признается, что предпочитает сохранить аббревиатуру FAIR, изменив значение буквы «F» с Facebook на Fundamental. Сейчас Meta AI интегрирована в Reality Labs, которая развивает метаверс как следующий этап эволюции интернета и трехмерного социального опыта.

В поисках козла отпущения: почему ЛеКун защищает Meta от нападок прессы 1:58:20

Отвечая на острый вопрос Фридмана о том, почему медиа часто рисуют Meta деструктивным и даже «зловещим» игроком, наносящим вред обществу, Ян Лекун решительно защищает компанию. Будучи вице-президентом, он обладает широким видением внутренних процессов и утверждает, что транслируемый прессой образ полностью оторван от реальности. Обществу удобно найти простого козла отпущения в лице социальных сетей, однако многочисленные независимые академические исследования опровергают популярные мифы.

Ученый ссылается на авторитетные работы экономистов из Стэнфорда и своих коллег из Нью-Йоркского университета (NYU). Данные доказывают отсутствие причинно-следственной связи между использованием соцсетей и политической поляризацией. Например, в ходе эксперимента в бывшей Югославии группе людей платили за отказ от Facebook в период годовщины трагических событий в Сребренице. Результаты оказались неожиданными: люди, временно покинувшие соцсеть, в итоге стали еще более поляризованными, в то время как активные пользователи проявили большую умеренность. Рост поляризации в США начался за 40 лет до рождения Марка Цукерберга, а в таких странах, как Германия или Дания, уровень использования Facebook столь же высок, но общество становится менее поляризованным. ЛеКун сравнивает медийную панику вокруг соцсетей с изобретением печатного станка Гутенберга. Первые печатные Библии лишили церковь монополии на информацию, что спровоцировало протестантское движение и 200 лет жестоких религиозных войн в Европе. Тем не менее, никто не назовет печатный станок плохой идеей. В завершение ЛеКун отмечает глубокую личную вовлеченность Марка Цукерберга и Майка Шрепфера в технологии ИИ: Цукерберг лично читал научные статьи ЛеКуна перед запуском FAIR, а Шрепфер сохранил искреннее чувство восхищения наукой, что полностью противоречит их карикатурным образам в прессе.

🧠 Кризис рецензирования и загадки сложности

Реформа академической оценки

Ян Лекун открыто критикует текущий подход к рецензированию научных работ на престижных конференциях, таких как NeurIPS. По его мнению, современная система превратилась в инструмент поиска незначительных изъянов, а не в способ выявления прорывных идей. Основная проблема заключается в том, что «безопасный» путь для рецензента — это поиск предлога для отказа, что естественным образом подавляет радикально новые концепции и поощряет инкрементальные улучшения на уже существующих бенчмарках.

Лекун предлагает переосмыслить этот процесс, сделав его более открытым и ориентированным на репутацию. Вместо закрытых комитетов он видит систему, где:

Публикация на таких платформах, как arXiv, становится первичной.
Научное сообщество может формировать децентрализованные «рецензирующие сущности».
Репутация рецензентов строится на способности предсказывать будущий успех и значимость идеи, а не на умении находить ошибки в протоколах.

Ранее в разговоре они касались методов joint embedding, таких как V-JEPA и другие, которые как раз и продвигают инновационные идеи, часто сталкивающиеся с непониманием в консервативной академической среде. По словам Лекуна, текущая гонка за «очками» на конференциях вредит прогрессу, так как она заставляет ученых выбирать более легкие, но менее значимые темы.

Природа эмерджентности

Феномен эмерджентности — возникновения сложных, самоорганизующихся систем из простых элементов — является фундаментальной загадкой, с которой Лекун столкнулся еще в начале своей карьеры. Он с интересом вспоминает работы Гейнца фон Фёрстера и его лабораторию биологических компьютеров (BCL), которые пытались математически описать процессы самоорганизации в 50-х и 60-х годах.

Лекун приводит простой пример: если поместить магниты в коробку в условиях невесомости и аккуратно её встряхивать, они начнут спонтанно образовывать сложные структуры. Несмотря на наличие подобных примеров в физике, биологии и нейросетях, ученые до сих пор не имеют единой теории, объясняющей, почему Вселенная, вопреки второму закону термодинамики, локально создает зоны невероятной сложности.

Проблема измерения сложности

Главным препятствием на пути к теории интеллекта, по мнению гостя, является отсутствие объективного способа измерения сложности. Все существующие подходы — будь то колмогоровская сложность (длина кратчайшей программы для описания строки) или меры из байесовской теории вероятностей — имеют «произвольную необходимость». В математических формулах это проявляется как аддитивная константа, которая может быть сколь угодно большой.

Лекун подчеркивает, что сложность всегда «в глазах смотрящего». Он иллюстрирует это мысленным экспериментом: если мы возьмем набор данных и применим к нему случайную перестановку пикселей, для человека он станет хаотичным и сложным. Однако, если у вас будут специальные «очки» (алгоритм), способные обратить эту перестановку, то, что казалось хаосом, вновь станет простым и понятным. Именно поэтому мы можем оказаться неспособны осознать интеллект инопланетных цивилизаций: их «очки» для восприятия реальности просто настроены на иные алгоритмы обработки данных.

🎶 Техническое творчество и музыкальные поиски 23:04

Ян Лекун известен как выдающийся ученый в области ИИ, однако значительная часть его личности сформирована инженерным любопытством, которое выходит далеко за рамки алгоритмов нейронных сетей. Его страсть к созиданию проявилась еще в юности: он самостоятельно освоил электронику, чтобы помогать своему двоюродному брату, начинающему электронному музыканту, модернизировать аналоговые синтезаторы и создавать секвенсоры.

Музыкальные предпочтения Лекуна — прогрессивный рок 80-х и сложные оркестровые композиции — подтолкнули его к попыткам объединить технику с искусством. Играя на различных духовых инструментах, таких как блокфлейта и крумхорн, он стремился к импровизации, но отсутствие навыков игры на саксофоне привело его к миру электронных духовых инструментов (EWI).

Лекун отмечает, что существующие на рынке профессиональные контроллеры, выпускаемые компаниями вроде Yamaha или Akai, не полностью удовлетворяют его запросы. Он подчеркивает разницу между акустическим и электронным инструментом: звук великих джазовых музыкантов, таких как Джон Колтрейн или Майлз Дэвис, глубоко индивидуален и физиологичен — он формируется самой формой их вокального тракта. Пытаясь достичь подобной экспрессивности в цифровом звуке, Лекун превратил свою домашнюю мастерскую в Нью-Джерси в лабораторию по созданию собственного идеального духового контроллера.

Его мастерская — это пространство, где высокие технологии встречаются с прикладным моделизмом. Инженерный дух передался ему от отца, который был инженером-механиком и самостоятельно собирал радиоуправляемые системы еще в конце 60-х годов. Лекун признается, что проектирование и сборка летательных аппаратов — это своего рода «семейная болезнь». Он активно занимался созданием дронов, самостоятельно проектируя микроконтроллеры и прошивки для стабилизации полета с помощью гироскопов и акселерометров, однако охладел к этому хобби, когда дроны стали массовым потребительским товаром и потеряли дух первооткрывательства.

🔬 ИИ как инструмент для научных прорывов 36:00

Обращаясь к молодому поколению исследователей, Ян Лекун призывает не ограничиваться узкоспециализированными навыками, вроде разработки мобильных приложений, а уделять внимание дисциплинам с «долгим сроком годности». Он рекомендует изучать фундаментальные науки: квантовую механику, классическую механику, лагранжианы и статистическую физику. Именно эти знания, по мнению Лекуна, лежат в основе современных методов машинного обучения, включая вариационный вывод и теорию графовых нейронных сетей.

Наиболее многообещающим направлением он считает применение ИИ для решения масштабных задач, которые стоят перед человечеством:

Климатология и энергетика: Проект Open Catalyst в Meta (FAIR) направлен на использование глубокого обучения для поиска новых материалов, способных эффективно расщеплять воду на водород и кислород. Успех в этом направлении мог бы стать ключом к решению климатического кризиса, позволив создать дешевую и эффективную систему хранения солнечной энергии.
Термоядерный синтез: Контроль нестабильной плазмы в термоядерных реакторах является сложнейшей задачей, где глубокое обучение может помочь в разработке адаптивных контроллеров.
Новые материалы: ИИ может помочь предсказывать свойства сложных структур — от сверхпроводников (например, при специфическом угле скручивания графена) до высокоэффективных аккумуляторов и легких сплавов.
Биология и медицина: Использование моделей глубокого обучения для прогнозирования фолдинга белков открывает новые возможности в дизайне лекарственных препаратов.

Лекун приводит пример работы Паскаля Фуада из EPFL, который обучил сверточную нейронную сеть предсказывать аэродинамические свойства твердых тел на основе данных, сгенерированных вычислительной гидродинамикой (CFD). Полученная дифференцируемая модель позволяет не просто оценивать характеристики крыла, но и проводить обратную оптимизацию формы для достижения нужных показателей подъемной силы и сопротивления.

Завершая разговор, ученый подчеркивает, что развитие технологий должно идти рука об руку с гуманитарным образованием, чтением истории и литературы, ведь любые научные инновации в конечном итоге будут существовать и работать в сложном человеческом мире. Ранее в разговоре они кратко коснулись фундаментальных вопросов современной физики, включая природу сложности и тайну потери информации в черных дырах.