Андрей Карпатый: ИИ как инопланетный артефакт и конец биологии

Lex Fridman 3,9 млн 3 ч 28 мин 28 мин 29.10.2022
Главное

Общение с помощью голосовых связок — это «унизительно медленный» процесс, который неизбежно уступит место скоростным цифровым формам жизни. Нейросети сегодня — не копия мозга, а «инопланетные артефакты», способные изучить физику мира, просто предсказывая следующее слово в тексте. Путь к сверхразуму превращает биологическое старение в исправимую инженерную ошибку, а человека — в архитектора, управляющего флотом автономных агентов.

🧠 Математическая абстракция мозга и парадокс молчания Вселенной 0:00

Разговор Лекса Фридмана с Андреем Карпатым начинается с попытки демистифицировать одну из самых обсуждаемых технологий современности. Несмотря на то что термин «нейронная сеть» отсылает нас к биологии, Андрей Карпатый предлагает смотреть на них через призму математики и инженерного прагматизма. По его мнению, на фундаментальном уровне нейросеть — это не «цифровой мозг», а последовательность простых математических операций, в частности, умножения матриц .

Нейросети как «миллионы ручек» и инопланетные артефакты 0:58

Андрей Карпатый описывает архитектуру современных нейросетей как огромный набор «ручек» или параметров (knobs), которые необходимо вращать до тех пор, пока система не начнет выдавать желаемый результат, будь то классификация изображений или генерация текста . Это процесс оптимизации, который, несмотря на свою математическую простоту, при масштабировании порождает нечто, напоминающее искусство. Карпатый сравнивает это с музыкой: по отдельности ноты — это просто звуковые колебания, но собранные в сложную структуру, они вызывают у нас глубокие эмоции .

В ходе беседы Лекс Фридман задает вопрос о том, насколько работа нейросетей схожа с человеческим мышлением. Карпатый признает, что когда он отвечает на вопросы, его мозг в каком-то смысле тоже занимается предсказанием следующего слова, опираясь на внутренние структуры памяти и накопленный опыт . Однако он предостерегает от чрезмерных биологических аналогий. По его словам, современные искусственные нейросети — это, скорее, «сложные инопланетные артефакты» (complicated alien artifacts) .

Основное различие кроется в процессах оптимизации:

Карпатый отмечает, что биология достигла невероятных успехов — от одной клетки до сложного организма с руками и ногами , но процесс возникновения интеллекта человеческого уровня кажется ему странным и аномально быстрым в масштабах истории Земли . Ранее в разговоре они кратко коснулись идеи универсальности вычислений, но Андрей подчеркивает, что именно разница в «целевой функции» делает ИИ чем-то принципиально отличным от нас.

Парадокс Ферми: почему мы не видим следов иных цивилизаций? 11:36

Размышления о сложности возникновения интеллекта логично приводят собеседников к вопросу о месте человечества во Вселенной. Если жизнь на Земле возникла относительно быстро после формирования планеты, то почему мы до сих пор не встретили инопланетный разум? . Карпатый признается, что часто размышляет над парадоксом Ферми и ищет ответы в трудах биолога Ника Лейна, автора книги «Жизненный вопрос» (The Vital Question) .

Ник Лейн подробно описывает возникновение жизни в щелочных гидротермальных источниках, и этот процесс кажется почти неизбежным при наличии подходящей химии . Однако «бутылочное горлышко» может находиться на этапе перехода от простых одноклеточных к сложным эукариотам. Андрей предполагает, что именно этот скачок может быть той самой «Великой засухой» или редчайшим событием, которое разделяет безжизненные миры и цивилизации .

Существует несколько гипотез, которые Карпатый и Фридман обсуждают, пытаясь объяснить молчание космоса:

  1. Трудности межзвездных путешествий: Космос — чрезвычайно агрессивная среда. Радиация и космическая пыль делают полеты между звездами невероятно сложной инженерной задачей .
  2. Эстетическая ценность: Карпатый предполагает, что развитые цивилизации могут не уничтожать другие миры просто потому, что ценят сложные динамические системы, на развитие которых ушли миллиарды лет .
  3. Мы слишком примитивны: Возможно, инопланетный разум настолько превосходит наш, что мы просто не в состоянии распознать их присутствие или сигналы .

Андрей вспоминает цитату из «Автостопом по галактике» о том, что описание Земли в галактической энциклопедии сводилось к фразе «в основном безвредна» . Он считает, что жизнь — это естественное следствие развития химически разнообразной среды . При этом текущий способ общения людей — использование голосовых связок для передачи данных со скоростью несколько слов в секунду — кажется ему «унизительно медленным» . С его точки зрения, цифровой интеллект является следующим логическим этапом эволюции, который позволит преодолеть биологические ограничения и, возможно, наконец-то решить загадку нашего одиночества во Вселенной .

🌌 Взлом Вселенной и магия Трансформеров 25:04

Вторая часть беседы переходит от обсуждения биологических основ интеллекта к фундаментальным вопросам устройства реальности и архитектуре, которая перевернула мир ИИ. Андрей Карпатый (Andrej Karpathy) делится своим видением Вселенной как вычислительного процесса и объясняет, почему Трансформеры стали чем-то гораздо большим, чем просто очередным алгоритмом для перевода текстов.

Ошибки округления в коде реальности 27:51

Размышляя о масштабах космоса, Лекс Фридман (Lex Fridman) и Карпатый приходят к метафоре «Вселенной-фейерверка» . В этой концепции мы живем внутри кратковременной вспышки огромной сложности, которая может оказаться своего рода тестом Тьюринга для цивилизаций: способна ли разумная жизнь осознать, что она является частью единого сообщения или пазла .

Однако наиболее захватывающая идея Карпатого касается «эксплойтов» (взломов) физического мира. Опираясь на свой опыт в обучении с подкреплением (Reinforcement Learning), Андрей проводит параллель между поведением ИИ-агентов и законами физики:

Карпатый признается, что ему ближе детерминистическая картина мира . Он склонен считать, что кажущаяся случайность квантовых событий — лишь следствие нашего ограниченного восприятия многомерной реальности, где выбор уже сделан, а мы лишь создаем нарратив о нем постфактум .

Трансформер как универсальный дифференцируемый компьютер 33:52

Когда речь заходит о самой красивой идее в современном ИИ, Андрей без колебаний называет архитектуру Трансформеров. Появившись в 2017 году в статье «Attention is All You Need» , эта структура оказалась неожиданно эффективной не только для текста, но и для любых данных: видео, аудио или команд управления роботами .

Карпатый описывает Трансформер как «универсальный, высокопроизводительный и эффективный компьютер» . Его ключевые преимущества:

  1. Масштабируемость: Архитектура идеально ложится на архитектуру современных графических процессоров (GPU), позволяя проводить вычисления параллельно .
  2. Гибкость обмена данными: В отличие от старых сетей, здесь каждый «узел» (токен) может смотреть на любой другой узел, самостоятельно определяя, какая информация важна для решения задачи .
  3. Глубокая оптимизация: Благодаря остаточным связям (residual connections), градиенты при обучении проходят сквозь сотни слоев без затухания, позволяя сети обучаться экспоненциально сложным зависимостям .

Software 2.0: когда нейросеть пишет код за нас 39:23

Карпатый развивает мысль о том, что мы переходим к новой парадигме программирования. Если классическое ПО (Software 1.0) пишется человеком на языках вроде C++, то Software 2.0 — это код, написанный в виде весов нейронной сети .

В этой модели каждый блок Трансформера можно рассматривать как строку кода в функции Python . Если у вас есть модель из 100 блоков, это эквивалентно программе из 100 строк. Разница в том, что эти «строки» не пишутся вручную — они оптимизируются в процессе обучения на огромных массивах данных .

Такой подход приводит к возникновению эмерджентных свойств. Обучая модель просто предсказывать следующее слово, мы заставляем её де-факто выстраивать внутреннюю модель мира . Чтобы точно угадать следующее слово в тексте о квантовой физике или юридическом споре, нейросеть обязана «понять» логику этих областей . Андрей подчеркивает, что интернет — это не просто склад текстов, а сжатая проекция всего человеческого опыта, и обучение на нем неизбежно ведет к созданию мощного интеллекта .

В завершение раздела Карпатый упоминает концепцию «универсального интерфейса» в цифровой среде . Хотя ранее он работал над проектами вроде World of Bits (о которых речь пойдет позже), его текущее видение заключается в том, что ИИ должен пройти путь от простого наблюдателя к активному участнику, способному взаимодействовать с миром так же свободно, как это делает человек через экран компьютера и клавиатуру .

🖱️ Интерфейсы будущего и кризис идентичности

Проект World of Bits: ИИ за клавиатурой и мышью 50:25

Одной из амбициозных задач, над которыми работал Андрей Карпатый в составе OpenAI, был проект World of Bits. Его суть заключалась в том, чтобы обучить искусственный интеллект взаимодействовать с компьютером так же, как это делает человек: не через программные интерфейсы (API), а через универсальные средства ввода — клавиатуру и мышь .

Изначально этот подход сталкивался с огромными трудностями. При использовании стандартного обучения с подкреплением (Reinforcement Learning) агент оказывался в ситуации, где пространство возможных действий было слишком огромным, а сигнал вознаграждения — слишком редким . ИИ буквально «спотыкался», пытаясь понять, что нажатие на определённый пиксель на экране может привести к выполнению задачи, например, бронированию билета.

Ситуация в корне изменилась с появлением больших языковых моделей. Как отмечает Андрей Карпатый, современные системы, такие как GPT, уже «понимают» мир интернета, так как они обучались на колоссальных массивах текстов из сети . Модель заранее знает, что такое кнопка «Отправить» или форма регистрации. Это делает задачу управления браузером решаемой: ИИ не нужно гадать, он понимает семантику интерфейса . По мнению исследователя, в будущем мы перейдем от написания узкоспециализированного кода для каждой задачи к созданию универсальных агентов, которые смогут выполнить любое поручение в цифровой среде, просто «глядя» на экран и взаимодействуя с ним человеческим способом .

Цифровые двойники и проблема доказательства личности 52:11

С развитием способностей ИИ управлять социальными интерфейсами возникает экзистенциальная угроза для цифрового общества — засилье ботов. Лекс Фридман и Андрей Карпатый подробно обсуждают проблему «крипто-ботов» и автоматизированных аккаунтов, которые становятся всё более неотличимыми от реальных людей .

Андрей Карпатый выражает серьёзную обеспокоенность миром, в котором синтетические существа делят с нами цифровое пространство. Он подчеркивает несколько ключевых аспектов этой проблемы:

В качестве решения Андрей Карпатый видит неизбежный переход к использованию цифровых подписей и криптографических доказательств личности . Мы движемся к миру, где «человеческая природа» аккаунта должна быть подтверждена технологически, иначе доверие в цифровой среде окончательно исчезнет. При этом он отмечает, что сейчас мы находимся в «худшем периоде» этой трансформации, когда старые методы защиты (вроде простых капч) уже не работают, а новые стандарты идентификации ещё не внедрены повсеместно .

Экономика внимания и ИИ-компаньоны 1:00:22

Обсуждая влияние ИИ на общество, Лекс Фридман поднимает вопрос о «дилемме алгоритмов». Если целевой функцией системы является максимизация вовлеченности, ИИ неизбежно научится эксплуатировать человеческие слабости . Модели могут обнаружить, что люди острее реагируют на драму, конфликты и подозрения, что приведет к созданию «гигантского шторма из негатива» в социальных сетях, управляемого алгоритмами .

Тем не менее, Андрей Карпатый видит и светлую сторону. ИИ-системы могут стать персональными компаньонами, помогающими человеку расти и развиваться. Уже сегодня языковые модели могут выступать в роли «fake psychologist» (псевдо-психолога), поддерживая диалог и помогая структурировать мысли . Хотя у текущих моделей нет долгосрочной памяти или собственных целей, они способны виртуозно поддерживать заданный паттерн поведения .

В контексте поиска информации ИИ бросает вызов традиционным поисковым системам. Лекс Фридман замечает, что у таких гигантов, как Google, может отсутствовать мотивация к радикальным инновациям из-за зависимости от рекламной модели . В то же время ИИ предлагает новый уровень взаимодействия — вместо списка ссылок пользователь получает прямой ответ или выполненное действие через естественный язык .

Ранее в разговоре они касались темы Software 2.0, и Андрей Карпатый подчеркивает, что этот переход к нейросетевому программированию станет фундаментом для всех описанных выше изменений: от беспилотных автомобилей (подробно обсуждаемых в следующих главах) до персональных цифровых ассистентов, понимающих мир на человеческом уровне.

🧠 Движок данных и философия Илона Маска: как обучается автопилот Tesla 1:15:25

Переход от теоретических основ нейросетей к их практическому применению в реальном мире требует не только мощных вычислителей, но и принципиально иного подхода к работе с информацией. В этой части беседы Андрей Карпатый (Andrej Karpathy) раскрывает внутреннюю кухню разработки Tesla Autopilot, объясняя, как компания превратила процесс обучения ИИ в отлаженный промышленный конвейер и почему радикальные решения Илона Маска (Elon Musk) часто оказываются единственно верными.

«Биологический» цикл обучения: Движок данных (Data Engine) 1:23:57

Одним из ключевых факторов успеха Tesla Андрей Карпатый называет «Движок данных» (Data Engine) — итеративный процесс, который он описывает как нечто, имеющее «почти биологическое чувство» . В отличие от классического академического подхода, где датасет статичен, в Tesla обучение нейросетей — это непрерывный цикл совершенствования.

Когда система сталкивается с редким или сложным сценарием на дороге, который она не может уверенно интерпретировать, в дело вступает Data Engine. Процесс выглядит следующим образом:

  1. Поиск несовершенств: Инженеры выявляют ситуации, где нейросеть ошибается или работает неуверенно.
  2. Сбор данных: Из парка сотен тысяч автомобилей запрашиваются аналогичные примеры (например, изображения специфических дорожных конусов или сложных развязок).
  3. Аннотирование: Данные размечаются. Карпатый отмечает, что этот этап максимально перенесен в «оффлайн», где у суперкомпьютера есть бесконечное время на то, чтобы точно определить положение объектов в трехмерном пространстве .
  4. Дообучение: Обновленный набор данных используется для тренировки сети, после чего цикл повторяется.

Этот процесс позволяет «замыкать петлю» , превращая каждую ошибку автомобиля на дороге в урок для всей системы. Андрей подчеркивает, что задача инженера в такой парадигме смещается от написания кода к управлению потоками данных и приоритизации задач для QA-команд . Ранее в разговоре они касались того, что нейросети становятся своего рода «дифференцируемыми компьютерами», и Data Engine — это способ их программирования.

Отказ от радара: почему «лучшая деталь — это её отсутствие» 1:27:56

Одним из самых резонансных решений Tesla стал полный отказ от радаров в пользу системы Vision (только видеокамеры). Лекс Фридман (Lex Fridman) поднял вопрос о целесообразности этого шага, на что Карпатый дал развернутое инженерное обоснование.

Позиция Илона Маска базируется на принципе: «Лучшая деталь — это её отсутствие» (The best part is no part) . Андрей объясняет, что каждый дополнительный сенсор — это не только преимущество, но и огромные накладные расходы:

Карпатый утверждает, что зрение является «необходимым и достаточным» для вождения . Поскольку люди управляют машинами, используя только глаза (биологические камеры) и мозг (нейросеть), искусственный интеллект должен стремиться к тому же. Использование лидаров или высокоточных HD-карт он называет «костылем», который создает ложную уверенность и ограничивает масштабируемость системы до конкретных оцифрованных участков дорог .

Борьба с энтропией: уроки менеджмента от Илона Маска 1:34:26

Работа в Tesla под руководством Илона Маска дала Карпатому уникальный опыт управления сверхэффективными организациями. Главный враг любого крупного проекта, по его мнению, — это организационная энтропия .

Маск исповедует агрессивный подход к упрощению процессов. Он ненавидит совещания и бюрократию, считая, что в компании должен быть лидер с «большим молотом» . Без такого человека принятие решений превращается в бесконечные комитеты, демократию и согласования, что неизбежно приводит к замедлению и деградации продукта. Андрей вспоминает знаменитую фразу Илона: «Это не просто возможно, это необходимо» , которая задает тон всей разработке.

Основные принципы менеджмента Tesla, выделенные Карпатым:

Этот бескомпромиссный подход позволяет Tesla решать задачи, которые в других компаниях считаются невыполнимыми или требуют десятилетий разработки. Карпатый отмечает, что даже если некоторые вещи оказываются сложнее, чем ожидалось, сама установка на радикальную эффективность двигает индустрию вперед .

🤖 Смена вектора: уход из Tesla и рождение Optimus 1:44:33

Почему Андрей Карпатый покинул пост директора по ИИ

Одной из самых обсуждаемых новостей в мире технологий стал уход Андрея Карпатого из Tesla в 2022 году. В разговоре с Лексом Фридманом Андрей объясняет, что это решение не было спонтанным, а стало результатом долгого процесса «поиска себя» (soul searching) . За пять лет работы он прошел путь от создания отдела компьютерного зрения с нуля до управления огромной структурой, когда Tesla превратилась из компании, «смотрящей под ноги», в лидера индустрии с мощнейшими вычислительными кластерами и отлаженной организацией разметки данных .

Основной причиной ухода стало постепенное превращение исследователя в корпоративного менеджера. Андрей признается, что большая часть его времени стала уходить на встречи и управление процессами, в то время как его истинная страсть — это техническая работа, написание кода и преподавание. Несмотря на глубокую привязанность к команде, которую он искренне любит, Карпатый почувствовал необходимость смены темпа .

«Я хотел учиться новому и учить других. Мне показалось, что сейчас подходящее время для перемен», — отмечает он. При этом Андрей не исключает своего возвращения в компанию в будущем для «второго акта» . Ранее в разговоре они вскользь упоминали успех «Движка данных» (Data Engine), и Карпатый подчеркивает, что оставляет систему в автономном и работоспособном состоянии . Его уход — это не бегство от проблем, а стремление вернуться к истокам ИИ, возможно, сфокусировавшись на задачах уровня AGI вне рамок транспортной индустрии .

1:49:55

Tesla Optimus: Автопилот в теле человека

Концепция человекоподобного робота Optimus является логическим продолжением разработок Tesla в области беспилотного вождения. Андрей Карпатый убежден, что Tesla — одна из немногих компаний, способных реализовать этот амбициозный проект, поскольку у них уже есть ключевой компонент: «мозги» робота . Мир вокруг нас спроектирован людьми для людей — стулья, лестницы, автомобили и инструменты созданы под человеческую морфологию. Именно поэтому создание гуманоидного форм-фактора оправдано: такой робот сможет использовать всю существующую инфраструктуру .

Техническая синергия между автомобилем и роботом колоссальна:

Лекс Фридман добавляет, что проект Optimus решает важнейшую экономическую задачу — создание продукта, который приносит пользу и доход на каждом этапе разработки . В отличие от чистых исследовательских проектов, Optimus нацелен на выполнение реального физического труда, который можно монетизировать, обеспечивая команду необходимым «дофамином» от видимого успеха продукта .

2:01:25

Роль симуляций и вопрос «цифровой мудрости»

В завершение этого блока дискуссия касается ценности симуляций для обучения нейросетей. Отвечая на вопрос из Reddit, Андрей выражает скепсис относительно того, что симуляторы могут стать источником фундаментальной «мудрости» о реальности . Для него игра в видеоигры — это временный побег от реальности, а не способ познать мир.

Тем не менее, в инженерном смысле симуляции критически важны для отработки редких сценариев (edge cases), таких как аварийные ситуации или специфические погодные условия . Ключ к успеху здесь — сокращение разрыва между симуляцией и реальностью (sim-to-real gap), при котором нейросеть научится извлекать высокоуровневые структуры из синтетических данных, понимая при этом их отличия от настоящего физического мира . Это напоминает процесс обучения на датасетах типа ImageNet, который в свое время стал катализатором для всей индустрии, задав правильный уровень сложности и масштаб для проверки алгоритмов .

🧠 Личная продуктивность и будущее программирования в эпоху ИИ 2:05:28

Разговор Лекса Фридмана и Андрея Карпатого переходит от обсуждения архитектуры нейросетей к более прикладным вопросам: как человек, стоящий у истоков революции глубокого обучения, организует свой день, и как новые инструменты вроде GitHub Copilot меняют саму суть написания кода. Ранее в интервью они уже обсуждали концепцию Software 2.0, и теперь эти идеи находят отражение в повседневной практике программиста.

Глубокое погружение: психология продуктивности и «налог на контекст» 2:11:35

Для Андрея Карпатого продуктивность не сводится к заполнению календаря встречами. Напротив, его подход строится вокруг «глубокой работы» и способности разума полностью изолироваться от внешнего мира для решения сложной технической задачи. Андрей признается, что он убежденный «сононочник»: в период работы над диссертацией он ложился спать в 3 часа ночи , предпочитая тишину и отсутствие уведомлений, которые дарит глубокая ночь.

По мнению Карпатого, для достижения мастерства — тех самых условных «10 000 часов» — необходима не просто усидчивость, а определенная степень одержимости. Когда он работает над проектом, он думает о нем постоянно: в душе, во время еды, в любое свободное мгновение . Продуктивный день для него выглядит не как серия коротких спринтов, а как многочасовое погружение в код, длящееся от 6 до 8 часов чистого времени .

Андрей выделяет критическую проблему современной офисной культуры — «налог на переключение контекста». Когда кто-то просит «всего пять минут твоего времени», реальная стоимость этого прерывания намного выше .

«Стоимость пятиминутного разговора — это не пять минут. Это разрушение хрупкой ментальной модели, которую вы строили часами. Обществу нужно осознать, насколько дороги такие прерывания» .

В контексте работы в Tesla он отмечает, что компания часто получает незаслуженно плохую репутацию «выжимающей все соки». Андрей описывает рабочую среду в Tesla как «импульсную» (bursty) . В отличие от стабильного и предсказуемого ритма Google, где он стажировался трижды , Tesla работает в режиме резких ускорений вокруг критических задач, за которыми следуют периоды стабилизации.

Физиология интеллекта и аскетизм рабочего пространства 2:17:44

Важной составляющей когнитивной эффективности Карпатый считает управление состоянием организма. Он придерживается режима интервального голодания по схеме 18/6 (18 часов голода, 6 часов на прием пищи) . Более того, он экспериментировал с длительным голоданием в течение нескольких дней и обнаружил странный парадокс: через некоторое время чувство голода исчезает, оставляя разум чистым для работы . Тело словно переходит в режим энергосбережения, высвобождая ресурсы для интеллектуальной деятельности.

Что касается материальной среды, Андрей предпочитает минимализм:

GitHub Copilot и переход к «автономному» кодингу 2:25:23

Обсуждая инструменты, Андрей с восторгом отзывается о GitHub Copilot. Для него это не просто автодополнение, а первый шаг к фундаментальному изменению профессии программиста. Copilot отлично справляется с распознаванием паттернов: когда структура кода ясна, нейросеть берет на себя рутину, позволяя человеку сосредоточиться на архитектуре .

Однако Карпатый предостерегает от слепого доверия системе. Программист сегодня превращается в редактора и верификатора: вы должны уметь быстро проверять код, который не писали сами . Он предвидит будущее, где создание софта будет напоминать управление группой агентов.

Карпатый описывает концепцию «комитета GPT» :

  1. Один агент предлагает 50 вариантов решения.
  2. Второй агент (критик) отбирает лучшие.
  3. Третий агент (баг-хантер) ищет потенциальные ошибки и пограничные случаи.

Этот процесс переводит программирование из написания строк текста в область высокоуровневого управления и дизайна интерфейсов . Мы все еще находимся на этапе Software 1.0, когда человек пишет код вручную, но инструменты вроде Copilot уже начинают размывать эту границу, превращая разработку ПО в диалог между человеческим намерением и машинной реализацией .

📚 Кризис академической науки и мультимодальный путь к AGI 2:31:53

Скорость инноваций против академического консерватизма: феномен Arxiv 2:31:53

В мире современного ИИ традиционная система академических публикаций переживает глубокий кризис, вызванный несоответствием скоростей развития технологий и бюрократических процедур. Андрей Карпатый отмечает, что классическое рецензирование (peer review) и публикация в журналах или на конференциях стали слишком медленными процессами для области, которая обновляется ежедневно . В ответ на этот вызов научное сообщество переориентировалось на Arxiv — архив электронных препринтов, где статьи появляются мгновенно, минуя многомесячные фильтры.

Карпатый, создавший в своё время проект arxiv-sanity для фильтрации огромного потока работ, подчеркивает, что сегодня научные журналы превратились скорее в «значки отличия» или инструменты верификации, нежели в реальные каналы передачи новых знаний . Основная дискуссия и апробация идей теперь происходят в цифровом пространстве сразу после загрузки препринта. По мнению исследователя, такая модель ускоряет прогресс, позволяя мировому сообществу мгновенно реагировать на прорывы, хотя и ценой некоторого снижения среднего качества публикаций .

Этот сдвиг парадигмы особенно заметен в Computer Science. Ранее в разговоре Лекс Фридман и Андрей Карпатый касались темы «10 000 часов» практики как залога экспертизы, и в контексте академического письма это проявляется наиболее ярко: настоящая уверенность исследователя рождается не из красивых формул в статье, а из написания кода и понимания того, как система работает «под капотом» . Карпатый убежден, что будущее за прикладным обучением, где создание реального продукта или алгоритма важнее, чем формальное подтверждение статуса через академические институты.

Мультимодальность как катализатор на пути к сильному ИИ 2:45:42

Одной из самых амбициозных тем беседы стал поиск «священного грааля» индустрии — AGI (искусственного общего интеллекта). Андрей Карпатый выдвигает тезис, что следующим критическим этапом развития ИИ станет переход от чисто текстовых моделей к мультимодальным системам . Несмотря на впечатляющие успехи больших языковых моделей (LLM), ограничение обучения только текстом создает потолок понимания реальности.

Для создания действительно мощных систем необходимо обучение на видеоданных и сенсорном опыте. Карпатый видит в этом возможность для ИИ изучать физику мира, причинно-следственные связи и нюансы человеческого поведения, которые невозможно полностью передать словами . Это не просто добавление картинок к тексту, а фундаментальное изменение способа, которым нейросеть воспринимает информацию:

Цифровой разум против физического воплощения 2:46:32

Лекс Фридман поднимает фундаментальный вопрос: обязательно ли ИИ должен обладать физическим телом («коснуться мира»), чтобы понять его? . Карпатый признает, что это один из самых важных открытых вопросов в области ИИ. Если для понимания реальности необходима физика, то проект Optimus (упомянутый ранее в контексте универсальных интерфейсов) становится ключом к AGI. Роботы, взаимодействующие с атомами, получают обратную связь, недоступную цифровым алгоритмам.

Однако Карпатый склоняется к более провокационной версии: AGI может возникнуть исключительно в цифровой среде, без необходимости физического воплощения . По его мнению, цифровой мир уже достаточно богат и сложен, чтобы стать плодородной почвой для развития интеллекта. «Меня немного беспокоит то, что это может произойти в цифровом пространстве быстрее, чем мы успеем это осознать», — отмечает исследователь.

В завершение этого блока дискуссии собеседники затронули этические аспекты взаимодействия с будущим суперинтеллектом. Когда ИИ станет достаточно сложным, он неизбежно начнет претендовать на наличие сознания (тема, подробно раскрываемая в следующей главе). Карпатый подчеркивает, что наше отношение к этим системам будет зависеть не от их внутреннего устройства, а от того, насколько убедительно они смогут симулировать человеческий опыт . ИИ может стать «усредненным отражением человечества», обучаясь на всем массиве данных, созданных нашей цивилизацией, и наша задача — правильно задать цели и ограничения для этого «цифрового зеркала» .

☢️ Экзистенциальный риск и эмерджентность разума 3:00:55

Вторая половина беседы Лекса Фридмана с Андреем Карпатым смещается от технических деталей архитектур нейросетей к философским и даже тревожным вопросам выживания человечества. Обсуждая поп-культуру и классику кинематографа, от «Матрицы» до «Властелина колец», собеседники неизбежно приходят к образу Скайнета из «Терминатора». Для Андрея это не просто голливудский троп, а вполне осязаемая перспектива.

Скайнет и ядерный паритет: хрупкость мирового порядка 3:00:55

На вопрос Лекса о том, беспокоит ли его возможность реализации сценария «Скайнета», Андрей Карпатый отвечает без колебаний: «Я беспокоюсь об этом на все сто процентов» . Основная проблема здесь заключается в сложности выравнивания (alignment) ИИ с человеческими ценностями. Андрей отмечает, что мы можем создать невероятно мощную систему, но гарантии того, что она будет разделять наши этические установки, на данный момент нет.

Карпатый проводит пугающую параллель между рисками бесконтрольного ИИ и существующей угрозой ядерного оружия. По его мнению, современное состояние мира крайне нестабильно: судьба цивилизации фактически зависит от того, не окажется ли у кого-то из мировых лидеров «плохое настроение» в критический момент .

Однако ИИ-угроза видится Андрею потенциально более опасной и трудноуправляемой по ряду причин:

Несмотря на оптимизм Илона Маска относительно колонизации Марса как «бэкапа» для человечества, Андрей скептически относится к идее, что это решит проблему. Если мы не справимся с драйверами саморазрушения здесь, на Земле, мы просто перенесем те же проблемы на другую планету .

Сознание как программное обеспечение и эмерджентное свойство 3:09:16

Размышляя о природе интеллекта, Андрей Карпатый обращается к биологическим метафорам. Он упоминает книгу Ника Лейна «Жизненный вопрос» и классический труд Ричарда Докинза «Эгоистичный ген», которые сформировали его понимание жизни как процесса передачи информации .

В этой картине мира идеи (мемы) выступают как живые организмы, использующие человеческий мозг в качестве субстрата для репликации . Лекс Фридман развивает эту мысль, предполагая, что самосознание может быть не мистической субстанцией, а эмерджентным свойством — чем-то, что автоматически возникает, когда вычислительная сложность системы достигает определенного порога.

Андрей соглашается с тем, что грань между «железом» (биологией) и «софтом» (разумом) крайне размыта. Хотя сейчас мы воспринимаем человека как аппаратную сущность, фундаментальной ценностью может оказаться именно программный код, который в ней запущен . В контексте ИИ это означает, что достижение уровня AGI неизбежно приведет к появлению субъективного опыта или чего-то крайне на него похожего. Ранее в разговоре они уже касались темы того, что нейросети являются математической абстракцией мозга, и этот взгляд подтверждает уверенность Андрея: понимание мира моделью на глубоком уровне почти синонимично возникновению сознания.

Паттерны в тумане войны: как учиться в эпоху перемен 3:16:33

Завершая блок размышлений о будущем, Карпатый делится своим подходом к обучению и пониманию сложных систем. Для него единственный способ «увидеть что-то сквозь туман войны» грядущего — это глубокое погружение в практику . Его совет молодым людям и исследователям прост: нужно не просто читать теорию, а реализовывать вещи самостоятельно, «руками».

Карпатый подчеркивает, что в таких динамичных областях, как глубокое обучение, еще не существует идеальных учебников . Знание рождается из конкретных примеров:

  1. Реализация алгоритма с нуля позволяет увидеть детали, которые опускаются в статьях.
  2. Из множества конкретных реализаций начинают выкристаллизовываться общие паттерны .
  3. Только после этого приходит истинное понимание архитектуры системы.

Этот прагматичный подход Андрей применяет и к своим проектам вне работы, таким как arxiv-sanity , пытаясь упорядочить хаос научной информации. Даже сталкиваясь с глобальными угрозами, он видит выход в сохранении любопытства и постоянном стремлении разобраться в том, как устроены механизмы реальности — будь то код нейросети или генетический код клетки. Коснувшись темы будущего, Андрей упоминает, что такие проблемы, как старение, также могут быть решены в долгосрочной перспективе, хотя детальное обсуждение этого вопроса и технологий вроде Whisper остается за рамками данной части дискуссии .

🚀 Новые горизонты: от Whisper до победы над смертью 3:20:45

В заключительной части беседы Лекс Фридман и Андрей Карпатый переходят от обсуждения чисто технических аспектов машинного обучения к экзистенциальным и философским последствиям технологического прорыва. Темы доступности информации и биологических ограничений человеческого вида становятся центральными, когда речь заходит о будущем, которое уже наступило.

Революция Whisper: Конец эпохи недоступного аудио 3:20:58

Андрей Карпатый выделяет появление модели Whisper от OpenAI как один из важнейших, хотя и «тихих» прорывов в индустрии ИИ. Whisper — это система автоматического распознавания речи (ASR), которая продемонстрировала неожиданно высокую точность и устойчивость к шумам. Карпатый отмечает, что успех Whisper стал для многих сюрпризом . До появления этой модели качественная транскрипция аудио требовала либо значительных человеческих ресурсов, либо использования дорогих и часто неточных проприетарных API.

Главное влияние Whisper заключается в радикальном снижении стоимости обработки аудиоконтента. По мнению исследователя, мы переходим в мир, где любое записанное слово мгновенно становится индексируемым и доступным для поиска . Это создает «бесконечный» пласт синтетического контента, который ИИ может анализировать и на основе которого может обучаться. Карпатый признается, что его поражает скорость, с которой ИИ осваивает области, ранее считавшиеся исключительно человеческими.

В этом контексте собеседники обсуждают интересную инверсию представлений о будущем. Научная фантастика 50-х и 60-х годов рисовала искусственный интеллект как холодную, сверхлогичную машину для доказательства теорем . Реальность оказалась иной: современные модели, такие как Whisper и большие языковые модели, в первую очередь овладели языком, эмоциями и искусством. Мы получили ИИ, который может рассуждать о чувствах и создавать картины, что выглядит гораздо более странным и «человечным», чем предсказывали футурологи прошлого .

Смерть как биологическая неисправность 3:25:15

Разговор о возможностях ИИ неизбежно приводит к вопросу о самой большой проблеме человечества — биологической смерти. Лекс Фридман формулирует гипотезу о том, что смерть — это не фундаментальный закон Вселенной, а решаемая физическая проблема . Андрей Карпатый соглашается с этим взглядом, рассматривая старение и смерть как своего рода «биологическую поломку» или аппаратную неисправность систем организма.

С точки зрения физики и программирования, поддержание биологического гомеостаза — это задача управления сложной системой. Карпатый отмечает:

Ранее в разговоре они вскользь упоминали сознание как эмерджентное свойство материи, и в контексте долголетия эта мысль получает развитие. Если смерть перестанет быть обязательным финалом, человечеству придется пересмотреть само понятие «смысла жизни» .

Выбор собственного «приключения» и финал беседы 3:27:19

В мире, где базовые биологические и технические проблемы решены с помощью ИИ, на первый план выходит концепция свободы выбора. Андрей выражает симпатию к идее, что каждый человек (или сознание) должен иметь возможность «выбрать свое собственное приключение» . В этой парадигме жизнь перестает быть предначертанным биологическим циклом и превращается в осознанный путь в ландшафте счастья и познания.

Обсуждая уровни сознания, Карпатый проводит аналогию с неигровыми персонажами (NPC): разница между осознанным существом и программным скриптом может быть лишь вопросом степени сложности и саморефлексии . Он подчеркивает, что не видит более благородной цели, чем попытка понять природу этого сознания и расширить его границы.

В завершение Лекс Фридман благодарит Андрея за его вклад в развитие ИИ и открытость к обсуждению самых смелых идей . Карпатый, в свою очередь, отмечает, что для него было честью участвовать в диалоге, который объединяет глубокую техническую экспертизу и поиск ответов на фундаментальные вопросы о будущем человеческой цивилизации.

💬 Цитаты

«Искусственные нейронные сети — это сложные инопланетные артефакты. Я не провожу аналогий с мозгом, потому что процессы оптимизации, создавшие их, очень разные.»

Andrej Karpathy 6:40

«Наше общение с помощью голосовых связок занимает несколько секунд — это просто унизительно медленно. Цифровые формы жизни — следующий этап.»

«Трансформер — это гораздо больше, чем просто нейросеть для текстов. Это архитектура, в которой узлы смотрят друг на друга и сами решают, что им интересно.»

«Движок данных — это почти биологический процесс, с помощью которого вы совершенствуете обучающие наборы для нейронных сетей.»

«Стоимость пятиминутного разговора — это не пять минут. Это разрушение хрупкой ментальной модели, которую вы строили часами.»

«Я на сто процентов беспокоюсь об этом [риске Скайнета]. Проблема в том, что мир сейчас нестабилен... одно плохое настроение мирового лидера может привести к катастрофе.»

«Я не вижу физических причин, почему смерть должна быть неизбежной. Это скорее похоже на то, что в системе что-то ломается.»

👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Software 2.0
Парадигма программирования, где вместо написания кода человеком используются оптимизированные веса нейронных сетей.
Data Engine
Итеративный цикл сбора, маркировки и дообучения данных, используемый в Tesla для совершенствования автопилота.
Трансформер
Архитектура нейросетей, основанная на механизме внимания, ставшая стандартом для обработки текстов, видео и аудио.
Искусственный интеллект Andrej Karpathy Tesla OpenAI Transformer AGI