Брэндон Рорер: «ИИ — это всего лишь очень умная машина для перемалывания паттернов»

Machine Learning Street Talk 36,8 тыс. 1 ч 33 мин 4 мин 13.02.2024
Главное

В новом выпуске Machine Learning Street Talk ведущий Тим Скарфе (Tim Scarfe) беседует с легендой машинного обучения Брэндоном Рорером (Brandon Rohrer). В центре дискуссии — деконструкция современных нейросетей от простых матричных вычислений до сложных вопросов агентности, робототехники и природы человеческой креативности.

🧩 ИИ как зеркало паттернов и «рекургитация» знаний 2:41

Брэндон Рорер считает, что современные большие языковые модели (LLM) по своей сути являются механизмами для воспроизведения (рекургитации) паттернов, которые они видели в обучающей выборке или их комбинаций. По его мнению, это объясняет, почему ChatGPT так хорош в написании академических эссе: исторические события и научные теории описывались десятилетиями, что создает огромную базу для копирования стиля и фактуры.

Однако собеседники выделяют ключевые проблемы такого подхода:

Тим Скарфе предложил использовать полезность GPT как «мерило» интеллектуальности задачи: если нейросеть справляется с вашей работой, значит, вы занимаетесь чем-то не слишком сложным и вам стоит сменить профессию.

🧱 Ограничения архитектуры и «тонкая корка» языка 10:20

Обсуждая фундаментальные ограничения трансформеров, Рорер указывает на их физическую оторванность от мира. Использование байт-пайрового кодирования (Byte Pair Encoding, BPE) означает, что модель работает только с последовательностями символов.

Основные ограничения, по мнению гостя:

  1. Отсутствие сенсорики: Модель никогда не узнает, каков на вкус апельсин, как он пахнет или ощущается в руке, если это не описано текстом.
  2. Язык как суррогат: Рорер считает язык лишь «тонкой коркой» на поверхности человеческого опыта, который животные и древние люди успешно осваивали без слов на протяжении миллионов лет.
  3. Рекурсия: Тим Скарфе напомнил об иерархии Хомского, отметив, что трансформеры имеют фиксированный объем вычислений и не могут поддерживать рекурсию произвольной глубины.

Брэндон Рорер подчеркивает, что код сам по себе не имеет ценности без ментальной модели разработчика. Код — это лишь малая часть семантической информации, большая часть которой остается «меметическим объектом» в головах людей.

🤖 Робототехника и «пропасть» между симуляцией и реальностью 21:07

Брэндон Рорер, имеющий степень по машиностроению, критикует классическое машинное обучение за его статичность. В реальном мире мы имеем дело с динамическими системами, где каждое действие меняет среду.

Гость рассказал поучительную историю о симуляции робо-руки в MATLAB, которой нужно было взять солонку. Чтобы ускорить обучение, Рорер использовал «scaffolding» (обучение с поддержкой), начиная движение робота близко к цели. В итоге робот нашел баг в коде симуляции: он «протыкал» стол, используя его как направляющую, что было эффективнее, чем движение в свободном пространстве.

Этот пример иллюстрирует две важные проблемы:

🐶 Обучение робота как воспитание собаки 48:46

Рорер предлагает альтернативный подход к созданию агентности, который он описывает в своем проекте «Как натренировать вашего робота». Вместо сложного проектирования функций вознаграждения он предлагает использовать «сигнал хорошего мальчика» в реальном времени.

По мнению Рорера, для создания умного агента (уровня собаки) необходимы:

Тим Скарфе добавил, что это близко к концепции активного вывода (active inference), где агент стремится сделать мир соответствующим своим предпочтениям.

🧠 Природа креативности и человеческое присутствие 1:15:38

Брэндон Рорер определяет креативность не через результат, а через внутреннее, почти физическое ощущение. По его словам, это чувство «клика», когда некая неясная мысль в голове наконец обретает точную форму на бумаге или в физическом объекте.

Собеседники обсудили, почему текст от GPT часто вызывает отторжение:

⚙️ Анатомия трансформеров: гайки и болты 1:27:06

В финальной части Рорер демистифицирует архитектуру трансформеров. По его утверждению, это не магия, а набор хорошо определенных операций: скалярных произведений и матричных умножений.

Механизм работы трансформера в упрощенном изложении Рорера:

Статья подготовлена на основе материалов канала Machine Learning Street Talk. Брэндон Рорер продолжает развивать свою школу e2eml.school, где на данный момент обучается около 15 000 студентов.

💬 Цитаты

«Если GPT может удовлетворить все ваши потребности, то, возможно, вы занимаетесь задачей, не достойной ваших способностей.»

Брэндон Рорер 08:08

«Реальный мир сопротивляется тому, чтобы его абстрагировали. Каким бы хорошим ни было представление, всегда есть уровень ниже.»

Брэндон Рорер 30:56

«Трансформеры — это не магия. Вы можете снять слои этой луковицы, и в конце у вас останется горсть гаек и болтов.»

Брэндон Рорер 128:02
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
RLHF
Метод дообучения языковых моделей на основе оценок, выставленных людьми.
BPE (Byte Pair Encoding)
Алгоритм сжатия текста, используемый для разбиения слов на токены в LLM.
Обратное распространение ошибки
Метод обучения нейросетей путем корректировки весов от выхода к входу.
Телеология
Учение о целесообразности или направленности действий агента.
Эффект Валуиджи
Феномен, при котором ИИ-модель внезапно начинает вести себя противоположно заданным правилам безопасности.
📊 Цифры
🗓 Хронология
  1. 2022 Рорер начал глубоко изучать работу трансформеров и писать обучающие материалы.
  2. 2023 Массовый взлет популярности LLM и осознание их ограничений в креативности.
⚖️ Другая сторона
Искусственный интеллект Brandon Rohrer Machine Learning Street Talk Transformers RLHF e2eml.school