От «детских» данных до нейронауки: лекция Stanford CS25

Stanford Online 39,6 тыс. 1 ч 1 мин 3 мин 18.04.2025
Главное

Обзор архитектуры трансформеров: от основ до обучения агентов 0:04

Курс CS25 от Stanford Online посвящен глубокому изучению трансформеров — архитектуры, которая стала фундаментом современных систем искусственного интеллекта, от ChatGPT до генераторов видео вроде Sora. Ведущие курса, аспиранты Стэнфорда Стивен, Каран и Челси, представили вводную лекцию, охватывающую весь жизненный цикл модели: от предобучения на огромных массивах данных до методов посттренировки, повышения эффективности и перспектив создания «пожизненно обучающихся» агентов.

🧠 Фундамент трансформеров: эмбеддинги и внимание 6:29

Работа трансформера начинается с преобразования слов в числа. Так как модели не могут обрабатывать слова напрямую, используются эмбеддинги — плотные векторы в многомерном пространстве, позволяющие математически выражать семантическое сходство понятий (например, «кошка» ближе к «собаке», чем к «автомобилю»).

📊 Предобучение: искусство работы с данными 10:40

По мнению Стивена, качество и структура данных важнее их простого количества. В своих исследованиях он сравнил два подхода к предобучению:

  1. Малый масштаб: Изучение эффективности «детской» речи (Child-Directed Speech). Эксперименты показали, что естественные детские диалоги дают худшие результаты, чем гетерогенные смеси данных (вроде BabyLM), а использование «учебной программы» (curriculum learning) не показало значительного преимущества.
  2. Большой масштаб: Двухфазное предобучение (Two-Phase Pretraining), разработанное в сотрудничестве с NVIDIA. Первая фаза идет на разнообразных данных для общих знаний, вторая — на специализированных (математика, код). Оптимальный момент для переключения между фазами — около 40% общего объема обучения, далее начинаются «убывающая отдача» и риск переобучения.

🚀 Посттренировка и reasoning-способности 25:01

После предобучения модель необходимо адаптировать к конкретным задачам с помощью методов посттренировки, которые описала Челси.

🤖 Агенты и самосовершенствование 34:19

Агент — это система, которая воспринимает среду, ставит цели и итеративно действует для их достижения. Техники, позволяющие агентам улучшаться:

🧬 Прикладные исследования и нейронаука 39:11

Каран представил применение Vision Transformers (ViT) не только в компьютерном зрении, но и в анализе fMRI-данных мозга. Традиционные методы линейной корреляции уступают трансформерам в точности постановки диагнозов (например, при болезни Паркинсона), так как ViT способны улавливать более сложные связи между функциональными сетями мозга.

🔮 Проблемы и будущее ИИ 48:03

Несмотря на успехи, текущие модели сталкиваются с барьерами:

💬 Цитаты

«Люди учатся непрерывно. Мы не просто сидим в кресле, пока нам читают весь интернет, а потом перестаем учиться.»

«Смарт-стратегии данных — это, пожалуй, самая важная тема сегодня.»

«Истинное непрерывное обучение означало бы обновление мозга или весов модели каким-то образом.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Трансформер
Архитектура нейронных сетей, основанная на механизме внимания, позволяющая параллельно обрабатывать последовательности данных.
fMRI
Функциональная магнитно-резонансная томография, метод измерения активности мозга через уровень насыщения крови кислородом.
RLHF
Обучение с подкреплением на основе отзывов людей, используемое для донастройки моделей под человеческие предпочтения.
Механистическая интерпретируемость
Область исследований, пытающаяся понять работу нейросети на уровне отдельных нейронов и компонентов.
Катастрофическое забывание
Явление, при котором модель теряет ранее полученные знания при изучении новой информации.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Transformers Large Language Models Reinforcement Learning Mechanistic Interpretability Stanford CS25