Как нейросети «понимают» смысл: эмбеддинги и метод GloVe

MIT OpenCourseWare 13,6 тыс. 1 ч 17 мин 2 мин 07.01.2026
Главное

🧠 Векторные представления слов: от простого к контекстному 0:00

В современном обучении NLP (Natural Language Processing) переход от простых методов представления текста к сложным векторным моделям стал фундаментальным шагом. Лектор Массачусетского технологического института (MIT) Рама Рамакришнан на примере курса Deep Learning объясняет, как работают эмбеддинги (векторные представления слов), почему классическое One-Hot кодирование неэффективно и как современные подходы позволяют машинам «понимать» смысл и взаимосвязи между понятиями.

🚧 Проблемы One-Hot кодирования 2:43

Исторически первым способом представления текста было One-Hot кодирование, где каждый токен превращается в вектор, соответствующий позиции слова в словаре.

📐 Эмбеддинги: геометрия смыслов 11:43

Решением проблемы стали эмбеддинги — плотные векторы, где семантическая близость слов отражается в их геометрической близости.

💡 Метод GloVe: магия контекста 21:20

Для создания статических эмбеддингов широко используется метод GloVe (Global Vectors). Ключевая концепция основана на цитате лингвиста Джона Ферта: «Ты познаешь слово по компании, которую оно держит».

🛠 Практическая реализация в Keras 50:29

При использовании Keras процесс превращения текста в обучаемые данные выглядит следующим образом:

  1. Preprocessing: Стандартизация и токенизация через TextVectorization.
  2. Indexing: Преобразование слов в целые числа (индексы).
  3. Embedding Layer: Слой, который превращает индексы в векторы (предобученные или обучаемые с нуля).
  4. Pooling: GlobalAveragePooling1D усредняет полученные векторы для подачи в полносвязные слои нейросети.

Рамакришнан подчеркивает: если данных мало, лучше использовать предобученные эмбеддинги (например, GloVe), не меняя их (замораживая веса). Если данных много, то «размораживание» весов или обучение эмбеддингов с нуля под конкретную задачу (например, классификацию жанров песен) часто дает лучшие результаты, повышая точность предсказаний.

💬 Цитаты

«Ты познаешь слово по компании, которую оно держит.»

Рама Рамакришнан 15:32

«Человеческая биология, сведенная к одному предложению.»

Рама Рамакришнан 48:55
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Эмбеддинг
Векторное представление слова в пространстве, где близкие по смыслу слова расположены рядом.
One-Hot кодирование
Способ представления слов в виде векторов, где на одной позиции стоит 1, а на остальных 0.
Полисемия
Многозначность слова, когда один термин может иметь разные смыслы в зависимости от контекста.
Stochastic Gradient Descent
Алгоритм оптимизации, используемый для минимизации функции ошибки при обучении нейросети.
GlobalAveragePooling
Слой нейросети, который усредняет значения вектора по измерениям для получения фиксированного представления.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект GloVe Deep Learning NLP One-Hot encoding Keras