TAPAS: как нейросети учатся «читать» таблицы без SQL

Yannic Kilcher 9,7 тыс. 31 мин 2 мин 05.05.2020
Главное

TAPAS: революция в работе с таблицами через предобучение 1:52

В данном разборе Янник Килчер (Yannic Kilcher) анализирует исследовательскую работу «TAPAS: Weakly Supervised Table Parsing via Pre-training», авторы которой предлагают инновационный подход к извлечению ответов из табличных данных с помощью нейронных сетей. Вместо классического написания SQL-запросов, которое часто бывает хрупким, исследователи предлагают использовать единую модель глубокого обучения, способную «понимать» таблицу как естественный язык и выполнять над ней вычисления.

🧠 Суть задачи и проблемы табличного парсинга 2:17

Задача «табличного парсинга» заключается в том, чтобы, имея таблицу и вопрос пользователя, найти верный ответ. По мнению Килчера, это сложная задача, так как вопросы могут принимать разные формы:

Раньше для таких задач требовалось извлекать заголовки, определять типы данных и переводить запрос в SQL, что, по словам ведущего, является «хрупким» подходом, уступающим методам глубокого обучения.

🏗 Архитектура модели TAPAS 6:28

Модель TAPAS основывается на архитектуре Transformer (аналогичной BERT) и обрабатывает таблицу не как структуру данных, а как последовательность естественного языка. Ключевые особенности входных данных:

  1. Сериализация: Таблица превращается в одну длинную строку текста.
  2. Специальные эмбеддинги: Чтобы модель понимала структуру, авторы добавили новые типы векторных представлений (embeddings):
    • Колоночные и строчные (column/row embeddings): указывают модели, в какой строке и столбце находится токен.
    • Ранговые (rank embeddings): позволяют модели быстрее находить «лучшие», «худшие» или «топ-N» значения, так как для каждого столбца вводится информация о ранжировании данных.

Модель состоит из двух основных компонентов: классификатора агрегации (выбирает действие: count, sum, average или none) и селектора ячеек.

📉 Обучение на слабых сигналах 18:46

Самым интересным и «почти невозможным» аспектом модели Килчер называет процесс обучения. Поскольку у модели есть только вопрос и итоговый ответ (без промежуточных шагов), она обучается с помощью «мягких решений» (soft decisions):

Ведущий отмечает, что это работает как задача обучения с подкреплением при слабом сигнале: через огромное количество примеров модель учится связывать вопросы с конкретными ячейками и математическими операциями.

📊 Итоги и перспективы 30:49

Янник Килчер признается, что скептически относился к масштабируемости такого подхода, однако результаты модели TAPAS превосходят все существующие аналоги на большинстве наборов данных. Хотя в видео обсуждаются лишь три типа операций, потенциальное расширение на десятки функций может привести к неопределенности в распределении весов, что остается предметом для будущих исследований. Тем не менее, как подчеркивает Килчер, авторы выложили код в открытый доступ, и метод уже демонстрирует высокую эффективность в задачах, требующих контекстно-зависимых ответов.

💬 Цитаты

«Это именно то, о чем этот новый режим NLP: вы просто помещаете все как строку, аннотируете ее умным способом, и это позволяет модели выяснить многое о входе.»

Янник Килчер 16:53

«Я крайне удивлен, что это работает, учитывая, насколько неоднозначно то, что модель должна делать с этими операциями.»

Янник Килчер 26:19
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
TAPAS
Модель, использующая предобучение для парсинга таблиц через глубокое обучение.
Агрегация
Математическая операция над набором данных (например, суммирование или усреднение).
Слабое обучение (Weakly Supervised)
Метод обучения модели, при котором данные размечены не полностью, что требует от нейросети самостоятельного поиска закономерностей.
Трансформер
Архитектура нейронных сетей, основанная на механизме внимания, ставшая стандартом в обработке естественного языка.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект TAPAS Transformer Deep Learning