Алекс Смола (AWS): почему графы знаний и «модели-Франкенштейны» эффективнее языковых гигантов

The TWIML AI Podcast 719 1 ч 1 мин 5 мин 27.05.2021
Главное

В современном мире искусственного интеллекта доминирует подход «чем больше, тем лучше», однако в недрах AWS AI ведут поиск альтернативных путей. Алекс Смола, вице-президент и выдающийся ученый Amazon Web Services, в беседе с автором подкаста TWIML AI Сэмом Чаррингтоном раскрывает, как глубокое обучение на графах может заменить триллионные языковые модели, почему автоматизация машинного обучения (AutoML) требует отказа от поиска «идеальных» моделей и как причинно-следственный анализ помогает находить поломки в сложных облачных системах.

🎓 Путь из физики в машинное обучение: школа Вапника и Лёкуна 1:30

Алекс Смола — физик по образованию, и он с иронией цитирует известную поговорку о том, что физики не умеют ничего конкретного, но пригодны для всего . Его карьера в ML началась в 1995 году в лаборатории AT&T, где его руководителем был Владимир Вапник (создатель метода опорных векторов), а главой департамента в то время был Ян Лёкун (один из «отцов» современного глубокого обучения) .

Смола признается, что никогда в жизни не посещал полноценных лекций по Computer Science . Это порой приводило к забавным ситуациям: например, во время защиты диссертации ему пришлось в срочном порядке разбираться, в чем суть проблемы равенства классов P и NP, чтобы не провалить экзамен . Сегодня его роль в AWS заключается в стратегическом планировании алгоритмов и сервисов, а также в образовательных проектах, таких как «Dive into Deep Learning», по которому обучаются студенты в 175 университетах мира .

🕸️ Глубокое обучение на графах: замена гениальным алгоритмам 4:52

Одной из центральных тем обсуждения стало обучение на графах (Graph Learning). Смола объясняет ценность этого подхода через аналогию с алгоритмом PageRank, который лег в основу успеха Google .

Смола утверждает, что такой подход позволяет решать задачи детекции фрода (мошенничества), когда репутация «хорошего парня» или «злоумышленника» переносится на связанные с ним узлы. По его мнению, большинство задач со структурированными данными из реляционных баз можно переформулировать как графовые проблемы и получить значительный прирост качества .

Автоматическое создание графов знаний 9:07

Команда Смолы в Шанхае разработала метод беспилотного извлечения графов знаний из текста, используя принцип циклической согласованности (cycle consistency) . Ранее этот метод применялся в визуальных задачах (например, превращение зебр в лошадей на видео), но в AWS его адаптировали для текста:

  1. Текст переводится в граф знаний.
  2. Граф знаний переводится обратно в текст.
  3. Система обучается так, чтобы итоговый текст максимально соответствовал оригиналу .

Это позволяет создавать редактируемые структуры данных без дорогостоящей разметки людьми.

🧠 Графы против «языковых монстров» 17:16

Алекс Смола высказывает скептическое отношение к текущей гонке вооружений в области больших языковых моделей (LLM). Он считает этот процесс саморегулирующимся: рано или поздно финансовые отделы компаний запретят тратить «неразумные суммы» на обучение моделей с триллионами параметров .

Главная проблема современных LLM, по мнению гостя, — это их непрозрачность («глухие блоки»).

🤖 AutoML: прощание с «красивыми снежинками» 25:46

В области автоматического машинного обучения (AutoML) Алекс Смола продвигает философию, отличную от большинства конкурентов. Он критикует индустрию за охоту на «снежинок» — поиск одной единственной идеальной модели (будь то глубокая сеть или дерево решений) .

Подход AWS в AutoML базируется на других принципах:

Чтобы такие модели работали быстро, используется дистилляция . Сложный ансамбль выступает в роли «учителя», а простая и быстрая модель — в роли «ученика». Чтобы этот процесс не терял в точности, Смола описывает «хитрость с математикой»: создание синтетических данных, которые позволяют обойти классические ограничения скорости сходимости (1/√n) .

📉 Математическая чистота против реальности 36:49

Смола делится личной историей о том, как во время работы над постдоком он гордился созданием элегантных математических доказательств . Однако, когда он попытался применить свои «идеально строгие» границы (bounds) к реальному статистическому тесту, они оказались абсолютно бесполезными на практике .

По мнению гостя, современный мир изменился:

⚙️ Причинность (Causality): поиск «сломанного выключателя» 49:14

В AWS активно исследуют тему причинно-следственного анализа под руководством Бернхарда Шёлькопфа (директор Института Макса Планка) . Это необходимо не для теоретических изысканий, а для конкретных сервисов, таких как Lookout for Metrics .

Смола выделяет два подхода к причинности:

  1. Стиль Джуды Перла: Сложное моделирование вмешательств (интервенций).
  2. Причинность по Грэнджеру (Granger causality): Более прагматичный метод. Если знание истории переменной $X$ помогает лучше предсказать будущее переменной $Y$, чем просто знание истории $Y$, то между ними есть причинная связь .

Гость объясняет важность осторожности в этой области на примере популярного метода объяснимости моделей SHAP . Команда из Тюбингена обнаружила, что хотя код в библиотеке SHAP был верным, математическое обоснование в оригинальной статье содержало неточности .

Проблема в том, что причинность крайне коварна. Если выключатель включает лампочку, их состояния коррелируют. Но если вы разобьете лампочку, выключатель не выключится сам собой . По словам Смолы, понимание этих нюансов — критическая задача для ученых AWS, так как ошибки в интерпретации данных могут стоить бизнесу очень дорого.


💬 Цитаты

«Физики не умеют ничего конкретного, но пригодны для всего — так я и оказался в машинном обучении.»

Алекс Смола 01:30

«Машинное обучение — это специя, а не основное блюдо. Оно делает основное блюдо вкусным.»

Алекс Смола 56:32

«Вместо того чтобы искать одну идеальную 'снежинку', мы собираем ансамбль из всех доступных моделей.»

Алекс Смола 27:18
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
PageRank
Алгоритм ранжирования веб-страниц на основе их ссылочных связей, созданный основателями Google.
AutoML
Технологии автоматизации процессов построения и настройки моделей машинного обучения.
Дистилляция моделей
Процесс обучения компактной модели («ученика») повторять поведение большой и сложной модели («учителя»).
Granger causality
Статистическое понятие причинности, основанное на способности предсказывать будущее одного временного ряда с помощью другого.
📊 Цифры
🗓 Хронология
  1. 1995 Алекс Смола начинает работу в AT&T под руководством Владимира Вапника.
  2. 2016 Первое мини-мероприятие по ML на конференции AWS re:Invent, ставшее прообразом ML Summit.
  3. 2021 Проведение первого полноценного AWS ML Summit в виртуальном формате.
⚖️ Другая сторона
Искусственный интеллект Alex Smola AWS AI AutoML Graph Learning Granger causality