Как графовые нейросети ищут новые антибиотики и расшифровывают язык кашалотов

The TWIML AI Podcast 739 1 ч 16 мин 4 мин 01.02.2021
Главное

В новом выпуске подкаста TWIML AI ведущий Сэм Чаррингтон обсуждает итоги 2020 года и будущие тренды в области машинного обучения с Майклом Бронштейном — профессором Имперского колледжа Лондона и руководителем отдела графового машинного обучения в Twitter. Главной темой беседы стал стремительный переход графовых нейронных сетей (GNN) из теоретической ниши в статус мощного инструмента для решения фундаментальных задач — от синтеза антибиотиков до расшифровки языка кашалотов.

🚀 Масштабные сдвиги: пандемия, этика и GPT-3 1:21

Майкл Бронштейн отмечает, что 2020 год стал переломным для научного сообщества не только из-за пандемии, которая заставила конференции и компании перейти в онлайн-формат , но и из-за изменения акцентов в исследованиях.

Ключевые события года в широком ML:

🔷 Геометрическое обучение и «бесконечное» разрешение 7:42

В области компьютерного зрения (Computer Vision) наблюдается ренессанс геометрии. Если раньше сообщество относилось к геометрическим методам настороженно, то теперь они доминируют на главных конференциях, таких как CVPR .

Особый интерес Бронштейна вызывают неявные нейронные представления (implicit neural representations) :

🕸️ Прорыв в графовых нейронных сетях (GNN) 11:42

Графовое машинное обучение стало одной из самых динамичных тем года. Майкл выделяет несколько ключевых направлений развития:

1. Алгоритмическое мышление (Neural Execution)

Исследование Питера Величковича из DeepMind показало, что GNN могут обучаться выполнять шаги классических алгоритмов (например, алгоритма Дейкстры для поиска кратчайшего пути) . По мнению Бронштейна, это путь к объяснимому ИИ . Важно, что нейросети способны на «трансфер» знаний: обучение поиску кратчайшего пути ускоряется, если модель одновременно учится определять достижимость узлов .

2. Проблема «узкого горлышка» и глубина сетей

Бронштейн упоминает работу израильских исследователей о феномене bottleneck . В стандартных GNN информация от соседей «сжимается» в один вектор, что мешает обработке дальних связей в графах типа «тесный мир».

🧪 Революция в медицине: антибиотики и белки 28:05

Наибольшее влияние GNN в 2020 году оказали на молекулярном уровне.

📈 Индустрия и новые рынки 55:24

Графовые технологии активно внедряются гигантами:

Среди интересных стартапов гость выделяет Ariel AI, который создает 3D-аватары людей в реальном времени на обычных смартфонах . По словам Бронштейна, это доказывает: современный ИИ (в частности, геометрический DL) стал настолько мощным, что ему больше не нужны специальные 3D-сенсоры для реконструкции облика .

🐋 Будущее: кашалоты и физика частиц 10:52

В 2021 году Майкл прогнозирует рост интереса к:

  1. Топологическому анализу данных (TDA): Совмещение топологии и глубокого обучения .
  2. Физике частиц: Использование GNN в ЦЕРН для детектирования редких событий при столкновении протонов в Большом адронном коллайдере .
  3. Project CETI: Проект по расшифровке языка кашалотов. Ученые создают «Whale Twitter» — базу данных коммуникации этих животных, чтобы применить к ним методы NLP, используемые для человеческих языков .

Бронштейн подчеркивает: время теоретических спекуляций вокруг графов прошло. Теперь критически важно партнерство между разработчиками ИИ и экспертами в областях биологии и химии .

💬 Цитаты

«GPT-3 не имеет ни малейшего представления о языке, она просто производит правдоподобные результаты.»

Майкл Бронштейн 04:26

«Для графов наступил свой ImageNet-момент в тот день, когда AlphaFold показал такие результаты.»

Майкл Бронштейн 40:02
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
GNN (Graph Neural Networks)
Нейронные сети, предназначенные для обработки данных, представленных в виде графов (узлов и связей).
Неявные нейронные представления
Метод описания объектов через непрерывную функцию координат, а не через сетку пикселей.
Drug Repositioning
Поиск новых терапевтических применений для уже существующих и одобренных лекарств.
📊 Цифры
🗓 Хронология
  1. Февраль 2020 Публикация работы лаборатории Джима Коллинза (MIT) об открытии антибиотика Галицин в журнале Cell.
  2. 2020 Триумф модели AlphaFold 2 на соревновании CASP по сворачиванию белков.
  3. 2021 Прогноз на более глубокое объединение GNN с топологическим анализом данных (TDA).
⚖️ Другая сторона
Искусственный интеллект Michael Bronstein Graph Machine Learning AlphaFold DeepMind GPT-3