ИИ против математиков и токсичности: обзор DeepMind, OpenAI и Meta

Yannic Kilcher 25,1 тыс. 26 мин 4 мин 10.02.2022
Главное

В новом выпуске ML News исследователь машинного обучения Янник Килчер (Yannic Kilcher) разбирает последние прорывы в индустрии ИИ: от системы AlphaCode, соревнующейся с программистами-людьми, до методов OpenAI по решению олимпиадных задач по математике. В центре внимания также оказываются инструменты для разработчиков, изменения в научной среде и этические вопросы использования генетических данных для распознавания лиц.

🚀 AlphaCode: ИИ выходит на уровень соревновательного программирования 3:19

DeepMind представила AlphaCode — систему, способную решать сложные задачи по программированию, сформулированные на естественном языке . В отличие от простых упражнений, эти задачи требуют не только знания синтаксиса, но и понимания алгоритмов, логики и обработки условий.

Процесс работы AlphaCode выглядит следующим образом:

  1. Понимание текста: Модель получает описание задачи (например, манипуляции со строками с использованием клавиши backspace) .
  2. Генерация кода: ИИ самостоятельно пишет программу на Python, которая считывает данные и выводит ответ .
  3. Автономность: Весь цикл проходит без участия человека .

По данным DeepMind, AlphaCode достигла уровня 50-го процентиля среди участников соревнований на платформе Codeforces, что соответствует уровню среднего программиста-человека .

Технический стек и методология

Модель основана на архитектуре Transformer и предварительно обучена на данных GitHub, после чего дообучалась (fine-tuning) на датасетах с описаниями задач и их решениями . Ключевой особенностью системы является этап инференса:

Скептицизм экспертов

Несмотря на успех, профессиональные программисты, такие как Дмитрий Ваданао, настроены скептично . По его мнению, человеческий уровень всё еще «в световых годах» от ИИ. Основной аргумент Ваданао заключается в фундаментальном различии подходов: человек не генерирует тысячи ошибочных гипотез, а AlphaCode полагается на перебор и фильтрацию . Янник Килчер, в свою очередь, задается вопросом, возможно ли в будущем использование синтетических данных для обучения по принципу self-play, как это было в AlphaGo .

🧠 OpenAI и решение олимпиадных математических задач 11:34

OpenAI опубликовала результаты работы над языковыми моделями, обученными решать формальные математические задачи . В отличие от AlphaCode, здесь используется формальный язык описания, что позволяет автоматически проверять доказательства.

Особенности подхода OpenAI:

🛠 Новинки open-source и инструменты для ML 14:00

Янник Килчер представил подборку важных релизов для сообщества:

⚖️ Модерация контента и изменения в научном процессе 19:31

Конференция ICML 2022 вводит двухфазную систему рецензирования . Если в первой фазе статья получает две отрицательные рекомендации, она отклоняется автоматически. По мнению Янника Килчера, это повышает значимость «первого впечатления» от научной работы .

Meta (бывшая Facebook) представила систему Few-Shot Learner для борьбы с вредоносным контентом . Система примечательна тем, что:

  1. Она учитывает не только примеры текстов, но и текстовое описание самих правил (политик) платформы .
  2. Это позволяет модели быстрее адаптироваться к новым типам нарушений без масштабного переобучения.

Килчер иронично отмечает «кринжовый» маркетинг Meta в демонстрационном видео, где пользователи начинают радостно улыбаться после внедрения ИИ-фильтров, но признает важность задачи .

🧬 Лицо по ДНК: Прорыв или антиутопия? 23:59

Компания Corsight AI заявила о разработке системы, способной воссоздавать черты лица человека на основе его генетического материала (DNA-to-face) .

Основные тезисы обсуждения:

Вопрос о том, насколько этично использовать подобные технологии в правоохранительных органах, остается открытым для дискуссии .


💬 Цитаты

«99% программ, которые выдает AlphaCode, неверны, в то время как человеку не нужно генерировать тысячи гипотез.»

Янник Килчер (пересказывая Дмитрия Ваданао) 10:43

«Математика полна тривиальных и бессмысленных утверждений, поэтому выбор того, что именно доказывать, сам по себе является сложной задачей.»

Янник Килчер 13:33
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Few-shot learning
Метод машинного обучения, при котором модель обучается распознавать новые классы объектов на основе очень малого количества примеров.
Эквивариантность к сдвигу
Свойство модели, при котором сдвиг входного изображения приводит к соответствующему сдвигу результата, что важно для распознавания образов.
Сэмплирование
Процесс генерации множества случайных вариантов ответа (программ или текстов) моделью ИИ.
📊 Цифры
🗓 Хронология
  1. Февраль 2022 Выпуск AlphaCode от DeepMind и публикация результатов OpenAI по математическим задачам.
  2. 2022 Изменение процесса рецензирования на конференции ICML.
⚖️ Другая сторона
Искусственный интеллект AlphaCode DeepMind OpenAI Meta Yannic Kilcher