ИИ против математиков и токсичности: обзор DeepMind, OpenAI и Meta

В новом выпуске ML News исследователь машинного обучения Янник Килчер (Yannic Kilcher) разбирает последние прорывы в индустрии ИИ: от системы AlphaCode, соревнующейся с программистами-людьми, до методов OpenAI по решению олимпиадных задач по математике. В центре внимания также оказываются инструменты для разработчиков, изменения в научной среде и этические вопросы использования генетических данных для распознавания лиц.

🚀 AlphaCode: ИИ выходит на уровень соревновательного программирования 3:19

DeepMind представила AlphaCode — систему, способную решать сложные задачи по программированию, сформулированные на естественном языке . В отличие от простых упражнений, эти задачи требуют не только знания синтаксиса, но и понимания алгоритмов, логики и обработки условий.

Процесс работы AlphaCode выглядит следующим образом:

Понимание текста: Модель получает описание задачи (например, манипуляции со строками с использованием клавиши backspace) .
Генерация кода: ИИ самостоятельно пишет программу на Python, которая считывает данные и выводит ответ .
Автономность: Весь цикл проходит без участия человека .

По данным DeepMind, AlphaCode достигла уровня 50-го процентиля среди участников соревнований на платформе Codeforces, что соответствует уровню среднего программиста-человека .

Технический стек и методология

Модель основана на архитектуре Transformer и предварительно обучена на данных GitHub, после чего дообучалась (fine-tuning) на датасетах с описаниями задач и их решениями . Ключевой особенностью системы является этап инференса:

Массовое сэмплирование: Модель генерирует огромное количество вариантов программ (миллионы) .
Фильтрация: Более 99% сгенерированных решений отсеиваются с использованием примеров входных и выходных данных, данных в условии задачи .
Кластеризация: Оставшиеся решения группируются по схожести алгоритмов, чтобы выбрать 10 наиболее вероятных вариантов для финальной отправки .

Скептицизм экспертов

Несмотря на успех, профессиональные программисты, такие как Дмитрий Ваданао, настроены скептично . По его мнению, человеческий уровень всё еще «в световых годах» от ИИ. Основной аргумент Ваданао заключается в фундаментальном различии подходов: человек не генерирует тысячи ошибочных гипотез, а AlphaCode полагается на перебор и фильтрацию . Янник Килчер, в свою очередь, задается вопросом, возможно ли в будущем использование синтетических данных для обучения по принципу self-play, как это было в AlphaGo .

🧠 OpenAI и решение олимпиадных математических задач 11:34

OpenAI опубликовала результаты работы над языковыми моделями, обученными решать формальные математические задачи . В отличие от AlphaCode, здесь используется формальный язык описания, что позволяет автоматически проверять доказательства.

Особенности подхода OpenAI:

Бесконечное пространство действий: В математике можно изобретать новые сущности, что делает поиск решения сложнее, чем в шахматах .
Автоматизация учебного плана: Модель начинает с простых задач и, находя решения, добавляет их в свой обучающий набор, постепенно переходя к более сложным уровням .
Успехи: Система смогла решить ряд задач Международной математической олимпиады (IMO), значительно опередив традиционные методы поиска доказательств .

🛠 Новинки open-source и инструменты для ML 14:00

Янник Килчер представил подборку важных релизов для сообщества:

GPT-NeoX-20B: Организация EleutherAI выпустила в открытый доступ модель с 20 миллиардами параметров .
StyleGAN XL: Новая работа по масштабированию StyleGAN на датасет ImageNet. Модель теперь поддерживает разрешение до 1024x1024 и сохраняет свойства эквивариантности к сдвигу .
ar5iv.org: Веб-сервис, конвертирующий PDF-статьи с сайта arXiv в формат HTML5, что делает чтение формул и переход по ссылкам значительно удобнее .
DietGPU: Алгоритм сжатия данных без потерь для GPU от Nvidia, ускоряющий распределенное обучение в сетях с низкой пропускной способностью .
FFCV: Библиотека для ускорения обучения нейросетей за счет оптимизации загрузки данных .

⚖️ Модерация контента и изменения в научном процессе 19:31

Конференция ICML 2022 вводит двухфазную систему рецензирования . Если в первой фазе статья получает две отрицательные рекомендации, она отклоняется автоматически. По мнению Янника Килчера, это повышает значимость «первого впечатления» от научной работы .

Meta (бывшая Facebook) представила систему Few-Shot Learner для борьбы с вредоносным контентом . Система примечательна тем, что:

Она учитывает не только примеры текстов, но и текстовое описание самих правил (политик) платформы .
Это позволяет модели быстрее адаптироваться к новым типам нарушений без масштабного переобучения.

Килчер иронично отмечает «кринжовый» маркетинг Meta в демонстрационном видео, где пользователи начинают радостно улыбаться после внедрения ИИ-фильтров, но признает важность задачи .

🧬 Лицо по ДНК: Прорыв или антиутопия? 23:59

Компания Corsight AI заявила о разработке системы, способной воссоздавать черты лица человека на основе его генетического материала (DNA-to-face) .

Основные тезисы обсуждения:

Критика: Скептики утверждают, что возраст и внешняя среда влияют на внешность сильнее, чем гены, и ИИ не сможет вычислить точное расстояние между глазами в миллиметрах .
Позиция Янника: Килчер считает критику излишней. По его словам, дети похожи на родителей именно из-за генетики, и обучение алгоритмов распознавания лиц на основе специфических генетических признаков (а не миллиметровых пропорций) вполне вероятно .

Вопрос о том, насколько этично использовать подобные технологии в правоохранительных органах, остается открытым для дискуссии .