Янник Кильшер: «Любое полезное применение ИИ можно превратить в зло, просто сменив знак»

В новом выпуске ML News Янник Кильшер разбирает парадоксальные последствия прогресса в области ИИ: от систем, способных мгновенно проектировать тысячи видов химического оружия, до нейросетей, восстанавливающих утраченные фрагменты древнегреческих текстов. В центре внимания также оказывается возобновившаяся дискуссия о «тупике» глубокого обучения и перспективах гибридных систем.

☣️ Темная сторона биофармацевтики: 40 000 ядов за 6 часов 6:50

Технологии ИИ, предназначенные для спасения жизней, могут быть инвертированы с пугающей легкостью. Янник Кильшер обсуждает недавний эксперимент исследователей в области поиска лекарств, результаты которого опубликованы в журнале Nature Machine Intelligence .

Суть эксперимента: Группа ученых, работающих над минимизацией токсичности новых лекарств, решила «перевернуть» свою модель. Вместо того чтобы поощрять систему искать нетоксичные соединения, они изменили знак функции потерь (objective function) на противоположный .
Результат: Всего за 6 часов ИИ сгенерировал 40 000 потенциальных боевых отравляющих веществ. В списке оказались как уже известные нервно-паралитические агенты (например, VX), так и совершенно новые молекулы, которые, по прогнозам модели, могут быть еще более летальными .
Доступность: Янник подчеркивает, что для проведения такой манипуляции не требуется сверхспособностей — достаточно базовых знаний в области машинного обучения и поиска лекарств .

По мнению Янника Кильшера, любая «добрая» технология является лишь одной стороной медали. Почти любой метод, делающий ИИ более полезным или правдивым, можно превратить в «злой», просто изменив один бит в целевой функции . Это ставит перед сообществом серьезные вопросы о безопасности исследований и необходимости пересмотра открытости данных в биохимии .

🏛️ Ithaca: Нейросети на службе у историков 4:18

DeepMind представила систему Ithaca — современную языковую модель, предназначенную для реставрации поврежденных древнегреческих текстов на каменных плитах .

Функционал: Ithaca не просто заполняет пропуски в тексте. Она также выдает вероятностное распределение географического происхождения артефакта и оценивает дату создания надписи .
Эффективность: Хотя Ithaca сильна сама по себе, Кильшер отмечает, что лучший результат достигается при совместной работе человека и машины. Команда DeepMind приложила много усилий для создания интерфейса, позволяющего историкам эффективно взаимодействовать с предсказаниями модели .
Технические детали: Несмотря на то, что вводные данные представляют собой простой текст, а не изображения, модель демонстрирует высокую точность. Код проекта открыт, а ознакомиться с результатами можно в статье в журнале Nature .

🧱 Уперлось ли глубокое обучение в «стену»? 10:06

Янник анализирует резонансную статью Гэри Маркуса «Deep Learning Is Hitting a Wall», опубликованную в Nautilus. Маркус, известный скептик современного подхода «просто масштабируй нейросети», утверждает, что текущая парадигма достигла предела .

Аргументы Гэри Маркуса:

Необходимость символических методов: Маркус настаивает на синтезе нейросетей с символическими вычислениями (логическими системами, манипулирующими дискретными символами) .
Проблема доверия: Он критикует использование моделей вроде GPT-3 в критически важных областях (например, в беспилотных автомобилях), указывая на их склонность к галлюцинациям и отсутствие понимания фактов .
Net Hack Challenge: В качестве примера Маркус приводит соревнование по игре Net Hack, где классические боты с жестко прописанными правилами (символический подход) до сих пор превосходят нейросетевых агентов .

Контраргументы Янника Кильшера:

Нейронное «железо» мозга: Хотя человек способен к логике, в мозгу нет отдельного «символического процессора»; вся логика является эмерджентным свойством нейронной структуры .
Недооценка эмерджентности: По мнению Кильшера, критики масштабирования часто игнорируют внезапное появление новых способностей (например, in-context learning) при увеличении моделей .
Целеполагание: Критика GPT-3 за «ложь» несправедлива, так как модель обучалась предсказывать следующий токен из интернета, а не быть энциклопедией .

Несмотря на споры, Янник соглашается с финальным выводом Маркуса: гибридные подходы, сочетающие гибкость нейросетей и строгость логики, сегодня выглядят как одно из самых перспективных направлений .

🔍 Проверка фактов: GopherCite и Red Bull 19:42

DeepMind представила GopherCite — версию своей языковой модели, которая подкрепляет ответы цитатами из проверенных источников .

Система призвана бороться с «галлюцинациями» ИИ. Однако Кильшер обращает внимание на забавный казус в примерах: на вопрос «Что дает употребление Red Bull?», модель ответила «Крылья», сославшись на рекламный слоган . Янник считает, что оценивать модели на «фактическую истинность» в таких случаях не совсем корректно, так как даже человек, скорее всего, ответил бы так же, опираясь на культурный контекст или рекламу .

🛠️ Коротко о других новостях 22:45

Рыцарский титул: Йошуа Бенджио был удостоен ордена Почетного легиона Франции за развитие сотрудничества в области науки между Францией и Канадой .
Забавный SMM: Meta AI (организация, признанная экстремистской в РФ), анонсируя дебаты Яна Лекуна и Йошуа Бенджио, случайно отметила в Twitter пародийный аккаунт «Bored Bengio» вместо настоящего ученого .
Программирование на естественном языке: Эндрю Мейн показал, как с помощью модели OpenAI CodeX можно создавать игры (например, клон Zelda или Wordle), просто описывая логику в комментариях . Однако Янник отмечает: чтобы это работало, нужно все еще «думать как программист» .
Спор на миллиард: Джон Кармак и Джефф Этвуд заключили пари . Кармак считает, что к 1 января 2030 года в крупных городах появятся полностью автономные беспилотники 5-го уровня; Этвуд убежден в обратном, мотивируя это чрезвычайной сложностью проблемы .
Эмоции свиней: Ученые из Копенгагенского университета натренировали ИИ распознавать эмоции свиней по их хрюканью. Выяснилось, что короткое похрюкивание означает радость .