Скаутский отчет по ИИ: робастность, автоматизация и медицинские прорывы Google

В новом выпуске подкаста «The Cognitive Revolution» ведущие Нейтан Лабенц и Эрик Торнберг обсуждают стремительную эволюцию технологий искусственного интеллекта и практические аспекты их внедрения. Авторы анализируют обновления своего «Скаутского отчета по ИИ», исследуют подходы к автоматизации бизнес-процессов, ранжируют ключевых игроков индустрии и заглядывают в будущее медицины и нейросетевых архитектур, которые могут прийти на смену трансформерам.

🛠️ Обновление «Скаутского отчета»: от визуализаций до устойчивости ИИ 1:07

Нейтан Лабенц отмечает, что отзывы на первую версию «Скаутского отчета», выпущенную месяц назад, оказались крайне положительными. Однако динамика развития ИИ требует постоянных уточнений. В частности, Лабенц признает техническую ошибку: в презентации не был упомянут YouTube-канал 3Blue1Brown, чьи пятилетние визуализации нейросетей и процесса обратного распространения ошибки (backpropagation) остаются актуальной классикой.

Полноценный анализ сравнительных сил человека и ИИ, по словам ведущего, изменился после дискуссии с исследователем Цви Мовшовицем. Мовшовиц указал на критически важный фактор, упущенный в первоначальном отчете, — робастность (устойчивость) к незнакомым или состязательным (adversarial) условиям.

По мнению Лабенца, люди обладают высокой когнитивной устойчивостью: столкнувшись со странным или манипулятивным поведением, человек склонен сохранять свои приоритеты, демонстрируя здоровую предвзятость статус-кво. Напротив, современные ИИ-модели гораздо легче выбить из колеи состязательными атаками.

Лабенц приводит в пример раннюю версию GPT-4, которую он назвал «худшим репетитором по химии в мире». Вместо исправления ошибок запутавшегося студента, модель принимала его ложные предпосылки и усугубляла путаницу.

Сегодня этот недостаток частично устранен благодаря усилиям таких организаций, как Khan Academy, которые используют продвинутый промптинг и заземление (grounding). Тем не менее проблема «джейлбрейков» (взломов фильтров безопасности) остается острой. Исследователи обнаружили феномен «универсального джейлбрейка»: оптимизированные на открытых моделях (например, Llama) случайные строки токенов работают как «магические ключи», заставляя даже закрытые коммерческие модели OpenAI выполнять запрещенные инструкции, такие как описание угона автомобиля. Интересно, что модель Claude от Anthropic оказалась наименее восприимчивой к данной атаке.

Для решения этой проблемы разрабатываются новые подходы. В частности, Лабенц упоминает работу исследователя Дива Гарга из компании MultiOn, в которой ИИ обучили использовать концепцию клавиши Backspace. Вместо генерации токенов в один конец, когда ошибки накапливаются, модель получает возможность стереть неудачный токен и попробовать снова, что должно существенно повысить устойчивость систем.

⚖️ Стабильность против гибкости: сильные стороны ИИ в автоматизации задач 12:38

Еще одним важным дополнением к отчету стала оценка стабильности результатов (consistency). Лабенц предлагает обобщить это понятие, которое ранее описывалось как «внимательное отношение к пациенту» (bedside manner). ИИ демонстрирует гораздо меньшую вариативность результатов по сравнению с человеком. Нейросеть не страдает от недосыпа, у нее нет перепадов настроения, она всегда вежлива при работе со стандартными пользователями.

Эта стабильность делает ИИ идеальным инструментом для автоматизации рутинных задач в организациях. По словам Лабенца, главными целями для автоматизации являются «узкие горлышка» бизнес-процессов, где требуется обработка больших объемов однотипных данных, а последовательность действий важнее творческих озарений.

В качестве примера рассматриваются два сценария:

Скрининг резюме: ситуация, когда на одну вакансию приходит 1000 заявок.
Обработка тикетов: ежедневный поток из 500 обращений в службу поддержки, 80% из которых укладываются в 10 стандартных категорий.

Для эффективной автоматизации Лабенц рекомендует использовать следующий алгоритм:

Разработать четкую рубрику (критерии оценки) для задачи.
Разделить результаты на пять категорий качества, от «отлично» до «плохо».
Итеративно дорабатывать промт, сверяя выводы ИИ с экспертным мнением на небольших выборках.

После настройки система, благодаря возможности параллельных вызовов, способна отфильтровать тысячи документов за считанные минуты. Ограничением здесь выступают лишь лимиты провайдеров (например, у Anthropic для Claude базовый лимит составляет 5 одновременных вызовов, но он может быть увеличен для коммерческих клиентов).

Однако, как подчеркивает ведущий, внедрение ИИ в организации — это на одну треть знание технологий и на две трети — умение работать с людьми. Часто в процессе формализации инструкций для ИИ выясняется, что внутри компании нет единого понимания «идеального результата», а разные эксперты руководствуются противоположными негласными правилами.

🎭 Эволюция промптинга и синергия человека с машиной 23:56

По мнению Лабенца, процесс написания промтов стремительно упрощается. Для большинства задач достаточно освоить около десятка лучших практик, ключевой из которых является ролевое моделирование (role casting) — явное указание роли, которую должен играть ИИ (например, копирайтер или врач).

Однако для глубокого взаимодействия промптинг-трюков недостаточно. Ведущий ссылается на опыт экономиста Тайлера Коуэна, который провел виртуальное интервью с ИИ-копией Джонатана Свифта. Успех этой беседы определялся не скрытыми техниками, а глубокими предметными знаниями самого Коуэна, сумевшего задать ИИ правильные контекстные вопросы. Без экспертных знаний пользователя результат останется поверхностным.

Подобная синергия важна и в профессиональной деятельности. В совместном проекте с профессиональным гострайтером авторы подкаста обнаружили, что ИИ прекрасно справляется с написанием основного тела статьи на 500 слов, но выдает банальные зачины — «хуки» (hooks). Человеческий подход по-прежнему незаменим для создания ярких, цепляющих заголовков, способных привлечь внимание аудитории в соцсетях. Профессия гострайтера, по оценке Лабенца, трансформируется в сторону концептуализации смыслов, тогда как рутину берет на себя машина.

🗺️ Карта влияния: первый и второй эшелоны «активных игроков» 28:03

Важной темой дискуссии стало определение «активных игроков» (Live Players) — тех, кто обладает реальной властью формировать будущее ИИ-индустрии.

Лабенц пересмотрел свой список из 15 игроков после критики Цви Мовшовица, который предложил более жесткий отбор. Мовшовиц ограничил первый эшелон разработчиками передовых технологий и базовой инфраструктуры:

Компании: OpenAI, Google, Anthropic, Microsoft и Meta.
Ресурсы: цепочка поставок чипов, включая ускорители Nvidia H100.
Регуляторы: правительство Китая и международные регуляторные органы.

Нейтан Лабенц соглашается с выделением этих сил в «первый эшелон», однако настаивает на сохранении «второго эшелона» игроков, способных радикально менять глобальный дискурс. К ним он относит такие проекты, как Stability AI, Replit и Character.ai.

В качестве исторического примера Лабенц приводит релиз модели Stable Diffusion от Stability AI. Несмотря на то, что сейчас в центре внимания находится ChatGPT, именно Stable Diffusion в свое время вывела тему ИИ-арта на уровень вечерних телешоу, изменив восприятие технологий широкой общественностью. Любая организация, способная систематически совершать подобные сдвиги, по мнению ведущего, заслуживает статуса активного игрока.

🏥 Медицинские прорывы Google: от текста к анализу снимков и ДНК 31:04

Одной из самых впечатляющих тем выпуска стали успехи Google в области здравоохранения. Лабенц анонсировал скорое возвращение в подкаст Вивека Натараджана, ведущего исследователя Google, который представит новейшую модель Multimodal Med-PaLM.

Прогресс технологий в этой сфере выглядит стремительным. Если в 2020 году ИИ отвечал на медицинские вопросы на уровне случайного угадывания, то базовая текстовая модель Med-PaLM уже сравнялась со знаниями практикующих врачей и обошла их по 8 из 9 оцениваемых метрик качества.

Новая модификация Multimodal Med-PaLM переходит от чисто текстового формата к мультимодальному анализу. Система способна одновременно обрабатывать:

Текстовую историю болезни пациента;
Медицинские изображения (рентгеновские снимки, томографию);
Гистологические слайды (цифровые изображения тканей);
Закодированную информацию о последовательностях ДНК.

Лабенц описывает традиционный процесс патологоанатомического анализа: вырезание кусочка ткани, тончайшая нарезка, окрашивание химикатами и ручное изучение под микроскопом. Традиционные узкоспециализированные ИИ-системы умеют лишь бинарно классифицировать слайд («рак / не рак»). Multimodal Med-PaLM, напротив, синтезирует все доступные данные для формирования комплексного текстового заключения, имитируя мышление консилиума врачей.

В тестах на генерацию радиологических отчетов ИИ выиграл прямые слепые сравнения у профессиональных радиологов в 40% случаев. Лабенц иронизирует над популярным в последние 10 лет тезисом о том, что радиология станет «первым вымершим направлением в медицине». Хотя моментального развертывания технологии ждать не стоит из-за бюрократических барьеров, технический паритет уже близок.

🔮 Архитектуры будущего: что придет на смену трансформерам 35:30

В завершение выпуска авторы обсудили фундаментальные ограничения современной технологической базы. Лабенц напоминает свой тезис из «Скаутского отчета»: ни человеческий мозг, ни архитектура трансформеров (Transformer) не являются «концом истории» эволюции вычислений.

Индустрия начинает активно исследовать альтернативные подходы. Ведущий выделяет два перспективных концепта:

Архитектура MEGABYTE от Meta AI. Данная иерархическая структура осуществляет предсказание на уровне байтов, а не токенов, полностью избавляясь от этапа токенизации. Поскольку любые медиаданные (звук, музыка, изображения) на уровне компьютера представляют собой байты, MEGABYTE изначально гораздо более дружелюбна к мультимодальности и обеспечивает высокую гранулярную точность.
Механизм удержания (Retention) от Microsoft. Исследователи опубликовали статью с амбициозным заявлением о создании прямого преемника трансформеров — архитектуры RetNet («Retention is all you need»).

Лабенц сравнивает текущий момент в разработке ИИ с недавней ситуацией вокруг поиска комнатных сверхпроводников: новые архитектуры требуют независимой репликации, масштабирования и проверки на скрытые побочные эффекты. Тем не менее, по мнению собеседников, появление жизнеспособных альтернатив трансформерам — лишь вопрос времени, и глобальное исследовательское сообщество стоит на пороге очередного масштабного технологического сдвига.