Вивек Натараджан и Анил Пелипу: «Путь к гениям в дата-центрах стал очевидным»

🧬 Новая эра медицины и науки: Как Google Agents меняют правила игры 0:00

Недавние исследования команды Google DeepMind под руководством Вивека Натараджана (Vivek Natarajan) и Анила Пелипу (Anil Pelipu) демонстрируют порог, за которым искусственный интеллект начинает не просто автоматизировать рутину, а становиться полноценным научным и клиническим партнёром человека. Разработанные ими системы — Amy (интеллектуальный медицинский исследователь) и Co-scientist (агент-учёный) — показывают способность превосходить специалистов в диагностике, анализе лечения и генерации гипотез, совершая открытия, которые человек ещё не успел опубликовать. Примечательно, что эти результаты были достигнуты не за счёт специализированного дообучения моделей, а благодаря продвинутым техникам промптинга, агентной архитектуре и эффективному использованию контекста.

🏥 Amy: Искусственный интеллект как лечащий врач 7:43

Система Amy (Articulate Medical Intelligence Explorer) представляет собой прорыв в области медицинской диагностики и управления лечением.

От диагностики к терапии

Исследования показывают, что Amy уже способна превосходить врачей общей практики не только в постановке диагнозов, но и в логическом обосновании методов лечения.

Методология: В отличие от ранних моделей, сфокусированных на простых вопросах, Amy тестировалась на симулированных консультациях с использованием профессиональных актёров, имитирующих реальный клинический процесс с многократными визитами.
Результаты: ИИ успешно справляется с долгосрочным управлением состоянием пациента, определяя необходимые тесты и обосновывая выбор терапии на основе клинических рекомендаций и инструкций к препаратам.
Ограничения: Несмотря на успех, авторы подчёркивают, что это пока текстовые симуляции, а не работа с реальными пациентами, где сценарий может быть непредсказуемым.

Специализированная медицина: Кардиология и онкология

В более узких областях медицины система демонстрирует результаты, приближающиеся к уровню врачей-аттендингов (старших врачей), и уже превосходит медицинских ординаторов.

Синергия: Исследователи обнаружили, что кардиологи, работающие в связке с Amy, показывают драматический рост эффективности по большинству метрик. По мнению Анила, ИИ и человек отлично дополняют друг друга, так как их типы ошибок существенно различаются.
Будущее без «силосов»: По словам Вивека, текущее разделение медицины на узкие специальности (кардиология, неврология) во многом обусловлено когнитивными ограничениями человеческого мозга. ИИ, способный интегрировать знания из всех дисциплин, может кардинально изменить эту структуру, предоставляя экспертный уровень помощи даже там, где очереди к узким специалистам растягиваются на 18 месяцев.

🧪 Co-scientist: Новый «учёный» в лаборатории 21:28

Система Co-scientist была протестирована в полностью автономном режиме на трёх сложных научных задачах, требующих синтеза знаний и выдвижения оригинальных гипотез.

Задачи: Перепрофилирование лекарств, идентификация новых терапевтических мишеней в клетках и исследование механизмов резистентности бактерий.
Эврика-момент: В задаче по пониманию резистентности к препаратам Co-scientist предложил механизм, который был обнаружен экспериментально группой партнёров Google в Лондоне, но ещё не был опубликован. По воспоминаниям Вивека, учёный Жозе был настолько поражён совпадением результатов, что в шутку обвинил команду в чтении его личной электронной почты.
Надёжность: В отличие от ранних LLM, которые генерировали тысячи «мусорных» идей, Co-scientist использует итеративный процесс проверки и ранжирования, что делает его гипотезы гораздо более качественными.

🛠 Уроки для разработчиков агентов 3:54

Авторы выделяют три ключевых компонента успеха своих систем, которые могут быть применены в сторонних проектах:

Структурированное рассуждение: Эффективнее, чем свободный ход мыслей (chain-of-thought). Принудительное прохождение через заранее заданные этапы анализа (например, сбор жалоб -> анализ -> постановка целей -> план лечения) значительно повышает точность.
Доступ к инструментам: Возможность использовать внешний поиск (интернет) или специализированное ПО (например, AlphaFold) вносит «энтропию» и позволяет системе выходить за рамки заученных данных.
Турнирная оценка: Использование турнирных методов сравнения нескольких гипотез помогает выбрать лучшее решение из множества сгенерированных вариантов.

🧠 Проблема «длинного контекста» 49:30

Одной из фундаментальных технологий, обеспечивших прогресс, стала работа с контекстным окном в миллионы токенов.

Эффективность: Вивек и Анил отмечают, что использование долгого контекста Gemini 1.5 и 2.5 позволяет избежать сложных инженерных систем RAG (поиска по базе) и тренировать агентов гораздо проще.
Уникальность: По мнению Вивека, важность длинного контекста в индустрии пока недооценена, так как «виральные» моменты с этим инструментом сложнее показать в коротком твите, чем возможности генерации картинок.
Цена: На текущем этапе стоимость полноценного цикла генерации гипотез для сложной задачи, включая все турнирные сравнения, составляет менее $10 на инфраструктуре Google Cloud.