# ИИ против Биг Фармы: как TrialKey предсказывает успех лекарств с точностью 90%

Источник: https://www.youtube.com/watch?v=FKb4dxqoCp8
Канал: Eye on AI
Опубликовано: 06.05.2024

---

В современном мире разработки лекарств цена ошибки колоссальна: инвестиции в одну только вторую фазу клинических испытаний составляют в среднем 15 миллионов долларов, а вероятность провала остается пугающе высокой. Генеральный директор компании Opyl Саурабх Джайн (Saurabh Jain) и технический директор TrialKey Дэймон Рашид (Damon Rashid) разработали платформу TrialKey.ai, которая использует машинное обучение для прогнозирования исходов клинических испытаний с точностью до 90%.

## 📉 От ставок на спорт к предсказанию исходов в медицине
[[JUMP:03:45]]

История создания TrialKey.ai началась с неожиданного сочетания экспертизы в экономике и азартных играх. Дэймон Рашид, по образованию экономист, долгое время работал в австралийском федеральном регуляторе (ACCC), аналогичном Департаменту юстиции США [03:46]. Однако его истинной страстью был анализ данных в спортивном беттинге.

Рашид создавал модели для прогнозирования результатов скачек, собачьих бегов и матчей американских лиг (NHL, NBA, NFL) [04:14]. Он отмечает, что в 2005 году рынок был «девственным»: простых логистических регрессий и профессионального анализа общедоступных данных было достаточно, чтобы иметь преимущество над букмекерами [07:07]. Со временем рынок уплотнился, когда в него пришли тысячи статистиков, а букмекеры создали собственные отделы Data Science.

По мнению Рашида, современная биофармацевтическая отрасль напоминает рынок ставок 20-летней давности: в ней крутятся огромные деньги, но методы анализа данных остаются на удивление архаичными [08:12]. Тот факт, что компании тратят миллионы долларов без глубокого предиктивного анализа, стал для него главным стимулом к созданию проекта. Соучредитель проекта Саурабх Джайн добавляет, что его собственный путь в машинном обучении начался еще 25 лет назад с написания 70 тысяч строк кода для предсказания исходов рака [05:07].

## 🧠 Технология: как извлечь смысл из «плохих» данных
[[JUMP:15:08]]

Главным препятствием для внедрения ИИ в клинические исследования является качество исходных данных. Основной мировой реестр клинических исследований, clinicaltrials.gov, по оценке Рашида, представляет собой «плохо курируемый набор данных» [16:02].

Основные проблемы существующих баз данных:

*   **Отсутствие отчетности:** только около 17% всех проведенных испытаний имеют официально зарегистрированные результаты [16:26]. Компании не обязаны отчитываться о неудачных фазах.
*   **Разрозненность:** данные по разным фазам одного и того же препарата часто не связаны между собой; порой невозможно отследить, какое испытание третьей фазы соответствует определенной второй фазе [18:37].
*   **Неактуальность:** тысячи успешных испытаний помечены как незавершенные просто потому, что данные в системе не обновлялись годами [18:49].

Чтобы решить эту проблему, команда TrialKey в течение трех лет создавала собственный массив данных, проанализировав 400 000 клинических испытаний [15:10]. Система извлекает около 700 переменных из каждого исследования. Из них 300 переменных — структурированные (количество пациентов, страны, участники), а 400 — неструктурированные, скрытые в свободном тексте [19:41].

Для обработки неструктурированной информации используются современные языковые модели (LLM). Они извлекают такие нюансы, как:

*   Механизмы действия препаратов;
*   Критерии включения и исключения пациентов;
*   Количество «точек контакта» пациента с больницей [20:44].

Саурабх Джайн приводит пример: в онкологии частое посещение клиники не так критично для исхода, а в исследованиях БАДов или альтернативной терапии регулярное взаимодействие с персоналом (каждые две недели) становится ключевым фактором успеха [21:22].

## 🎯 Прогнозирование и дизайн испытаний
[[JUMP:22:39]]

Система TrialKey не просто выдает вероятность успеха, но и работает как «симулятор клинических испытаний». Модель определяет веса переменных не на основе субъективного мнения экспертов, а через алгоритмы машинного обучения [22:52].

Одним из ключевых тезисов Дэймона Рашида является утверждение, что около 60% мировых клинических испытаний спроектированы плохо [40:35]. Он считает, что в истории медицины существуют тысячи препаратов и медицинских устройств, которые могли бы быть эффективными, но провалились исключительно из-за ошибок в дизайне протокола [40:49].

Возможности платформы TrialKey:

1.  **Оптимизация параметров:** пользователь может менять количество пациентов, дозировку (например, с 25 мг на 50 мг) или форму препарата (спрей вместо крема) и мгновенно видеть, как меняется прогноз [13:38].
2.  **Выбор юрисдикции:** модель показывает, что некоторые страны систематически лучше справляются с определенными видами исследований.
3.  **Генетический контекст:** Джайн упоминает кейс с витамином D, где модель предложила проводить исследование в Индонезии, а не в Австралии [34:44]. Причина в том, что в солнечной Австралии у населения редко встречается дефицит этого витамина, а в мусульманской Индонезии из-за закрытой одежды и образа жизни уровень инсоляции ниже, что позволяет ярче проявить эффективность препарата [35:10].

## 📈 Инвестиционный потенциал и «печать одобрения»
[[JUMP:11:11]]

Прогнозы системы уже используются для реальных инвестиций. Спикеры рассказали об успешной сделке с компанией Dimerix: модель предсказала успех их препарата для лечения редкого заболевания почек, когда акции стоили 10-12 центов [12:45]. После объявления положительных результатов котировки выросли до 30 центов.

 TrialKey выявляет рыночные аномалии: например, если вероятность успеха компании составляет 55%, а у всех её конкурентов в этой же нише — всего 10-20%, это делает компанию уникальным объектом для инвестиций [25:50].

В будущем Джайн и Рашид предсказывают появление «рейтинга TrialKey» — своего рода знака качества для стартапов, ищущих финансирование [44:34]. Аналогично рейтингам энергоэффективности бытовой техники, этот показатель поможет инвесторам понять шансы на возврат капитала.

## 🚀 Будущее медицины без испытаний на людях?
[[JUMP:38:51]]

Видение Саурабха Джайна простирается за пределы обычного анализа данных. Он полагает, что в будущем количество испытаний на людях сократится с текущих 35 000 в год до 5 000 [39:03]. Обучение ИИ-моделей позволит проводить миллионы «виртуальных» испытаний.

Джайн проводит параллель с обучением вождению: через 10 лет будет считаться неэтичным выпускать ученика на дорогу без предварительной практики на симуляторе [39:29]. Точно так же проведение клинического испытания на живых людях без предварительной проверки и оптимизации в AI-системе может стать вопросом профессиональной этики [39:41].