ИИ против Биг Фармы: как TrialKey предсказывает успех лекарств с точностью 90%

В современном мире разработки лекарств цена ошибки колоссальна: инвестиции в одну только вторую фазу клинических испытаний составляют в среднем 15 миллионов долларов, а вероятность провала остается пугающе высокой. Генеральный директор компании Opyl Саурабх Джайн (Saurabh Jain) и технический директор TrialKey Дэймон Рашид (Damon Rashid) разработали платформу TrialKey.ai, которая использует машинное обучение для прогнозирования исходов клинических испытаний с точностью до 90%.

📉 От ставок на спорт к предсказанию исходов в медицине 3:45

История создания TrialKey.ai началась с неожиданного сочетания экспертизы в экономике и азартных играх. Дэймон Рашид, по образованию экономист, долгое время работал в австралийском федеральном регуляторе (ACCC), аналогичном Департаменту юстиции США . Однако его истинной страстью был анализ данных в спортивном беттинге.

Рашид создавал модели для прогнозирования результатов скачек, собачьих бегов и матчей американских лиг (NHL, NBA, NFL) . Он отмечает, что в 2005 году рынок был «девственным»: простых логистических регрессий и профессионального анализа общедоступных данных было достаточно, чтобы иметь преимущество над букмекерами . Со временем рынок уплотнился, когда в него пришли тысячи статистиков, а букмекеры создали собственные отделы Data Science.

По мнению Рашида, современная биофармацевтическая отрасль напоминает рынок ставок 20-летней давности: в ней крутятся огромные деньги, но методы анализа данных остаются на удивление архаичными . Тот факт, что компании тратят миллионы долларов без глубокого предиктивного анализа, стал для него главным стимулом к созданию проекта. Соучредитель проекта Саурабх Джайн добавляет, что его собственный путь в машинном обучении начался еще 25 лет назад с написания 70 тысяч строк кода для предсказания исходов рака .

🧠 Технология: как извлечь смысл из «плохих» данных 15:08

Главным препятствием для внедрения ИИ в клинические исследования является качество исходных данных. Основной мировой реестр клинических исследований, clinicaltrials.gov, по оценке Рашида, представляет собой «плохо курируемый набор данных» .

Основные проблемы существующих баз данных:

Отсутствие отчетности: только около 17% всех проведенных испытаний имеют официально зарегистрированные результаты . Компании не обязаны отчитываться о неудачных фазах.
Разрозненность: данные по разным фазам одного и того же препарата часто не связаны между собой; порой невозможно отследить, какое испытание третьей фазы соответствует определенной второй фазе .
Неактуальность: тысячи успешных испытаний помечены как незавершенные просто потому, что данные в системе не обновлялись годами .

Чтобы решить эту проблему, команда TrialKey в течение трех лет создавала собственный массив данных, проанализировав 400 000 клинических испытаний . Система извлекает около 700 переменных из каждого исследования. Из них 300 переменных — структурированные (количество пациентов, страны, участники), а 400 — неструктурированные, скрытые в свободном тексте .

Для обработки неструктурированной информации используются современные языковые модели (LLM). Они извлекают такие нюансы, как:

Механизмы действия препаратов;
Критерии включения и исключения пациентов;
Количество «точек контакта» пациента с больницей .

Саурабх Джайн приводит пример: в онкологии частое посещение клиники не так критично для исхода, а в исследованиях БАДов или альтернативной терапии регулярное взаимодействие с персоналом (каждые две недели) становится ключевым фактором успеха .

🎯 Прогнозирование и дизайн испытаний 22:39

Система TrialKey не просто выдает вероятность успеха, но и работает как «симулятор клинических испытаний». Модель определяет веса переменных не на основе субъективного мнения экспертов, а через алгоритмы машинного обучения .

Одним из ключевых тезисов Дэймона Рашида является утверждение, что около 60% мировых клинических испытаний спроектированы плохо . Он считает, что в истории медицины существуют тысячи препаратов и медицинских устройств, которые могли бы быть эффективными, но провалились исключительно из-за ошибок в дизайне протокола .

Возможности платформы TrialKey:

Оптимизация параметров: пользователь может менять количество пациентов, дозировку (например, с 25 мг на 50 мг) или форму препарата (спрей вместо крема) и мгновенно видеть, как меняется прогноз .
Выбор юрисдикции: модель показывает, что некоторые страны систематически лучше справляются с определенными видами исследований.
Генетический контекст: Джайн упоминает кейс с витамином D, где модель предложила проводить исследование в Индонезии, а не в Австралии . Причина в том, что в солнечной Австралии у населения редко встречается дефицит этого витамина, а в мусульманской Индонезии из-за закрытой одежды и образа жизни уровень инсоляции ниже, что позволяет ярче проявить эффективность препарата .

📈 Инвестиционный потенциал и «печать одобрения» 11:11

Прогнозы системы уже используются для реальных инвестиций. Спикеры рассказали об успешной сделке с компанией Dimerix: модель предсказала успех их препарата для лечения редкого заболевания почек, когда акции стоили 10-12 центов . После объявления положительных результатов котировки выросли до 30 центов.

TrialKey выявляет рыночные аномалии: например, если вероятность успеха компании составляет 55%, а у всех её конкурентов в этой же нише — всего 10-20%, это делает компанию уникальным объектом для инвестиций .

В будущем Джайн и Рашид предсказывают появление «рейтинга TrialKey» — своего рода знака качества для стартапов, ищущих финансирование . Аналогично рейтингам энергоэффективности бытовой техники, этот показатель поможет инвесторам понять шансы на возврат капитала.

🚀 Будущее медицины без испытаний на людях? 38:51

Видение Саурабха Джайна простирается за пределы обычного анализа данных. Он полагает, что в будущем количество испытаний на людях сократится с текущих 35 000 в год до 5 000 . Обучение ИИ-моделей позволит проводить миллионы «виртуальных» испытаний.

Джайн проводит параллель с обучением вождению: через 10 лет будет считаться неэтичным выпускать ученика на дорогу без предварительной практики на симуляторе . Точно так же проведение клинического испытания на живых людях без предварительной проверки и оптимизации в AI-системе может стать вопросом профессиональной этики .