ИИ против Биг Фармы: как TrialKey предсказывает успех лекарств с точностью 90%

Eye on AI 759 51 мин 4 мин 06.05.2024
Главное

В современном мире разработки лекарств цена ошибки колоссальна: инвестиции в одну только вторую фазу клинических испытаний составляют в среднем 15 миллионов долларов, а вероятность провала остается пугающе высокой. Генеральный директор компании Opyl Саурабх Джайн (Saurabh Jain) и технический директор TrialKey Дэймон Рашид (Damon Rashid) разработали платформу TrialKey.ai, которая использует машинное обучение для прогнозирования исходов клинических испытаний с точностью до 90%.

📉 От ставок на спорт к предсказанию исходов в медицине 3:45

История создания TrialKey.ai началась с неожиданного сочетания экспертизы в экономике и азартных играх. Дэймон Рашид, по образованию экономист, долгое время работал в австралийском федеральном регуляторе (ACCC), аналогичном Департаменту юстиции США . Однако его истинной страстью был анализ данных в спортивном беттинге.

Рашид создавал модели для прогнозирования результатов скачек, собачьих бегов и матчей американских лиг (NHL, NBA, NFL) . Он отмечает, что в 2005 году рынок был «девственным»: простых логистических регрессий и профессионального анализа общедоступных данных было достаточно, чтобы иметь преимущество над букмекерами . Со временем рынок уплотнился, когда в него пришли тысячи статистиков, а букмекеры создали собственные отделы Data Science.

По мнению Рашида, современная биофармацевтическая отрасль напоминает рынок ставок 20-летней давности: в ней крутятся огромные деньги, но методы анализа данных остаются на удивление архаичными . Тот факт, что компании тратят миллионы долларов без глубокого предиктивного анализа, стал для него главным стимулом к созданию проекта. Соучредитель проекта Саурабх Джайн добавляет, что его собственный путь в машинном обучении начался еще 25 лет назад с написания 70 тысяч строк кода для предсказания исходов рака .

🧠 Технология: как извлечь смысл из «плохих» данных 15:08

Главным препятствием для внедрения ИИ в клинические исследования является качество исходных данных. Основной мировой реестр клинических исследований, clinicaltrials.gov, по оценке Рашида, представляет собой «плохо курируемый набор данных» .

Основные проблемы существующих баз данных:

Чтобы решить эту проблему, команда TrialKey в течение трех лет создавала собственный массив данных, проанализировав 400 000 клинических испытаний . Система извлекает около 700 переменных из каждого исследования. Из них 300 переменных — структурированные (количество пациентов, страны, участники), а 400 — неструктурированные, скрытые в свободном тексте .

Для обработки неструктурированной информации используются современные языковые модели (LLM). Они извлекают такие нюансы, как:

Саурабх Джайн приводит пример: в онкологии частое посещение клиники не так критично для исхода, а в исследованиях БАДов или альтернативной терапии регулярное взаимодействие с персоналом (каждые две недели) становится ключевым фактором успеха .

🎯 Прогнозирование и дизайн испытаний 22:39

Система TrialKey не просто выдает вероятность успеха, но и работает как «симулятор клинических испытаний». Модель определяет веса переменных не на основе субъективного мнения экспертов, а через алгоритмы машинного обучения .

Одним из ключевых тезисов Дэймона Рашида является утверждение, что около 60% мировых клинических испытаний спроектированы плохо . Он считает, что в истории медицины существуют тысячи препаратов и медицинских устройств, которые могли бы быть эффективными, но провалились исключительно из-за ошибок в дизайне протокола .

Возможности платформы TrialKey:

  1. Оптимизация параметров: пользователь может менять количество пациентов, дозировку (например, с 25 мг на 50 мг) или форму препарата (спрей вместо крема) и мгновенно видеть, как меняется прогноз .
  2. Выбор юрисдикции: модель показывает, что некоторые страны систематически лучше справляются с определенными видами исследований.
  3. Генетический контекст: Джайн упоминает кейс с витамином D, где модель предложила проводить исследование в Индонезии, а не в Австралии . Причина в том, что в солнечной Австралии у населения редко встречается дефицит этого витамина, а в мусульманской Индонезии из-за закрытой одежды и образа жизни уровень инсоляции ниже, что позволяет ярче проявить эффективность препарата .

📈 Инвестиционный потенциал и «печать одобрения» 11:11

Прогнозы системы уже используются для реальных инвестиций. Спикеры рассказали об успешной сделке с компанией Dimerix: модель предсказала успех их препарата для лечения редкого заболевания почек, когда акции стоили 10-12 центов . После объявления положительных результатов котировки выросли до 30 центов.

TrialKey выявляет рыночные аномалии: например, если вероятность успеха компании составляет 55%, а у всех её конкурентов в этой же нише — всего 10-20%, это делает компанию уникальным объектом для инвестиций .

В будущем Джайн и Рашид предсказывают появление «рейтинга TrialKey» — своего рода знака качества для стартапов, ищущих финансирование . Аналогично рейтингам энергоэффективности бытовой техники, этот показатель поможет инвесторам понять шансы на возврат капитала.

🚀 Будущее медицины без испытаний на людях? 38:51

Видение Саурабха Джайна простирается за пределы обычного анализа данных. Он полагает, что в будущем количество испытаний на людях сократится с текущих 35 000 в год до 5 000 . Обучение ИИ-моделей позволит проводить миллионы «виртуальных» испытаний.

Джайн проводит параллель с обучением вождению: через 10 лет будет считаться неэтичным выпускать ученика на дорогу без предварительной практики на симуляторе . Точно так же проведение клинического испытания на живых людях без предварительной проверки и оптимизации в AI-системе может стать вопросом профессиональной этики .

💬 Цитаты

«Около 60% мировых испытаний спроектированы плохо. Проблема не в молекуле или соединении, а в дизайне самого исследования.»

Дэймон Рашид 40:35

«Через 5-10 лет каждое испытание сначала будет проходить в ИИ, и только после оптимизации — на людях. Это станет вопросом этики.»

Саурабх Джайн 39:41
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Первичная конечная точка (Primary Endpoint)
Главный показатель, по которому оценивается успех клинического исследования (например, снижение смертности или уменьшение опухоли).
Дизайн исследования
План проведения испытания, включающий дозировки, количество пациентов и критерии их отбора.
Объяснимый ИИ (Explainable AI)
Методы ИИ, которые позволяют человеку понять, почему алгоритм принял то или иное решение.
📊 Цифры
🗓 Хронология
  1. 2005 Дэймон Рашид начинает создавать предиктивные модели для спортивного беттинга.
  2. 2021 Начало разработки модели TrialKey в разгар пандемии (анализ 800 кандидатов вакцин).
  3. 2024 Официальный запуск продукта TrialKey.ai на рынок (за 4 недели до интервью).
⚖️ Другая сторона
Искусственный интеллект TrialKey Opyl Damon Rashid Saurabh Jain Machine Learning