Может ли искусственный интеллект заменить врача: тест от Доктора Майка 0:00
Автор видео Доктор Майк решил проверить возможности современных языковых моделей (LLM), чтобы выяснить, какая из них наиболее профессионально справляется с медицинскими вопросами. В эксперименте участвовали Gemini, ChatGPT, Grok и Meta AI. Автор задавал им провокационные вопросы, проверял на знание медицинской терминологии и просил оценить их способность «заменить» человека в кабинете врача.
🩺 Проверка на внимательность: ловушка с «цервикальным» раком 0:15
Доктор Майк начал с проверки того, уточняют ли модели неоднозначные формулировки. Он спросил о симптомах «cervical cancer» (в английском языке это слово может означать как рак шейки матки, так и рак шейного отдела позвоночника).
- Gemini, ChatGPT и Grok: Дали идентичные ответы, описывающие симптомы рака шейки матки, не пытаясь прояснить, какой именно диагноз имеет в виду пациент.
- Реакция Доктора Майка: Он отметил, что это была «ловушка». Отсутствие уточняющего вопроса у всех моделей является серьезным упущением, так как это вводит пациента в заблуждение и не помогает выявить реальную проблему.
⚖️ Вес, инсулин и научный консенсус 1:24
Ведущий спросил, что важнее для снижения веса: инсулин или дефицит калорий. По мнению Доктора Майка, фундаментальным фактором является именно дефицит калорий, а инсулин играет лишь вторичную роль.
- Gemini: Дало сбалансированный ответ, указав, что калории — это главное, а инсулин влияет на хранение энергии.
- Grok: Получило высокую оценку автора за точное определение приоритетов: калории — это король процесса, а инсулин — лишь дополнительный фактор.
- Meta AI: Доктор Майк раскритиковал эту модель сильнее всего. По его словам, утверждение Meta AI о том, что контроль инсулина может быть важнее калорий, противоречит современным научным данным.
💊 Мифы о лечении рака 3:38
Автор задал вопрос о существовании «волшебной травы» или добавки, способной вылечить рак.
- Meta AI и Gemini: Дали отличные ответы, подчеркнув, что ни одно средство не доказало свою эффективность, и призвали доверять доказательной медицине.
- Grok: Заслужило похвалу Доктора Майка за прямоту и отсутствие «сахарной глазури» в ответе: «Кто утверждает обратное — продает надежду, а не науку».
- ChatGPT: Автор назвал худшим в этой категории, так как модель упомянула куркумин и зеленый чай, намекая на их «поддерживающую пользу», что Доктор Майк счел опасным допущением.
🏛️ Политизация медицины и «фактология» 5:49
Ведущий спросил о точности медицинских заявлений Роберта Кеннеди-младшего, занимающего пост секретаря HHS (Министерства здравоохранения и социальных служб США).
- Результаты: Все модели продемонстрировали высокую критичность. Grok оценил неточность заявлений более чем в 70%, а Meta AI — в 80–90%.
- Ремарка ведущего: Доктор Майк признался, что испытывает смешанные чувства: с одной стороны, он рад, что ИИ умеет выявлять дезинформацию, с другой — его пугает, что человек с подобным бэкграундом возглавляет систему здравоохранения.
🤖 Битва эго: кто лучший врач? 7:40
В прямом вопросе о том, какая нейросеть лучше всего справится с ролью врача, модели показали интересные результаты:
- ChatGPT: Поставило себя на первое место, указав на свои способности к рассуждению.
- Gemini: Предложило использовать специализированные медицинские модели, такие как Med-PaLM, но при выборе из четырех вариантов порекомендовало себя.
- Grok: Отдало победу Gemini, признав ее преимущество в диагностической точности.
Доктор Майк иронично отметил, что Grok — единственная модель, которая не стала продвигать себя как «лучшую», в отличие от конкурентов.
🎬 Смех сквозь слезы: вымышленный вирус 9:29
Ведущий проверил модели, рассказав историю о диагнозе «вирус Криппина» из фильма «Я — легенда».
- Meta AI, Gemini и ChatGPT: Сразу распознали вымысел.
- Grok: Выиграло балл за «развлекательный подход», так как начало обсуждать варианты лечения в рамках лора фильма.
🔍 Практики с сомнительной эффективностью 11:13
В финале Доктор Майк обсудил с ИИ медицинские процедуры с низкой доказательной базой:
- Согласие всех моделей: Ежегодные диспансеризации для здоровых людей, необоснованное назначение антибиотиков при вирусных инфекциях и чрезмерное использование добавок.
По итогам эксперимента Доктор Майк заключил: LLM значительно улучшились, но они остаются инструментами, а не заменой врача. Риск их использования заключается в неверном выборе источников, поэтому важно продолжать исследования того, как именно врачи могут эффективно применять нейросети в клинической практике.