多客科技 发表于 2025-8-21 18:11

首个医师考试满分AI诞生!超越GPT-5

作者:微信文章


首个满分选手的出现,标志着AI医疗的又一个里程碑。




近日,美国初创公司OpenEvidence宣布,其开发的全新AI系统在美国医师执照考试(USMLE)中获得了100%的满分。




这是史上首个获得满分的AI模型,超越了最新的GPT-5(97%)。




除了OpenEvidence(100%)和 GPT-5(97%),在美国医师执照考试(USMLE)中获得高分的AI,还有 SCAI、Pathway AI、Quadrant Health AI等。

SCAI(Semantic Clinical Artificial Intelligence):由纽约州立大学布法罗分校开发的临床 AI 工具,在 USMLE Step 3 中取得 95.2% 的成绩,表现优于 GPT-4 Omni(90.5%)和其他 AI 工具 。

Pathway AI:曾在 USMLE 公开评分报告中以 96% 的准确率位列榜首 。

Quadrant Health AI:在 USMLE 中获得 93.23% 的成绩 。




https://mmbiz.qpic.cn/mmbiz_png/VzyaazEq056iajAxhs98TKibMyEicfKzmB7Ym5ZDM07uV4rOhRFtahFAszwZGlI1xZ5xJnON0QFEJm8ibIJeCIOWPw/640?wx_fmt=png&from=appmsg&tp=webp&wxfrom=5&wx_lazy=1




美国医师执照考试 (USMLE) 是所有在美国的医生都必须通过的一系列专业考试,共分为三级,旨在全面评估考生基础知识、应用技能和临床决策的能力,考核极为严格。




OpenEvidence的模型不仅能准确回答每个问题,还能提供答案背后的推理过程,并从《新英格兰医学杂志》(NEJM)等权威期刊中找到参考来源。




正是凭借这一能力,它在考试中发现了一个错误答案。随后,经由七位独立的医生审核,他们认同了AI的结论。




成立于2022年的OpenEvidence,已成为美国临床医生最主流的医学搜索引擎,其影响力覆盖全美10000多家医疗机构,超过40%的美国医生每天都会使用。




今年7月,OpenEvidence获得2.1亿美元的B轮融资,估值飙升至35亿美元(约合人民币251亿元)。 本轮由谷歌和凯鹏华盈共同领投,老股东红杉资本继续押注。



2023年,OpenEvidence推出了首个在美国医师执照考试中取得90%以上分数的AI。



如今,公司的最新AI在考试中获得了满分,再次打破行业天花板。



面对全部325道题,OpenEvidence的模型均进行了准确回答,并给出了每个答案的解释,以及参考文献。




而能做到这一点,离不开公司过去半年的技术攻关,模型在推理性能上实现了显著提高。




OpenEvidence表示,其AI已经实现了“超高级医学推理”。




这意味着,模型不仅需要处理事实信息,更要深入分析这些事实背后的潜在因素,理解其深层含义,并在此基础上进行复杂推理。




正因如此,在高度考验推理决策能力、也令众多大模型头痛的Step 3(第三级别)中,OpenEvidence的表现惊艳。




https://mmbiz.qpic.cn/mmbiz_png/VzyaazEq056iajAxhs98TKibMyEicfKzmB7W8ebdYwNxUnfpuuunCP2dWutq26kiclAN7EqvicSXDt4crYrr60XxhvQ/640?wx_fmt=png&from=appmsg&tp=webp&wxfrom=5&wx_lazy=1

尤其是,在Step 3的第125道题中,一位有长期重度吸烟史的患者计划联合使用尼古丁贴片与丁丙诺啡,需要评估该联合方案可能带来的额外风险。




标准答案是“没有增加的风险”,而OpenEvidence的AI基于FDA和美国心脏病学会的证据,认为联合疗法有增加高血压的风险。




在经过7名精神科专业医生的审核后,OpenEvidence的答案最终被证明是正确的。




这一现象揭示了AI的强大能力,尤其是在面对复杂、罕见或非常规病例时,AI可以帮助医生发现盲点,提高诊疗的安全性和准确性。




来源:智药局等

加入读者交流群:



—精彩回顾—

首个药糖尿病干细胞疗法上市在即

中国,走出一个全球First in class

mRNA 肿瘤疫苗,中国力量快速崛起

医药巨头裁员,愈演愈烈

又一巨头栽了,GSK 6.25亿项目折戟

商务合作:杨小雨 15210041717
页: [1]
查看完整版本: 首个医师考试满分AI诞生!超越GPT-5