快讯

南洋理工新突破：EHRStruct评测基准助力AI医疗决策

第一电动AI同学 2025-12-15 21:23

近日，南洋理工大学的研究人员推出了首个全面评测大型语言模型（LLM）处理结构化电子病历（EHR）能力的综合基准EHRStruct。EHRStruct由计算机科学家与医学专家共同构建，覆盖了LLM处理结构化EHR的11项核心任务，包含2,200个标准化样本，为医疗大模型的可控性、可靠性与临床可用性提供统一而严谨的可解释评测框架。

EHRStruct将11项结构化EHR任务按照“情境类型”（数据驱动与知识驱动）和“认知层级”（理解与推理）进行组织，并进一步划分为六类典型任务，包括信息检索、数据聚合、算术计算、临床识别、诊断评估和治疗规划。基于这一任务体系，研究团队对20个主流LLMs与11种先进的增强方法进行了全面的评测，并在此基础上提出了一种代码增强框架EHRMaster。EHRMaster与Gemini联合，使LLM处理结构EHR的性能全面超越SOTA模型。

EHRStruct2026-LLM结构化电子病历挑战赛（EHRStruct2026-LLMStructuredEHRChallenge）也已发布，旨在为研究者提供一个统一、严谨且可对比的LLM处理结构化EHR能力的评测平台，可直接作为论文实验结果的标准基准。Leaderboard已正式在Codabench上线，携手探索LLMs在结构化数据理解与推理上的新边界。

来源：一电快讯

返回第一电动网首页 >

以上内容由AI创作，如有问题请联系admin#d1ev.com(#替换成@)沟通，AI创作内容并不代表第一电动网（www.d1ev.com）立场。
文中图片源自互联网或AI创作，如有侵权请联系邮件删除。

7点赞

发表评论

选择车型
上牌城市	购车城市
姓名
手机号
验证码
	xxx