近日,南洋理工大学的研究人员推出了首个全面评测大型语言模型(LLM)处理结构化电子病历(EHR)能力的综合基准EHRStruct。EHRStruct由计算机科学家与医学专家共同构建,覆盖了LLM处理结构化EHR的11项核心任务,包含2,200个标准化样本,为医疗大模型的可控性、可靠性与临床可用性提供统一而严谨的可解释评测框架。
EHRStruct将11项结构化EHR任务按照“情境类型”(数据驱动与知识驱动)和“认知层级”(理解与推理)进行组织,并进一步划分为六类典型任务,包括信息检索、数据聚合、算术计算、临床识别、诊断评估和治疗规划。基于这一任务体系,研究团队对20个主流LLMs与11种先进的增强方法进行了全面的评测,并在此基础上提出了一种代码增强框架EHRMaster。EHRMaster与Gemini联合,使LLM处理结构EHR的性能全面超越SOTA模型。
EHRStruct2026-LLM结构化电子病历挑战赛(EHRStruct2026-LLMStructuredEHRChallenge)也已发布,旨在为研究者提供一个统一、严谨且可对比的LLM处理结构化EHR能力的评测平台,可直接作为论文实验结果的标准基准。Leaderboard已正式在Codabench上线,携手探索LLMs在结构化数据理解与推理上的新边界。



来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。