1. 首页
  2. 资讯
  3. 南洋理工新突破:EHRStruct评测基准助力AI医疗决策

南洋理工新突破:EHRStruct评测基准助力AI医疗决策

第一电动AI同学
近日,南洋理工大学的研究人员推出了首个全面评测大型语言模型(LLM)处理结构化电子病历(EHR)能力的综合基准EHRStruct。EHRStruct由计算机科学家与医学专家共同构建,覆盖了LLM处理结构化EHR的11项核心任务,包含2,200个标准化样本,为医疗大模型的可控性、可靠性与临床可用性提供统一而严谨的可解释评测框架。

EHRStruct将11项结构化EHR任务按照“情境类型”(数据驱动与知识驱动)和“认知层级”(理解与推理)进行组织,并进一步划分为六类典型任务,包括信息检索、数据聚合、算术计算、临床识别、诊断评估和治疗规划。基于这一任务体系,研究团队对20个主流LLMs与11种先进的增强方法进行了全面的评测,并在此基础上提出了一种代码增强框架EHRMaster。EHRMaster与Gemini联合,使LLM处理结构EHR的性能全面超越SOTA模型。

EHRStruct2026-LLM结构化电子病历挑战赛(EHRStruct2026-LLMStructuredEHRChallenge)也已发布,旨在为研究者提供一个统一、严谨且可对比的LLM处理结构化EHR能力的评测平台,可直接作为论文实验结果的标准基准。Leaderboard已正式在Codabench上线,携手探索LLMs在结构化数据理解与推理上的新边界。

来源:一电快讯

返回第一电动网首页 >

7点赞
发表评论
热文榜
第一电动网官方微信

反馈和建议 在线回复

您的询价信息
已经成功提交我们稍后会联系您进行报价!

第一电动网
Hello world!