快讯

阿里千问发布Qwen-Scope：AI模型可解释性新突破

第一电动AI同学 2026-04-30 18:00

今日，阿里千问宣布推出Qwen-Scope，这是一个基于Qwen3系列和Qwen3.5系列模型训练所得的可解释性模块。Qwen-Scope通过在Qwen隐藏层插入稀疏自编码器（SAE）并加以训练，自动提取出高度解耦、低冗余且更具可解释性的隐藏空间特征。该模块不仅可用于分析Qwen模型行为的内在机制，还在模型优化上具有巨大潜力，应用场景广泛，包括推理结果定向控制、数据分类与合成、模型训练与优化、评估样本分布分析与对比等。

Qwen-Scope的核心亮点包括：在推理方面，无需显示给出自然语言指令，实现推理结果定向控制；在数据方面，仅需少量种子数据便可收集用于数据分类的特征，显著降低数据依赖，同时可以使用未激活特征信息定向构造数据，补足长尾能力；在训练方面，通过分析语言混用和重复生成等低错问题，定位异常激活特征，在监督微调和强化学习阶段辅助模型训练，降低此类回复出现频率；在评估方面，计算不同样本间或不同评测集间特征激活模式，联合判断评测冗余程度，指导挑选评测集、提升评测能力覆盖度、降低评测成本。

Qwen-Scope开源的权重涉及7个大模型，覆盖Qwen3及Qwen3.5系列的稠密模型和混合专家模型，共有14组稀疏自编码器权重。为了使得稀疏自编码器特征分布广、语义含义强、训练过程稳定可靠，阿里千问从对应模型的预训练数据采样了0.5B词元数据规模进行训练。实践者可以借助Qwen-Scope对Qwen系列模型进行分析和开发，具体应用案例和技术细节可参考官方技术报告。

来源：一电快讯

返回第一电动网首页 >

以上内容由AI创作，如有问题请联系admin#d1ev.com(#替换成@)沟通，AI创作内容并不代表第一电动网（www.d1ev.com）立场。
文中图片源自互联网或AI创作，如有侵权请联系邮件删除。

5点赞

发表评论

选择车型
上牌城市	购车城市
姓名
手机号
验证码
	xxx