今日,小米技术宣布开源一项名为SVOR(Stable Video Object Removal)的视频消除技术,该技术能够移除视频中的路人。小米指出,现有的视频消除技术多在理想条件下设计,而真实世界的视频处理更为复杂,存在掩码边缘识别不准确、物体消除后阴影残留、快速移动目标处理不稳定等问题。为此,小米提出的SVOR框架专门针对这些问题设计了解决方案,包括MUSE窗口化联合策略、DA-Seg去噪感知分割以及课程式两阶段训练,以处理阴影和反射残留。
SVOR在多个标准数据集和退化遮罩基准上达到了新的SOTA(State of the Art)水平,并在CVPR2026物理感知视频实例消除挑战赛中获得第一名。小米还表示,其在视频消除的评测方案上也做了大量工作,包括评测数据收集整理和创新性评测方法,计划在适当时机开源。相关论文已发布,项目代码也已开源,Skill供直接调用。

来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。