虫鱼之学网

移除视频中出现的路人,小米开源CVPR 2026夺冠技术SVOR

来源:虫鱼之学网-工人日报
2026-04-26 21:46:12

IT之家 4 月 22 日消息,小米技术今日宣布,开源视频消除技术 SVOR,该技术可以移除视频中出现的路人。

官方表示,现有的方法大多在理想条件下设计和验证,而真实世界的视频远比论文里的测试场景复杂 —— 模型识别的掩码边缘不够准、物体消除后阴影仍然留在画面里、目标快速移动时逐帧处理频繁“跟丢”导致闪烁。

为此小米提出了 SVOR(Stable Video Object Removal)框架,专门针对上述三类“不完美条件”设计了对应的解决方案:用 MUSE 窗口化联合策略解决运动抖动,用 DA-Seg 去噪感知分割提升遮罩容错能力,并通过课程式两阶段训练让模型真正学会处理阴影和反射残留。

SVOR 在多个标准数据集和退化遮罩基准上均达到了新的 SOTA 水平,并在 CVPR 2026 物理感知视频实例消除挑战赛中从 18 支参赛队伍中脱颖而出,荣获第一名。

相关论文已经发布,项目代码也已开源,并准备好 skill 供直接调用,IT之家附相关链接如下:

论文:https://arxiv.org/abs/2603.09283GitHub:https://github.com/xiaomi-research/svorSkill:https://clawhub.ai/wangfei1204/mi-visionforge-svor

小米还表示,在视频消除的评测方案上也做了较多工作,包括评测数据收集整理和创新性评测方法,将在合适的时间进行开源。

责任编辑:虫鱼之学网

媒体矩阵


  • 客户端

  • 微信号

  • 微博号

  • 抖音号

客户端

亿万职工的网上家园

马上体验

关于我们|版权声明| 违法和不良信息举报电话:010-84151598 | 网络敲诈和有偿删帖举报电话:010-84151598
Copyright © 2008-2024 by {当前域名}. all rights reserved

扫码关注

虫鱼之学网微信


虫鱼之学网微博


虫鱼之学网抖音


工人日报
客户端
×
分享到微信朋友圈×
打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。