(资料图片仅供参考)
IT之家 7 月 31 日消息,阿里旗下达摩院日前与大连理工大学合作,推出了一款名为 HQTrack 的 AI 框架。该框架主要由视频多目标分割器(VMOS)和掩模优化器 (MR) 组成,旨在“实现对视频中任何目标的高质量跟踪”。
研究团队表示, HQTrack 基于开源框架 DeAOT、HQ-SAM,在此之上进行了一定改进,实现了“在视频中分割各目标”的可能性 。
▲ 图源 HQTrack 的 GitHub 页面
同时,研究团队使用 Intern-T 作为特征提取器,提高框架对不同类型物体的区分能力,同时加入了一个门控传播模块(GPM),以便于框架在复杂环境中感知更多微小物体,生成高质量的即时目标遮罩。
据悉, 在 VOTS2023 竞赛中,HQTrack 以 0.615 的质量得分获得第二名 ,研究团队表示,该 AI 框架可以应用于人脸识别、智能驾驶、监控追踪等领域,并有望在未来商业应用中落地。
▲ 图源 HQTrack 的 GitHub 页面
该项目目前已经在 GitHub 中开放,感兴趣的小伙伴们可以在此访问,IT之家将 HQTrack 核心功能转录于下方:
关键词: