研究团队表示,HQTrack 基于开源框架 DeAOT、HQ-SAM,在此之上进行了一定改进,实现了“在视频中分割各目标”的可能性。

同时,研究团队使用 Intern-T 作为特征提取器,提高框架对不同类型物体的区分能力,同时加入了一个门控传播模块(GPM),以便于框架在复杂环境中感知更多微小物体,生成高质量的即时目标遮罩。
据悉,在 VOTS2023 竞赛中,HQTrack 以 0.615 的质量得分获得第二名,研究团队表示,该 AI 框架可以应用于人脸识别、智能驾驶、监控追踪等领域,并有望在未来商业应用中落地。

该项目目前已经在 GitHub 中开放,感兴趣的小伙伴们可以在此访问,IT之家将 HQTrack 核心功能转录于下方:
1. 多目标追踪:HQTrack 可以同时追踪多个目标对象,适用于复杂场景下的目标追踪任务。
2. 目标分割:HQTrack 能够准确地分割视频中的目标对象,并生成高质量的目标遮罩,可用于目标识别和分析。
3. 高质量输出:HQTrack 的追踪结果具有高质量和高准确性,能够满足各种应用场景的需求。
4. 简单易用:HQTrack 提供了简洁的接口和使用指南,用户可以轻松地使用和集成该工具。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
未经允许不得转载:新聚网 » 阿里达摩院推出 AI 框架 HQTrack,可实现视频高质量跟踪

新聚网
哈佛大学开源 AI 训练数据集“Institutional Books 1.0”,涵盖馆藏 98.3 万本图书
Android XR 智能眼镜 XREAL Project Aura 重要参数公布:双芯驱动,70+° FoV
全球首个儿科大模型在北京荣华医院落地,诊断准确率优于主治医师平均水平
小米米家前开盖旅行箱 18 英寸开启众筹,369 元
共建韩国最大 AI 数据中心、容纳 6 万个 GPU,亚马逊 AWS 与 SK 集团合作
OpenAI Codex 人工智能编程工具推出新功能:可一次生成多个方案
性能提升 90%,Anthropic 首次公开多智能体系统构建全流程





