Imagination 与 MulticoreWare 合作:在紫光展锐 T710 上大幅提升 GPU 性能

Imagination 与 MulticoreWare 一同在紫光展锐 UNISOC-T710 开发平台上展示了加速立体块匹配算法的性能。IT之家获悉,MulticoreWare 发挥自身在 OpenCL 方面的专长,重新实现立体块匹配算法,提高了计算资源的利用率和内存优化度,在 Imagination GPU 上实现约 50 倍以上的性能提升

该立体块匹配算法是根据客户的意向进行了优化的。MulticoreWare 在分析了 CPU 性能后确定了瓶颈,这是为了通过高效率地实现内部寄存器的使用和配置适应图像分辨率的合适全局 workgroup 大小来实现最大的 GPU 并行性。

Imagination 的 GM9446 GPU 内存布局被用于计算自适应全局工作组的大小。除了计算方面的优化之外,算法参数也在经过修改后提高了精度,并且相比同一平台上的 CPU,在 GPU 上实现的性能非常高。在同一配置下,CPU 的时间是 54.25ms,而 MCW 的实现时间是 0.78ms,性能提高了约 70 倍。

未经允许不得转载:新聚网 » Imagination 与 MulticoreWare 合作:在紫光展锐 T710 上大幅提升 GPU 性能

赞 (0) 打赏