当前位置：新聚网 > 科技 > 智能之家 > 正文

直接开源，阿里达摩院公布下一代工业级语音识别模型

新聚网发布于 2022-12-22
分类：智能之家
阅读(88)

阿里巴巴

据介绍，这是业界首个应用落地的非自回归端到端语音识别模型，在推理效率上最高可较传统模型提升 10 倍，且识别准确率在多个权威数据集上名列第一。目前，该模型于魔搭社区面向全社会开源。

数据显示，配合 GPU 推理，不同版本的 Paraformer 可将推理效率提升 5-10 倍。同时，Paraformer 使用了 6 倍下采样的低帧率建模方案，可将计算量大幅降低，支持大模型的高效推理。

IT之家了解到，阿里达摩院方面表示，Paraformer 是阿里巴巴研发的下一代“杀手锏”级别的语音识别基础模型，未来将广泛应用于会议纪要产品“听悟”、钉钉语音转文字、高德导航等场景。

相关阅读：

《阿里达摩院推出 AI 模型社区“魔搭”：开源 300+ AI 模型，可体验中文作画 AI》

未经允许不得转载：新聚网 » 直接开源，阿里达摩院公布下一代工业级语音识别模型

作者：新聚网

相关推荐