密歇根大学的研究人员与位于普埃布拉的墨西哥国家天体物理、光学和电子研究所(INAOE)合作开展了这一研究,发现最初用于训练人类语音的 AI 模型可以作为训练动物交流模型的起点。

密歇根大学人工智能实验室负责人 Rada Mihalcea 表示,人工智能在理解语音的微妙之处方面有了显著进步,可以区分音调、音调和口音的细微差别,可凭借这些研究基础来理解狗吠。
开发这种分析动物发声 AI 模型的主要障碍之一,是缺乏公开可用的数据。虽然有许多资源和机会来记录人类的语音,但从动物身上收集数据更加困难。
团队尝试使用采集人类语音数据的方式来采集狗的叫声信息,各种情况下收集了 74 只不同品种、年龄和性别狗狗的吠叫、咆哮和呜呜声。
团队将采集到的这些声音信息用于分析人类语音的机器模型中,模型可以很好地理解狗之间的交流,模型在各种测试中准确率达到 70%。
Rada Mihalcea 表示,“来自人类语音的声音和模式可以作为分析和理解其他声音(如动物发声)的声学模式的基础”。团队其他研究人员也表示,更好地了解动物发出各种声音的细微差别,可以改善人类对其情感和身体需求的解释和反应。
据悉实验结果在 2024 年计算语言学、语言资源与评估国际联合会议进行了展示。IT之家附论文链接:
https://arxiv.org/pdf/2404.18739
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
未经允许不得转载:新聚网 » 准确率可达 70%,科学家利用 AI 解读狗的叫声

新聚网
哈佛大学开源 AI 训练数据集“Institutional Books 1.0”,涵盖馆藏 98.3 万本图书
Android XR 智能眼镜 XREAL Project Aura 重要参数公布:双芯驱动,70+° FoV
全球首个儿科大模型在北京荣华医院落地,诊断准确率优于主治医师平均水平
小米米家前开盖旅行箱 18 英寸开启众筹,369 元
共建韩国最大 AI 数据中心、容纳 6 万个 GPU,亚马逊 AWS 与 SK 集团合作
OpenAI Codex 人工智能编程工具推出新功能:可一次生成多个方案
性能提升 90%,Anthropic 首次公开多智能体系统构建全流程





