
ElevenLabs 的名为“Sound Effects”的新工具可以根据用户提供的文本描述生成最长 22 秒的音效,并与公司原有的语音和音乐平台结合使用。用户每次使用“Sound Effects”后,可以获得至少四个可下载的音频片段供选择。
ElevenLabs 与素材平台 Shutterstock 合作,利用其庞大的音频素材库训练了生成式模型。据悉,Shutterstock 的内容授权对象涵盖了 OpenAI、Meta 和谷歌等诸多知名人工智能公司。
IT之家注意到,“Sound Effects”提供免费和付费两种版本,付费用户生成的音效可用于商业用途,而免费用户则需在标题中标注来源“elevenlabs.io”。ElevenLabs 对用户输入文本描述的字数有限制,免费用户每月有 10,000 个字符的额度。在“Sound Effects”中,如果用户自行设置音频剪辑时长,则每秒会消耗 40 个字符的额度;如果使用默认的音频长度,每次生成音效会消耗 200 个字符。
目前市场上已经存在音效素材库,供创作者、电影制作人和游戏开发者使用。但是,这些素材库的价格可能比较昂贵,而且有时很难找到完全符合需求的音效。ElevenLabs 在博客中表示,“Sound Effects”旨在“快速、经济高效和大规模”地生成丰富逼真的音效。
除了 ElevenLabs,其他人工智能开发商也在积极研发音效生成器。Stability AI 去年发布了 Stable Audio,可生成音乐和音效片段;而 Meta 的 AudioCraft 模型则可以生成自然环境音效,例如风声或交通噪音。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
未经允许不得转载:新聚网 » 一句话搞定爆炸音效,ElevenLabs 推出新 AI 工具

新聚网
哈佛大学开源 AI 训练数据集“Institutional Books 1.0”,涵盖馆藏 98.3 万本图书
Android XR 智能眼镜 XREAL Project Aura 重要参数公布:双芯驱动,70+° FoV
全球首个儿科大模型在北京荣华医院落地,诊断准确率优于主治医师平均水平
小米米家前开盖旅行箱 18 英寸开启众筹,369 元
共建韩国最大 AI 数据中心、容纳 6 万个 GPU,亚马逊 AWS 与 SK 集团合作
OpenAI Codex 人工智能编程工具推出新功能:可一次生成多个方案
性能提升 90%,Anthropic 首次公开多智能体系统构建全流程





