
IT之家从公众号发布的消息中得知,通义听悟此次升级,在原有“实时记录、音视频文件转写、全文概要、章节速览”等功能之上,新增“提取 PPT”功能。该功能通过引入视觉 AI 算法,能够“自动将 PPT 讲解视频分割为演示文稿”,并对每页 PPT 进行要点总结,形成一份图文并茂的大纲,能够“解决培训、网课学习等场景‘求 PPT 难’的问题”。

此外,官方表示,通义听悟还增加了浏览器插件和移动端的支持。用户可以在 Chrome 内核的浏览器上安装插件,在开会、上网课、看直播、看视频时,能够调用插件进行全程录制,并实时生成双语字幕,从而“帮助用户更轻松地浏览视频内容”。

阿里云同时为通义听悟带来了小程序扩展,据悉,通义听悟钉钉和微信小程序在支持 PC 端基础功能的同时,还可以一键转写手机和聊天记录的音视频文件,仅需一部手机即可记录、回顾和整理音视频内容。
通义听悟产品及研发负责人鄢志杰表示:“继语音 AI 与大语言模型碰撞出火花后,我们持续将视觉 AI 引入通义听悟这一创新产品,围绕人们工作和学习中的音视频内容,希望通过全新的体验成为大家的 AI 助手。”
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
未经允许不得转载:新聚网 » 阿里云升级通义听悟 AI 工具,上线“提取 PPT、浏览器插件、小程序扩展”功能

新聚网
哈佛大学开源 AI 训练数据集“Institutional Books 1.0”,涵盖馆藏 98.3 万本图书
Android XR 智能眼镜 XREAL Project Aura 重要参数公布:双芯驱动,70+° FoV
全球首个儿科大模型在北京荣华医院落地,诊断准确率优于主治医师平均水平
小米米家前开盖旅行箱 18 英寸开启众筹,369 元
共建韩国最大 AI 数据中心、容纳 6 万个 GPU,亚马逊 AWS 与 SK 集团合作
OpenAI Codex 人工智能编程工具推出新功能:可一次生成多个方案
性能提升 90%,Anthropic 首次公开多智能体系统构建全流程





