
IT之家注:ONNX Runtime Web 是微软推出的 JavaScript 库,让网络开发人员直接在网络浏览器中部署机器学习模型,提供基于硬件加速的多个后端支持。
WebGPU 是一种网络应用程序接口(API),可为在网络浏览器中,为机器学习模型提供硬件加速。
以前,由于计算能力有限,复杂的机器学习模型,尤其是大型生成模型,无法在网络浏览器中高效运行。而现在 WebGPU 可以释放设备 GPU 的能力来完成这些任务,从而显著提高性能。

微软表示:
借助计算着色器等先进功能,WebGPU 能够以更高效的方式处理更复杂的机器学习工作负载。
它对半精度(FP16)的支持降低了 GPU 内存的使用率和带宽要求,同时加快了运算速度。
WebGPU 通过利用 GPU 处理并行计算任务的能力,可直接在网络浏览器中推断出更高效、可扩展的机器学习应用。
适用于 Mac、Windows、ChromeOS 的 Chrome 113 和 Edge 113 以及适用于 Android 的 Chrome 121 默认已包含 WebGPU,开发者可以尝试通过 ONNX Runtime Web 调用 WebGPU 加速资源。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
未经允许不得转载:新聚网 » 微软 ONNX Runtime Web 集成 WebGPU:调用 GPU 提高网页端 AI 模型运行速度

新聚网
Swift Assist 进化:苹果 Xcode 26 可接入端侧、Claude 等 AI 编程模型
安全公司曝光黑客盗用开发团队账号在 NPM 平台散布恶意软件包,涉及 React Native / GlueStack 项目
英特尔发布 32.0.101.6881 WHQL 显卡驱动,修复《守望先锋 2》游戏崩溃问题
时隔一年半,苹果手记 Journal 应用将随 macOS / iPadOS 26 登陆 Mac / iPad
苹果推出容器化框架,可直接在 Mac 上创建、下载或运行 Linux 容器镜像
微软 Win10 / Win11 新版 Outlook 被曝新问题:重要会议安排凭空消失
Linux 6.16 首个 RC 候选版发布:提升电源管理效率、扩展硬件支持、优化 EXT4 文件系统





