报道称,商汤将于 7 月 5 日世界人工智能大会上发布日日新 5.5 大模型。官方没有透露关于日日新 5.5 大模型的更多信息,而此前有国内媒体报道称,商汤日日新大模型“近期”将迎来重大升级。在长文本处理能力上,升级后的商汤大模型将最新支持 100 万字以上超长文本,同时最多一次支持 50 多个文件问题解析。

另外,商汤今年 4 月 23 日发布了日日新 5.0 大模型。据IT之家此前报道,该模型采用 MOE 混合专家架构,在知识、数学、推理和代码能力方面大幅提升。该模型基于超过 10TB tokens 训练,具备 200K 推理上下文窗口(IT之家注:相当于 36.5 万个汉字),推理时上下文窗口达到 200K 左右,更号称“全面对标 GPT-4 Turbo”。其提供自然语言处理、图片生成、自动化数据标注、自定义模型训练等多种大模型及能力。
今年 5 月,商汤宣布将免费向粤语区用户推出粤语大模型 Web 版及 App 版,“商量语言大模型粤语版”及“商量多模态大模型粤语版”即日起向企业用户开放 API。
相关阅读:
《商汤推出粤语版商量语言 / 多模态大模型,可深入理解粤语俚语、粤文化》
《商汤发布日日新 5.0 大模型:推理上下文窗口 200K,号称对标 GPT-4 Turbo》
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
未经允许不得转载:新聚网 » 商汤科技拟募资 20.08 亿港元用于产品开发,7 月 5 日发布日日新 5.5 大模型

新聚网
哈佛大学开源 AI 训练数据集“Institutional Books 1.0”,涵盖馆藏 98.3 万本图书
Android XR 智能眼镜 XREAL Project Aura 重要参数公布:双芯驱动,70+° FoV
全球首个儿科大模型在北京荣华医院落地,诊断准确率优于主治医师平均水平
小米米家前开盖旅行箱 18 英寸开启众筹,369 元
共建韩国最大 AI 数据中心、容纳 6 万个 GPU,亚马逊 AWS 与 SK 集团合作
OpenAI Codex 人工智能编程工具推出新功能:可一次生成多个方案
性能提升 90%,Anthropic 首次公开多智能体系统构建全流程





