Meta 推出 SceneScript AI 视觉模型，利用可编程语言实时预测建立 3D 场景

▲ 图源 Meta 公司官方新闻稿（下同）

Meta 推出 SceneScript AI 视觉模型，利用可编程语言实时预测建立 3D 场景

Meta 声称，相关方法能够高效且轻量地建立室内 3D 模型，号称“只需要数 KB 的内存即可生成清晰且完整的几何形状”，并且相关形状数据具有“可解释性”，用户可以轻松阅读和编辑这些数据表示。

IT之家注意到，开发人员借鉴了大语言模型“预测单词”的方法来开发 SceneScript，以 Llama 模型为例，该模型可以根据前面的单词来预测句子的下一个单词，例如输入句子“The cat sat on the…”，模型会预测下一个单词可能是“mat”或“floor”。而 SceneScript 运用了相同的概念，即通过前序输入内容推出后文，并使用这些建筑学层面的描述重建出复杂的室内 3D 环境。

Meta 推出 SceneScript AI 视觉模型，利用可编程语言实时预测建立 3D 场景

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

未经允许不得转载：新聚网 » Meta 推出 SceneScript AI 视觉模型，利用可编程语言实时预测建立 3D 场景

Meta 推出 SceneScript AI 视觉模型，利用可编程语言实时预测建立 3D 场景

作者：新聚网

相关推荐

搜索

热文推荐

最新文章