字节跳动发布图像编辑模型 SeedEdit 3.0，处理更加丝滑高效

依靠 AI 完成指令式图像编辑的需求，广泛存在于视觉内容创意工作中。但此前，图像编辑模型在主体 & 背景保持、指令遵循等方面能力相对有限，导致编辑图像可用率不高。

据字节跳动官方介绍，SeedEdit 3.0 基于文生图模型 Seedream 3.0，叠加多样化的数据融合方法与特定奖励模型，较好地解决了上述难题。其图像主体、背景和细节保持能力进一步提升，尤其在人像编辑、背景更改、视角与光线转换等场景表现较为突出。

该模型可处理并生成 4K 图像，在精细且自然地处理编辑区域的同时，还能高保真地维持其他信息。尤其针对图像编辑“哪里改与哪里不改”的取舍，该模型表现出更佳的理解力和权衡力，可用率相应提高。当用户需要去掉图片内一众行人，模型不仅可以准确识别并移除场景内的无关人物，连影子也能一并去掉。

▲ Prompt：移除中间人物以外的所有行人

在 2D 绘画转为真实模特的任务中，SeedEdit 3.0 较好地保持了人物的衣帽穿搭与手提包等细节，生成图片兼具时尚街拍感。

Prompt：使女孩看起来逼真

整个场景的光影变换，模型也可以处理得丝滑、自然。从近处房屋，到远处海水波纹，细节均能合理保留下来，并跟随光线变化，进行“像素级”的渲染调整。

Prompt：把场景变为白天

为了实现上述能力，团队在 SeedEdit 3.0 的研发工作中提出了一种高效的数据融合策略，并构建了多种专用奖励模型。

通过将这些奖励模型与扩散模型联合训练，团队针对性地改善了关键任务的编辑质量（如人脸对齐、文本渲染等）。实际落地中，我们也对推理加速进行了同步优化。

Prompt：将“STOP”更改为“WARM”

字节跳动表示，除进一步优化编辑性能外，未来团队还将探索更丰富的编辑操作，让模型拥有连续多图生成、多张图像合成、故事性内容生成等能力。

IT之家附链接如下：

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。