“多元文化”鬧出笑話！谷歌暫停Gemini AI模型人像生成功能

谷歌公司周四宣布，正在努力解决Gemini AI模型图像生成功能最近出现的问题，在此过程中，将暂停人物图像的生成，并在不久后重新发布改进版本。

此前一天，谷歌致歉称，发现Gemini大模型在某些历史图像生成描述中存在不准确之处，功能没有达到目标，正在努力进行改善。

近日以来，社交媒体上一直有人在抱怨Gemini的文生图功能，如在以“美国开国元勋华盛顿”为主题的图片中，出现了妇女和有色人种，但这是不正确的。

此外，当用户让Gemini生成纳粹德国士兵时，Gemini生成了由黑人、亚裔和白人女性身穿纳粹德军制服的照片。

还有用户抱怨Gemini不会显示白人的照片。当Gemini被要求展示一张白人的照片时，Gemini表示它无法满足这一要求。当被提示显示黑人的图像时，Gemini反而提出显示“庆祝黑人的多样性和成就”的图像。

当被要求展示庆祝白人多样性和成就的图片时，Gemini表示，它对满足这一要求“犹豫不决”。“从历史上看，媒体报道压倒性地青睐白人及其成就。这导致了一种扭曲的看法，即他们的成就被视为常态，而其他群体的成就往往被边缘化或忽视。在这种情况下，只关注白人可能会使这种不平衡永久化。”

分析称，这可能是对AI领域长期存在的种族偏见问题的过度纠正，即谷歌追求的“多元文化”。相较于以往的AI模型，Gemini在种族偏见问题方面进步了不少，但问题是“过度了”。

Gemini是谷歌规模最大、功能最强大的多模态人工智能模型，就在上周，该公司发布了最新一代AI模型Gemini 1.5，相较于去年12月发布Gemini 1.0，Gemini 1.5取得了飞跃式的发展。

谷歌Gemini的高级产品总监Jack Krawczyk表示，该公司的图像生成能力反映了这家科技巨头的“全球用户群”，它会认真对待代表性和偏见。“Gemini的图像生成确实产生了广泛的人群，这通常是一件好事，因为全世界的人都在使用它，但它没有抓住重点。”

本月早些时候，谷歌开始通过Gemini提供图像生成服务，但在追赶微软支持的OpenAI之际，新工具Sora的推出给了谷歌当头一棒。Sora能够仅仅根据提示词就生成60秒的连贯视频，震撼了整个科技圈。

据悉，OpenAI的Sora不仅能准确呈现细节，还能理解物体在物理世界中的存在，无论是画面、景深还是运镜，甚至是人物微表情、动物神态都已经足够精彩逼真。

编辑/new