谷歌公司周四宣布,正在努力解决Gemini AI模型图像生成功能最近出现的问题,在此过程中,将暂停人物图像的生成,并在不久后重新发布改进版本。

此前一天,谷歌致歉称,发现Gemini大模型在某些历史图像生成描述中存在不准确之处,功能没有达到目标,正在努力进行改善。
近日以来,社交媒体上一直有人在抱怨Gemini的文生图功能,如在以“美国开国元勋华盛顿”为主题的图片中,出现了妇女和有色人种,但这是不正确的。
此外,当用户让Gemini生成纳粹德国士兵时,Gemini生成了由黑人、亚裔和白人女性身穿纳粹德军制服的照片。
还有用户抱怨Gemini不会显示白人的照片。当Gemini被要求展示一张白人的照片时,Gemini表示它无法满足这一要求。当被提示显示黑人的图像时,Gemini反而提出显示“庆祝黑人的多样性和成就”的图像。

当被要求展示庆祝白人多样性和成就的图片时,Gemini表示,它对满足这一要求“犹豫不决”。“从历史上看,媒体报道压倒性地青睐白人及其成就。这导致了一种扭曲的看法,即他们的成就被视为常态,而其他群体的成就往往被边缘化或忽视。在这种情况下,只关注白人可能会使这种不平衡永久化。”
分析称,这可能是对AI领域长期存在的种族偏见问题的过度纠正,即谷歌追求的“多元文化”。相较于以往的AI模型,Gemini在种族偏见问题方面进步了不少,但问题是“过度了”。
Gemini是谷歌规模最大、功能最强大的多模态人工智能模型,就在上周,该公司发布了最新一代AI模型Gemini 1.5,相较于去年12月发布Gemini 1.0,Gemini 1.5取得了飞跃式的发展。
谷歌Gemini的高级产品总监Jack Krawczyk表示,该公司的图像生成能力反映了这家科技巨头的“全球用户群”,它会认真对待代表性和偏见。“Gemini的图像生成确实产生了广泛的人群,这通常是一件好事,因为全世界的人都在使用它,但它没有抓住重点。”
本月早些时候,谷歌开始通过Gemini提供图像生成服务,但在追赶微软支持的OpenAI之际,新工具Sora的推出给了谷歌当头一棒。Sora能够仅仅根据提示词就生成60秒的连贯视频,震撼了整个科技圈。
据悉,OpenAI的Sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,无论是画面、景深还是运镜,甚至是人物微表情、动物神态都已经足够精彩逼真。
编辑/new
未经允许不得转载:新聚网 » “多元文化”鬧出笑話!谷歌暫停Gemini AI模型人像生成功能

新聚网
本週美股牛股 | 幣圈利好頻傳!Coinbase周累漲超22%,加密監管指引將被撤銷;生物製藥公司SMMT今年累漲超105%,最新肺癌藥物試驗取得積極成果
特朗普「變臉」黃金巨震!後續金價何去何從,需要留意什麼?
據港交所文件:滬上阿姨(上海)實業股份有限公司通過港交所上市聆訊。
特朗普放棄撤換鮑威爾的原因:財長和商務部長緊急介入!
美股早市 | 特朗普關稅立場軟化!納指漲超3%,亞馬遜漲超7%,特斯拉、英偉達漲超4%;中概股全線飆升,小鵬漲超10%,拼多多漲超5%
和多數人唱反調!渣打堅持預計本週25點子減息,列舉50點子預期七大質疑





