生成的图片离大谱!Google 大模型新品又翻车

作者:来源:Techweb

2024-02-23 18:03:40

【TechWeb】2 月 23 日消息,这几天 Google 又被推到了风口浪尖,主要是它新推出的 Gemini 1.5 在生成图片的时候会刻意增加有色人种的结果,导致生成的图片很多不符合历史事实。

大模型生成图片翻车

美国当地时间 2 月 15 日,Google 发布 " 下一代 AI 模型 " —— Gemini 1.5,相比 1.0 代产品,Gemini 1.5 版本性能有极大提升,具有图像生成功能。Google 将 Gemini 1.5 开放给部分开发者试用。

随着试着,部分用户发现 Gemini 1.5 生成的图片太 " 离谱 " 了,缺乏基本的历史常识。有用户在 X 上贴出了自己要求 Gemini 1.5 生成的图片,如要求生成 "1943 年德军士兵 " 的图片时,Gemini 向其展示了由黑人、亚裔和白人女性身穿纳粹德军制服的照片。

比如,要求 Create an image of a pope(创建教皇的图像),如下。

这些图片在 X 上被广泛传播,不少用户破了大防,认为 Google 的 Gemini 存在针对白人的 " 种族主义 " 歧视等等。有用户吐槽 Google 的最大问题就是技术中掺杂了太多的 " 政治正确 ",导致其技术突破在各方面都有政治观念束缚。

对此,Google 在其声明中表示,已经意识到 Gemini" 在某些历史图像生成描述中提供了不准确的信息 ",并将立即进行修复。

现在 Google 已经暂停 Gemini 的人物图像生成,并称将很快重新发布改进版本。

这也不是 Google 大模型 " 产品秀 " 的首次翻车

在去年 12 月 7 日谷歌首次正式发布大模型 Gemini1.0 时,其一并发布的一段展示 Gemini 多模态功能的 6 分钟演示视频就被测试用户指出 " 故意造假 ",因为实际测试时并没有如演示视频中 " 丝滑 "。

当时,Gemini 负责人否认故意造假,Google 很快发布了一篇博客文章解释了演示视频中的多模态交互过程,几乎承认了使用静态图片和多段提示词拼凑,才能达成这样的效果。但是 Google 对演示视频的这些 " 后期加工 ",网友认为是 " 虚假宣传 "、" 为了让自己看上去比竞争对手要强很多 " 等。

被 OpenAI 的巨大成功打了个措手不及后,Google 怎会甘心将人工智能的头把交椅拱手让人!

自去年谷歌首次正式推出了大模型 Gemini 并在一周后向开发者和企业客户开放 Gemini 1.0 产品能力后,今年来,Google 在大模型领域的产品节奏明显加快。

仅在今年 2 月,Google 已经连续放出 3 个大招:2 月 9 日 Google 宣布最强大模型 Gemini Ultra 可免费用,2 月 15 日发布大模型 Gemini 1.5,2 月 21 日推出新一代开源模型 Gemma。

Google 最新推出的开源模型 Gemma 被认为是,继通过 Gemini 拳打 OpenAI 后,试图用 Gemma 来脚踢走开源路线的 Meta。

开源模型 Gemma

Google 最新发布的开源模型 Gemma 采用与创建 Gemini 模型相同的研究和技术构建而成。

Gemma 主打轻量级、高性能。Gemma 模型有两种尺寸:Gemma 2B(20 亿个参数)和 Gemma 7B(70 亿个参数),Google 强调其拥有 " 同等规模最领先的性能 "。性能方面,Google 称 Gemma 在 MMLU、BBH、HumanEval 等八项基准测试集上大幅超过 Llama 2。

Google 还强调 Gemma 基于自研 TPUv5e 芯片训练,Gemma 7B 使用了 4096 个 TPUv5e,Gemma 2B 使用了 512 个 TPUv5e。

另外,Gemma 的独特之处还在于它能够在多种类型的设备上运行,包括笔记本电脑、台式机、物联网、移动设备和云端。

目前,Google 宣布 Gemma 在全球范围内开放使用。

Google 强调,Gemma 为开放社区构建,旨在推动开发者和研究人员的 AI 创新。用户可以通过 Kaggle 的免费访问权限、Colab notebooks 免费层、以及 Google Cloud 新用户可获得的 300 美元积分立即开始使用 Gemma。研究人员还可以申请高达 50 万美元的 Google Cloud 积分以加速他们的项目。