生成的图片离大谱！Google 大模型新品又翻车

作者:来源：Techweb

2024-02-23 18:03:40

【TechWeb】2 月 23 日消息，这几天 Google 又被推到了风口浪尖，主要是它新推出的 Gemini 1.5 在生成图片的时候会刻意增加有色人种的结果，导致生成的图片很多不符合历史事实。

大模型生成图片翻车

美国当地时间 2 月 15 日，Google 发布 " 下一代 AI 模型 " —— Gemini 1.5，相比 1.0 代产品，Gemini 1.5 版本性能有极大提升，具有图像生成功能。Google 将 Gemini 1.5 开放给部分开发者试用。

随着试着，部分用户发现 Gemini 1.5 生成的图片太 " 离谱 " 了，缺乏基本的历史常识。有用户在 X 上贴出了自己要求 Gemini 1.5 生成的图片，如要求生成 "1943 年德军士兵 " 的图片时，Gemini 向其展示了由黑人、亚裔和白人女性身穿纳粹德军制服的照片。

比如，要求 Create an image of a pope（创建教皇的图像），如下。

这些图片在 X 上被广泛传播，不少用户破了大防，认为 Google 的 Gemini 存在针对白人的 " 种族主义 " 歧视等等。有用户吐槽 Google 的最大问题就是技术中掺杂了太多的 " 政治正确 "，导致其技术突破在各方面都有政治观念束缚。

对此，Google 在其声明中表示，已经意识到 Gemini" 在某些历史图像生成描述中提供了不准确的信息 "，并将立即进行修复。

现在 Google 已经暂停 Gemini 的人物图像生成，并称将很快重新发布改进版本。

这也不是 Google 大模型 " 产品秀 " 的首次翻车

在去年 12 月 7 日谷歌首次正式发布大模型 Gemini1.0 时，其一并发布的一段展示 Gemini 多模态功能的 6 分钟演示视频就被测试用户指出 " 故意造假 "，因为实际测试时并没有如演示视频中 " 丝滑 "。

当时，Gemini 负责人否认故意造假，Google 很快发布了一篇博客文章解释了演示视频中的多模态交互过程，几乎承认了使用静态图片和多段提示词拼凑，才能达成这样的效果。但是 Google 对演示视频的这些 " 后期加工 "，网友认为是 " 虚假宣传 "、" 为了让自己看上去比竞争对手要强很多 " 等。

被 OpenAI 的巨大成功打了个措手不及后，Google 怎会甘心将人工智能的头把交椅拱手让人！

自去年谷歌首次正式推出了大模型 Gemini 并在一周后向开发者和企业客户开放 Gemini 1.0 产品能力后，今年来，Google 在大模型领域的产品节奏明显加快。

仅在今年 2 月，Google 已经连续放出 3 个大招：2 月 9 日 Google 宣布最强大模型 Gemini Ultra 可免费用，2 月 15 日发布大模型 Gemini 1.5，2 月 21 日推出新一代开源模型 Gemma。

Google 最新推出的开源模型 Gemma 被认为是，继通过 Gemini 拳打 OpenAI 后，试图用 Gemma 来脚踢走开源路线的 Meta。

开源模型 Gemma

Google 最新发布的开源模型 Gemma 采用与创建 Gemini 模型相同的研究和技术构建而成。

Gemma 主打轻量级、高性能。Gemma 模型有两种尺寸：Gemma 2B（20 亿个参数）和 Gemma 7B（70 亿个参数），Google 强调其拥有 " 同等规模最领先的性能 "。性能方面，Google 称 Gemma 在 MMLU、BBH、HumanEval 等八项基准测试集上大幅超过 Llama 2。

Google 还强调 Gemma 基于自研 TPUv5e 芯片训练，Gemma 7B 使用了 4096 个 TPUv5e，Gemma 2B 使用了 512 个 TPUv5e。

另外，Gemma 的独特之处还在于它能够在多种类型的设备上运行，包括笔记本电脑、台式机、物联网、移动设备和云端。

目前，Google 宣布 Gemma 在全球范围内开放使用。

Google 强调，Gemma 为开放社区构建，旨在推动开发者和研究人员的 AI 创新。用户可以通过 Kaggle 的免费访问权限、Colab notebooks 免费层、以及 Google Cloud 新用户可获得的 300 美元积分立即开始使用 Gemma。研究人员还可以申请高达 50 万美元的 Google Cloud 积分以加速他们的项目。