Google Bard：向全球开放的AI助手

2023-05-18 人工智能谷歌 Bard 科技动态

在人工智能助手竞争日益激烈的今天，谷歌也正式加入了面向公众的赛道。2023年5月，谷歌宣布其AI对话工具Bard取消了候补名单，向全球超过180个国家和地区的用户开放。这不仅是服务范围的扩大，也伴随着一系列新功能的推出，标志着谷歌正加速将生成式AI融入其产品生态。

核心升级：从LaMDA到PaLM 2

Bard的能力提升，很大程度上得益于其底层模型的更换。此前，Bard运行在谷歌的LaMDA模型上。而此次更新后，它的核心驱动换成了谷歌新发布的PaLM 2系列大型语言模型。根据谷歌的介绍，PaLM 2带来了更高级的数学与推理技能，并且在代码生成方面能力更强。我的理解是，这类似于OpenAI为ChatGPT升级到GPT-4，旨在通过更强大的基础模型，直接提升AI助手的综合表现。

新功能亮点：看得见、连得上

为了让Bard变得更实用，谷歌为它添加了几个直观的新能力。 * 视觉交互：谷歌计划将Google Lens（谷歌镜头）集成到Bard中。这意味着用户可以在提问时附带照片或图片。例如，上传一张宠物的照片，Bard可以识别其品种，并应要求为照片生成有趣的标题。 * 服务集成与扩展：Bard正变得更“开放”。一方面，谷歌计划逐步将其现有应用（如Docs文档、Gmail、地图等）的功能融入Bard的体验中。例如，用户可以将Bard生成的回复直接导出到Gmail或Docs，快速开始起草邮件或文档。另一方面，类似ChatGPT的插件，谷歌也在为Bard开发“扩展”，让它能连接外部服务。演示中展示了与Adobe Firefly（一款AI图像生成模型）的联动，可以在Bard内直接生成派对图片。谷歌表示，正在与Kayak、OpenTable等多家服务商合作构建此类扩展。 * 开发者工具增强：对于编程用户，Bard现在生成的代码会包含引用来源。点击注释，就能看到代码段对应的原始出处。此外，还提供了将代码一键导出到Colab或Replit等编程环境的按钮，方便直接运行和测试。

可用性与未来

目前，只要拥有谷歌账户，并且在支持的180多个国家和地区（具体列表可参考官方支持页面），就可以访问英文版的Bard。不过，加拿大和欧洲大部分地区暂时还不在支持范围内，谷歌表示会尽快扩大覆盖区域。此外，Bard也终于支持了用户呼声很高的深色主题模式。

总体来看，Bard的全面开放和功能更新，是谷歌“将生成式人工智能融入一切”战略的明确一步。它正从一个单纯的对话机器人，向一个能“看见”图像、能连接多种内外服务的多功能助手演进。这场AI助手之间的竞赛，无疑将给普通用户带来更多样化的选择。