Google Bard:向全球开放的AI助手
在人工智能助手竞争日益激烈的今天,谷歌也正式加入了面向公众的赛道。2023年5月,谷歌宣布其AI对话工具Bard取消了候补名单,向全球超过180个国家和地区的用户开放。这不仅是服务范围的扩大,也伴随着一系列新功能的推出,标志着谷歌正加速将生成式AI融入其产品生态。
核心升级:从LaMDA到PaLM 2
Bard的能力提升,很大程度上得益于其底层模型的更换。此前,Bard运行在谷歌的LaMDA模型上。而此次更新后,它的核心驱动换成了谷歌新发布的PaLM 2系列大型语言模型。根据谷歌的介绍,PaLM 2带来了更高级的数学与推理技能,并且在代码生成方面能力更强。我的理解是,这类似于OpenAI为ChatGPT升级到GPT-4,旨在通过更强大的基础模型,直接提升AI助手的综合表现。
新功能亮点:看得见、连得上
为了让Bard变得更实用,谷歌为它添加了几个直观的新能力。 * 视觉交互:谷歌计划将Google Lens(谷歌镜头)集成到Bard中。这意味着用户可以在提问时附带照片或图片。例如,上传一张宠物的照片,Bard可以识别其品种,并应要求为照片生成有趣的标题。 * 服务集成与扩展:Bard正变得更“开放”。一方面,谷歌计划逐步将其现有应用(如Docs文档、Gmail、地图等)的功能融入Bard的体验中。例如,用户可以将Bard生成的回复直接导出到Gmail或Docs,快速开始起草邮件或文档。另一方面,类似ChatGPT的插件,谷歌也在为Bard开发“扩展”,让它能连接外部服务。演示中展示了与Adobe Firefly(一款AI图像生成模型)的联动,可以在Bard内直接生成派对图片。谷歌表示,正在与Kayak、OpenTable等多家服务商合作构建此类扩展。 * 开发者工具增强:对于编程用户,Bard现在生成的代码会包含引用来源。点击注释,就能看到代码段对应的原始出处。此外,还提供了将代码一键导出到Colab或Replit等编程环境的按钮,方便直接运行和测试。
可用性与未来
目前,只要拥有谷歌账户,并且在支持的180多个国家和地区(具体列表可参考官方支持页面),就可以访问英文版的Bard。不过,加拿大和欧洲大部分地区暂时还不在支持范围内,谷歌表示会尽快扩大覆盖区域。此外,Bard也终于支持了用户呼声很高的深色主题模式。
总体来看,Bard的全面开放和功能更新,是谷歌“将生成式人工智能融入一切”战略的明确一步。它正从一个单纯的对话机器人,向一个能“看见”图像、能连接多种内外服务的多功能助手演进。这场AI助手之间的竞赛,无疑将给普通用户带来更多样化的选择。