谷歌推出轻量级AI模型Gemma

2024-02-22 人工智能 谷歌 开源模型 本地计算
谷歌推出轻量级AI模型Gemma

最近,谷歌在Gemini系列之外,发布了一款名为Gemma的新型AI模型。它主要面向研究人员,特点是体积小巧,可以在个人电脑上本地运行。这为那些希望直接利用本地算力、而非依赖云端服务的研究者提供了新的选择。

Gemma是什么

简单来说,Gemma是谷歌推出的一系列轻量级、开源的人工智能模型。它由谷歌DeepMind团队及其他团队共同开发,其名称源自拉丁语中的“宝石”。与谷歌此前力推的Gemini模型不同,Gemma的定位更侧重于“小巧”和“本地化”。它共享了Gemini模型的部分核心技术,但体积更小,旨在让研究人员能在自己的笔记本电脑或台式机上直接运行和使用。

两种型号与核心特点

Gemma目前提供了两种具体型号:参数为20亿的Gemma 2B和参数为70亿的Gemma 7B。尽管在技术上属于“小模型”,但谷歌声称,它们在多项关键性能基准测试中,表现超过了某些参数规模更大的知名模型。

它的核心特点在于其部署的灵活性。研究人员可以获得“经过预训练和指导调整的Gemma模型”,这些模型不仅可以在本地设备上运行,也支持在云端部署。谷歌特别对其进行了优化,使其能高效运行在NVIDIA的GPU和自家的Google Cloud TPU上。

如何获取与使用

对于研究人员而言,获取Gemma的途径比较友好。谷歌已经在Kaggle平台和Colab笔记本环境中免费提供了Gemma。如果通过Google Cloud使用,新用户可以获得300美元的免费额度起步。此外,谷歌还提供了丰富的工具链支持,包括与主流开发框架(如PyTorch、TensorFlow)的集成,以及即用型的代码笔记本,旨在降低研究人员的上手门槛。

背后的责任与安全考量

在发布模型的同时,谷歌也强调了其“负责任的人工智能”原则。我的理解是,他们为Gemma配套发布了一个“负责任生成式AI工具包”。这个工具包旨在帮助开发者更安全地使用模型,其内容包括安全内容分类方法、模型行为调试工具以及相关的开发实践指南。这表明,在推动技术开放的同时,谷歌也试图为模型的使用设定一些安全护栏。

总结

总体来看,Gemma的推出,是谷歌在大型模型之外,对轻量级、可本地部署AI模型领域的一次重要布局。它降低了研究人员接触和实验前沿AI技术的硬件门槛,并提供了相对灵活和开放的使用条款。这或许会进一步促进在个人计算设备上进行AI研究和应用创新的可能性。