谷歌推出轻量级AI模型Gemma

2024-02-22 人工智能谷歌开源模型本地计算

最近，谷歌在Gemini系列之外，发布了一款名为Gemma的新型AI模型。它主要面向研究人员，特点是体积小巧，可以在个人电脑上本地运行。这为那些希望直接利用本地算力、而非依赖云端服务的研究者提供了新的选择。

Gemma是什么

简单来说，Gemma是谷歌推出的一系列轻量级、开源的人工智能模型。它由谷歌DeepMind团队及其他团队共同开发，其名称源自拉丁语中的“宝石”。与谷歌此前力推的Gemini模型不同，Gemma的定位更侧重于“小巧”和“本地化”。它共享了Gemini模型的部分核心技术，但体积更小，旨在让研究人员能在自己的笔记本电脑或台式机上直接运行和使用。

两种型号与核心特点

Gemma目前提供了两种具体型号：参数为20亿的Gemma 2B和参数为70亿的Gemma 7B。尽管在技术上属于“小模型”，但谷歌声称，它们在多项关键性能基准测试中，表现超过了某些参数规模更大的知名模型。

它的核心特点在于其部署的灵活性。研究人员可以获得“经过预训练和指导调整的Gemma模型”，这些模型不仅可以在本地设备上运行，也支持在云端部署。谷歌特别对其进行了优化，使其能高效运行在NVIDIA的GPU和自家的Google Cloud TPU上。

如何获取与使用

对于研究人员而言，获取Gemma的途径比较友好。谷歌已经在Kaggle平台和Colab笔记本环境中免费提供了Gemma。如果通过Google Cloud使用，新用户可以获得300美元的免费额度起步。此外，谷歌还提供了丰富的工具链支持，包括与主流开发框架（如PyTorch、TensorFlow）的集成，以及即用型的代码笔记本，旨在降低研究人员的上手门槛。

背后的责任与安全考量

在发布模型的同时，谷歌也强调了其“负责任的人工智能”原则。我的理解是，他们为Gemma配套发布了一个“负责任生成式AI工具包”。这个工具包旨在帮助开发者更安全地使用模型，其内容包括安全内容分类方法、模型行为调试工具以及相关的开发实践指南。这表明，在推动技术开放的同时，谷歌也试图为模型的使用设定一些安全护栏。

总结

总体来看，Gemma的推出，是谷歌在大型模型之外，对轻量级、可本地部署AI模型领域的一次重要布局。它降低了研究人员接触和实验前沿AI技术的硬件门槛，并提供了相对灵活和开放的使用条款。这或许会进一步促进在个人计算设备上进行AI研究和应用创新的可能性。