OpenAI 开源新模型：本地部署的轻量级选择

2025-08-06 OpenAI 开源模型本地部署 AI

最近，OpenAI 发布了两款新的开源语言模型，为开发者和技术爱好者提供了在本地硬件上运行强大 AI 的新可能。我的理解是，这标志着大型模型技术正变得更加“亲民”，让更多人有机会接触和定制 AI。本文将以普通读者能理解的方式，梳理这次发布的核心信息。

两款模型的主要区别

根据官方信息，OpenAI 这次开源了 gpt-oss-120b 和 gpt-oss-20b 两个模型。它们的主要区别在于规模和适用场景。

gpt-oss-120b 拥有 1170 亿参数（其中 51 亿为活动参数），定位是适用于生产环境和需要高推理能力的通用场景。一个关键点是，它经过优化，可以在单个 H100 这样的高性能 GPU 上运行。

而 gpt-oss-20b 规模较小，有 210 亿参数（36 亿活动参数）。它更适合对延迟要求较低的场景，或者一些特殊的本地化用例，对硬件的要求也相对更低。

从提供的素材来看，这两款模型有几个值得关注的亮点。

首先是宽松的许可证。它们在 Apache 2.0 许可证下提供，这意味着用户可以相对自由地进行实验、定制甚至商业部署，没有太多版权或专利方面的顾虑。

其次是强大的功能。模型具备所谓的“Agentic 功能”，原生支持函数调用、网页浏览和 Python 代码执行等，这让它们能完成更复杂的任务。此外，它们还提供“完整的思路链”，开发者可以查看模型的推理过程，这有助于调试和增强对输出的信任。

最后是高效的部署。模型使用了名为“原生 MXFP4”的量化技术进行训练，这使得 gpt-oss-20b 甚至可以在 16GB 内存的消费级硬件上运行，大大降低了使用门槛。

如果你有兴趣尝试，有几种主要的获取和运行方式。

对于大多数想在个人电脑上体验的用户，素材推荐使用 Ollama 或 LM Studio 这类工具。它们提供了简化的命令，比如运行 ollama pull gpt-oss:20b 就能拉取并运行较小的模型，过程相对便捷。

对于更专业的开发者，如果需要完整的模型文件，可以直接从 Hugging Face 平台下载原始权重。这需要一定的技术背景，并使用特定的命令行工具。

在运行环境上，需要准备 Python 3.12。不同操作系统还有额外要求：macOS 需要安装 Xcode 命令行工具，Linux 需要 CUDA 环境，而 Windows 用户则建议通过上述的 Ollama 等方案来运行。

在尝试使用前，有几个技术细节需要了解。

模型是使用 OpenAI 特定的“和声反应格式”进行训练的，并且只能与这种格式一起使用。这意味着如果采用其他交互方式，模型可能无法正常工作。

另外，模型支持“可配置的推理力度”，用户可以根据自己对响应速度或精度的需求，在低、中、高之间进行调整。它们也支持微调，允许用户根据自己的特定任务进一步定制模型。

总的来说，OpenAI 这次开源的两款模型，为在本地或低成本环境下部署实用的 AI 能力提供了新的选项。它们平衡了性能与资源消耗，并附带了友好的开源许可。对于想要深入探索或应用 AI 的个人和小型团队来说，这无疑是一个值得关注的进展。