OpenAI 向开源模型迈出重要一步:六年来首次推出开放权重模型。
美东时间 8 月 5 日周二,OpenAI 发布了两个开放权重语言模型 gpt-oss-120b 和 gpt-oss-20b。这是 OpenAI 自 2019 年推出 GPT-2 以来首次发布开放权重模型,也是 OpenAI 与微软签署独家云服务协议六年来问世的首批此类模型。
评论认为,OpenAI 的新模型直接回应了 Meta、微软支持的 Mistral AI 以及中国初创新星 DeepSeek 等竞争对手在开放权重模型领域的挑战。
CEO Sam Altman 在社交媒体表示:
"gpt-oss 是一个重大突破,这是最先进的开放权重推理模型,具有与 o4-mini 相当的强大现实世界性能,可以在你自己的电脑(或手机的较小版本)上本地运行。我们相信这是世界上最好、最实用的开放模型。"
gpt-oss-120b 和 gpt-oss-20b 被设计为低成本的 GPT 模型选项,开发者、研究人员和企业可以轻松运行和定制。gpt-oss-20b 可在 16GB 内存的笔记本电脑上运行,gpt-oss-120b 需要约 80GB 内存,两款模型均支持高级推理、工具使用和思维链处理。
Altman 称,这两款模型可在个人电脑(PC)甚至手机上本地运行,无需互联网连接,为用户提供完全的控制权和隐私保护。
同时,亚马逊宣布将首次向客户提供 OpenAI 的模型,计划在其 Bedrock 和 SageMaker 平台上提供 OpenAI 的开放 AI 权重新模型。这是云计算巨头亚马逊首次提供 OpenAI 的产品。
gpt-oss-20b 和 120b 的发布标志着 OpenAI 战略转向的重要节点,此前该公司多次推迟开放权重模型发布,并进行了广泛的安全测试和评估,以确保模型不被恶意利用。
所谓的开放权重是介于开源和闭源的一种中间形态,意味着企业和政府机构可以自主运行该模型,因为他们可以查看模型的权重并进行修改。而开源的情况下,用户可以查看模型的源代码组成,有时包括训练和权重分配方式。
此前评论认为,OpenAI 推出开放权重模型可能削弱微软在 AI 业务中的独家优势。本周二 OpenAI 称,微软会将 gpt-oss-20b 模型的 GPU 优化版本引入 Windows 设备。这些模型由 ONNX Runtime 支持,支持本地推理,可通过 Foundry Local 和 AI Toolkit for VS Code 获取,从而让 Windows 开发者更轻松地使用开放模型进行构建。
gpt-oss-120b 部分测试性能甚至超过 o4-mini 20b 部分测试超过 o3 ‑ mini
OpenAI 介绍,两款 gpt-oss 模型采用了其最先进的预训练和后训练技术,特别注重推理、效率和跨部署环境的实用性。它们都是使用专家混合(MoE)架构的 Transformer,以减少处理输入所需的活跃参数数量。
gpt-oss-120b 每个 token 激活 5.1 亿参数,总参数量为 1170 亿;gpt-oss-20b 激活 3.6B 参数,总参数量为 210 亿。模型使用交替的密集和局部带状稀疏注意力模式,支持高达 128k 的上下文长度。
OpenAI 称 gpt-oss-20b 是一款中型开放模型,gpt-oss-120b 则是可在"大多数台式机和笔记本电脑"上运行的大型开放模型。
OpenAI 表示,较小的模型至少需要 16GB 显存或统一内存才能发挥最佳性能,并且"非常适合高端消费级 GPU 和搭载苹果芯片的 Mac 电脑"。较大的全尺寸模型则需要至少 60GB 显存或统一内存。
在性能评估方面,OpenAI 披露,gpt-oss-120b 在核心推理基准测试中接近 OpenAI o4-mini 的表现。较小的 gpt-oss-20b 模型在相同评估中达到或超过 OpenAI o3-mini 的性能。
gpt-oss-120b 在竞赛编码(Codeforces)、通用问题求解(MMLU 和 HLE)以及工具调用(TauBench)方面均优于 OpenAI o3 ‑ mini,并匹敌甚至超越了 OpenAI o4-mini。它在健康相关查询(HealthBench )和竞赛数学(AIME 2024 和 2025)方面的表现甚至超过 o4-mini。
即使规模较小,gpt-oss-20b 在上述同类的评估中也匹敌甚至超越了 OpenAI o3 ‑ mini,甚至在竞赛数学和健康方面也超越了后者。
安全防护与恶意使用预防
OpenAI 对开放权重模型的安全性给予了特别关注,因为一旦发布,对手可能对模型进行恶意微调。该公司在预训练期间过滤了与化学、生物、放射性和核(CBRN)相关的有害数据。
为直接评估风险,OpenAI 对模型进行了专门的生物学和网络安全数据微调,创建了攻击者可能制作的特定领域非拒绝版本。经过内部和外部测试,这些恶意微调的模型无法达到其准备框架中的 " 高能力 " 阈值。
OpenAI 还与三个独立专家组合作,对其恶意微调评估提供反馈。Altman 强调:" 我们努力减轻最严重的安全问题,特别是在生物安全方面。gpt-oss 模型在内部安全基准测试中的表现与我们的前沿模型相当。"
生态系统部署与市场影响
两个模型在 Apache 2.0 许可下免费提供,用户可以通过 Hugging Face 和 GitHub 等平台下载。云服务提供商亚马逊、Baseten 和微软也将提供这些模型。
OpenAI 与包括 Azure、vLLM、Ollama、AWS、Fireworks 等领先部署平台合作,使开发者能够广泛使用这些模型。微软还将 GPU 优化版本的 gpt-oss-20b 模型引入 Windows 设备。
该公司正在举办红队挑战赛,奖金池为 50 万美元,鼓励全球研究人员、开发者和爱好者帮助识别新的安全问题。Altman 表示:" 我们相信这将带来更多好处而非坏处,我们期待这一发布能够实现新型研究并创造新型产品。"
竞争压力推动战略转变
OpenAI 此次发布开放权重模型很大程度上受到市场竞争压力驱动,特别是来自中国 DeepSeek 的挑战。自 2019 年以来,该公司一直专注于通过 API 提供专有模型服务,而竞争对手纷纷推出开放权重替代方案。
OpenAI 总裁 Greg Brockman 在本周二的记者会上表示:" 看到生态系统的发展令人兴奋,我们很高兴能为此做出贡献,真正推动前沿发展,然后看看会发生什么。"
OpenAI 与英伟达、AMD、Cerebras 和 Groq 等芯片制造商合作,确保模型在各种芯片上良好运行。英伟达 CEO 黄仁勋在声明中称:"OpenAI 向世界展示了在英伟达 AI 上可以构建什么——现在他们正在推进开源软件的创新。"
股票配资网大全,配资网app,股票开户去哪里开户好提示:文章来自网络,不代表本站观点。