“问小白”发布第四代开源大模型 XBai o4

IP属地中国·北京 编辑：赵云飞 Chinaz 时间：2025-08-04 18:31:35

开源大模型领域迎来新突破。“问小白”正式发布其第四代开源模型 XBai o4，该模型在复杂推理能力上表现卓越，其 Medium 模式已全面超越 OpenAI o3-mini，并在部分基准测试中优于 Anthropic Claude Opus。
XBai o4引入了创新的“反思型生成范式”，通过结合 Long-CoT 强化学习和过程评分学习，实现了深度推理和高效推理链路筛选，同时显著降低了推理成本。
技术突破:独创“反思型生成范式”
XBai o4的核心创新在于其独有的“反思型生成范式”（reflective generative form）。这一范式将 Long-CoT 强化学习与过程评分学习（Process Reward Learning）相结合，使得单个模型能够同时完成两个关键任务:
深度推理: 像人类一样进行多步骤的复杂思考。
高质量推理链路筛选: 能够评估和选择最优的推理路径。
更值得关注的是，XBai o4通过共享过程评分模型（PRMs）和策略模型的主干网络，将过程评分的推理耗时降低了99%。这一优化大幅提升了模型的运行效率，为实际应用提供了坚实基础。
性能卓越:多基准测试领先
XBai o4模型提供了三种模式（low、medium、high），以适应不同复杂度的任务需求。在多项关键基准测试中，其强大性能得到了充分验证:
在 Medium 模式下，XBai o4全面超越了 OpenAI 的 o3-mini 模型。
在部分基准测试中，其表现甚至优于 Anthropic 的 Claude Opus。
该模型在 AIME24、AIME25、LiveCodeBench v5、C-EVAL 等多个测试中均展现出卓越的推理能力。
“问小白”已在 GitHub 上开源了相关的训练和评估代码，这不仅为 AI 研究社区提供了宝贵的资源，也预示着开源大模型在复杂推理领域的竞争力正在迅速增强。
地址:https://github.com/MetaStone-AI/XBai-o4

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

360首席科学家潘剑锋：智能体安全的核心，是驾驭AI不确定性

OpenAI算力“内战”：Codex如何鲸吞Token，改写内部资源分配规则

AI协同办公迎“四国杀”！金山办公副总裁王冬：付费逻辑转向企业为价值买单

三年改名八次后，字节前员工创办的演语科技估值涨到20亿美金

飞书广州峰会落地，聚焦制造业AI协作升级

OpenAI发布GPT-5.6系列模型，应美政府要求限量开放，直言不应成为长期默认做法

全站最新

广东高温下货车供电怎么选？适配性与耐受力是关键考量

360首席科学家潘剑锋：智能体安全的核心，是驾驭AI不确定性

OpenAI算力“内战”：Codex如何鲸吞Token，改写内部资源分配规则

AI协同办公迎“四国杀”！金山办公副总裁王冬：付费逻辑转向企业为价值买单

热门推荐

中信股份成立企管合伙企业

从旷视“5号员工”到极豪掌门人，90后清华学霸陈可卿携极豪冲刺IPO

DeepSeek大扩军：从模型突破到平台化，如何平衡规模与锋利？

360首席科学家潘剑锋：智能体安全的核心，是驾驭AI不确定性

OpenAI算力“内战”：Codex如何鲸吞Token，改写内部资源分配规则

AI协同办公迎“四国杀”！金山办公副总裁王冬：付费逻辑转向企业为价值买单

三年改名八次后，字节前员工创办的演语科技估值涨到20亿美金

飞书广州峰会落地，聚焦制造业AI协作升级

OpenAI发布GPT-5.6系列模型，应美政府要求限量开放，直言不应成为长期默认做法

黄锐名下工作室以蛋黄酱命名

大疆跨界新作：ROMO 2系列扫地机器人携无人机技术开启地面清洁新篇章

智元机器人数采2.0体系发布，为西南具身智能产业规模化发展添新动力

美股芯片股全线大跌，安森美半导体跌超20%，中概股走势分化，迅雷涨超10%

全球性能第一！国家超算互联网存储系统登顶

腾讯音乐研究院发布《2025华语数字音乐年度白皮书》，深度解读AI与超级粉丝趋势