当前位置: 首页 » 资讯 » 科技头条 » 正文

Apache 2.0 协议加持!谷歌 Gemma 4 正式开源:31B 参数性能直逼头部大模型

IP属地 中国·北京 编辑:江紫萱 Chinaz 时间:2026-04-04 02:12:46

4月3日凌晨,Google DeepMind 正式发布新一代开源模型系列 Gemma4。此次更新距离上一代产品发布整整一年,谷歌不仅在性能上实现了“代际跨越”,更在开源诚意上放出了大招:将许可证由自有协议彻底更换为全球通用的 Apache2.0,这意味着开发者可以更自由地进行商用与二次开发。

规格全覆盖:从手机端到工作站的“四剑客”

Gemma4 此次一口气推出了四款不同规格的模型,实现了全场景覆盖:

31B Dense(旗舰版):310亿全激活参数,支持256K 超长上下文。在 Arena AI 开源排行榜中高居第三,未量化版本仅需一张 H100即可运行。

26B A4B MoE(性价比之王): 采用混合专家架构,总参数252亿,激活参数仅为38亿。其推理速度接近4B 模型,但质量远超同级别产品,位列排行榜第六。

E4B & E2B(端侧精英): 专为手机和嵌入式设备优化。通过 Per-Layer Embeddings 技术,有效参数分别压缩至45亿和23亿。其中 E2B 在部分设备上的内存占用可压至1.5GB 以下。

性能狂飙:代码与数学能力实现代际飞跃

相比上一代 Gemma327B,Gemma4 的核心指标提升堪称惊人:

数学竞赛: AIME2026测试从20.8% 飙升至 89.2%。

编程进化: Codeforces ELO 评分从110拉升至 2150,在 LiveCodeBench 测试中从29.1% 涨至80.0%,成为目前最可用的开源编程辅助模型之一。

综合推理: 研究生级科学问答(GPQA Diamond)得分从42.4% 几乎翻倍至 84.3%。

多语言能力: 原生支持140多种语言,MMMLU 评分达88.4%。

核心特性:内置“思考模式”与 Agent 基因

Gemma4 不仅仅是参数的增长,更在交互逻辑上向旗舰 Gemini 看齐:

Thinking Mode: 内置可开关的思考模式,模型在输出答案前会先进行内部推理,极大提升了多步骤规划类任务的准确性。

原生 Agent 支持: 支持函数调用和结构化 JSON 输出。谷歌同步发布了开源 Agent 开发工具包(ADK),让端侧模型也能变身“智能体”。

深度多模态: 所有版本均支持图像和视频输入,小模型版本甚至额外自带了音频编码器,支持语音识别与翻译。

行业观察:开源赛道的“权力重组”

在过去的一年里,国内开源模型(如 DeepSeek、Qwen、GLM 等)迭代极快,谷歌在开源领域的影响力一度被削弱。Gemma4 的发布,标志着谷歌正通过“极致的端侧工程化”与“更彻底的协议开放”重回主战场。

结语:当大厂开始讲“诚意”

从自定义协议转向 Apache2.0,谷歌用实际行动回答了开源诚意的问题。当31B 规模的模型能跑出接近闭源旗舰的性能,且能流畅运行在消费级显卡甚至手机上时,全球 AI 开发者的创作边界将再次被拓宽。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。