当前位置: 首页 » 资讯 » 科技头条 » 正文

​印度版“DeepSeek”问世?Alpie 大模型凭借“套壳”技术逆袭榜单

IP属地 中国·北京 编辑:柳晴雪 Chinaz 时间:2026-01-15 12:24:46

印度人工智能领域近期杀出一匹黑马。由169PI 公司发布的Alpie大模型在多个国际主流 AI 榜单中表现抢眼,甚至在部分数学和软件工程指标上超越了 GPT-4o 和 Claude3.5,被业内称为印度版的“DeepSeek”。

尽管是一款仅有320亿参数的小规模模型,Alpie的实测数据却令人惊叹。在衡量数学能力的 GSM8K 榜单上,它的表现不仅超过了 DeepSeek V3,还与GPT-4o齐头并进。而在评估软件工程能力的 SWE 榜单中,它更是力压 Claude3.5等顶尖模型,展现出极强的逻辑处理能力。

然而,亮眼的成绩单背后也伴随着不小的争议。技术拆解显示,Alpie并非完全由印度团队从零训练,而是基于中国开源模型DeepSeek-R1-Distill-Qwen-32B进行的二次开发。换言之,它是通过对中国开源基座进行“蒸馏+量化”处理后的产物。

虽然被质疑是“套壳”,但Alpie的商业价值不容小觑。通过4bit 量化技术,该模型极大地降低了运行门槛,显存占用直降75%,仅需16-24GB 的民用级显卡即可流畅运行。这种“高性价比”路线使其推理成本仅为GPT-4o的十分之一,为中小型开发者提供了极具竞争力的选择。

划重点:

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。