当前位置: 首页 » 资讯 » 科技头条 » 正文

微博开源Vibe Thinker:15亿参数击败DeepSeek R1,后训练成本仅7800美元

IP属地 中国·北京 编辑:钟景轩 Chinaz 时间:2025-11-18 18:20:14

微博正式发布自研开源大模型Vibe Thinker,凭借 15 亿参数在国际顶级数学竞赛基准测试中击败 6710 亿参数的DeepSeek R1,准确率领先且单次“后训练”成本仅 7800 美元,比DeepSeek-R1 和MiniMax-M1 等模型低数十倍。

Vibe Thinker采用轻量化MoE架构与多轮知识蒸馏,官方称在5GB以下数学语料上即可完成高效微调,支持Hugging Face一键下载及商用许可。微博技术团队透露,模型在AIME 2025、HMMT等竞赛题库中平均得分较R1 提升3.4%,推理延迟降低42%,适用于教育、金融等实时场景。

开源版本提供PyTorch与GGUF格式,最低可在单张RTX4090 运行。微博同步开放训练脚本与数据配比方案,计划 12 月推出Vibe Thinker-Math专用数学增强版,并联合高校举办“轻量级数学挑战赛”,推动低成本高精度AI普及。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。