强化学习训练数据则涵盖了STEM问题、代码任务等四大类,其中数学数据因其强大的泛化能力,能够广泛提升模型在各任务中的性能。评估结果显示,在数学推理领域,Seed1.5-Thinking在AIME 2024中…
字节跳动推出的Seed1.5-Thinking是一款具备卓越推理能力的混合专家模型(MoE),其激活参数为200亿,总参数达2000亿。 在模型开发方面,数据、强化学习(RL)算法和RL基础设施是三个关键要…
本次升级包含以下主要变化:混合推理架构:一个模型同时支持思考模式与非思考模式;更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;更强的Agen…
智东西8月21日报道,今天,字节跳动Seed团队开源了Seed-OSS系列模型,这些模型专为长上下文、推理、Agent和通用场景设计,将上下文窗口扩展至512k,是业界常见上下文窗口(128k)的4倍,GP…
目前,字节跳动的世界模型项目已进入攻坚阶段,该项目由前通义千问核心成员周畅带队,依托抖音/TikTok的海量视频数据与自研E-4D框架,剑指虚拟世界模拟与机器人训练等前沿领域。The Informatio…
代码能力超强。
创业公司的估值一直反映着CEO出售愿景的能力
07/09 12:23
07/09 12:22
07/09 12:21
07/09 12:20