grpo_资讯搜索_财经中国

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

GRPO过时了吗？

GRPO过时了吗？

06/21

GRPO过时了吗？

GRPO过时了吗？

06/21

GRPO过时了吗？

GRPO过时了吗？

06/21

GRPO过时了吗？

GRPO过时了吗？

06/21

英伟达推出AI框架Polar，让Codex跑分暴涨594.74%

英伟达推出AI框架Polar，让Codex跑分暴涨594.74%

05/28

Google研究团队首创VGGRPO：让AI生成的视频不再"几何漂移"

04/09

普渡大学首创f-GRPO：让AI对齐变得像调音师一样精准

03/13

JustGRPO：扩散语言模型的极简主义回归

01/29

JustGRPO：扩散语言模型的极简主义回归

01/29

挑战GRPO，英伟达提出GDPO，专攻多奖励优化

01/12

DeepSeek-V3.2巨「吃」Token，竟然是被GRPO背刺了

12/04

难样本筛选破局SFT依赖，GRPO-only斩获感知推理双最优

11/28

快手可灵 x 中山大学推出「GRPO卫兵」，显著缓解视觉生成过优化

11/13

腾讯优图GRPO：实现免训练AI智能优化

11/11

X上63万人围观的Traning-Free GRPO：把GRPO搬进上下文空间学习

10/22

不强化学习也能推理，哈佛采样算法让基础模型比肩GRPO后训练版本

10/22

科普向：一文解构大模型后训练，GRPO和它的继任者们的前世今生

09/01

冗长响应缩减80%，DeepSeek GRPO获得颠覆性改进，微软GFPO问世

08/14

DeepSeek的GRPO会导致模型崩溃？看下Qwen3新范式GSPO

08/07

DeepSeek的GRPO会导致模型崩溃？看下Qwen3新范式GSPO

08/07

«上一页 1 2 下一页» 共23条/2页

全部热门

中国支付的全球水路，谁来打通？
06/25 00:17
华峰化学关联并购迷雾：“高盈利+高负债”模式
06/25 00:17
京东与魔法原子达成战略合作目标销售额10亿元
06/25 00:17
意法半导体推出全球首款后量子密码移动安全芯
06/25 00:17
ChatGPT语音模式被曝本周大升级！被打断也能自
06/25 00:17
三星Galaxy Z Flip8国行版回归高通平台：自研
06/25 00:16
ISC2026发布IO500最新榜单中科曙光存储系统登
06/25 00:16
周鸿祎不再做“安全龙虾”了，要做中国版Mytho
06/25 00:16
五部门联合启动工业5G独立专网试点
06/25 00:15
商汤科技贾安亚：AI行业正从“能用”走向“好
06/25 00:15