财经中国

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

  • 全部
  • 财经头条
  • 科技头条
  • 财经人物
  • 金融市场
  • 财经数据
  • 股市速递
  • AI 大模型
  • 智能汽车
  • 英伟达推出AI框架Polar,让Codex跑分暴涨594.74%

    英伟达推出AI框架Polar,让Codex跑分暴涨594.74%

    05/28
  • Google研究团队首创VGGRPO:让AI生成的视频不再"几何漂移"

    04/09
  • 普渡大学首创f-GRPO:让AI对齐变得像调音师一样精准

    03/13
  • JustGRPO:扩散语言模型的极简主义回归

    01/29
  • JustGRPO:扩散语言模型的极简主义回归

    01/29
  • 挑战GRPO,英伟达提出GDPO,专攻多奖励优化

    01/12
  • DeepSeek-V3.2巨「吃」Token,竟然是被GRPO背刺了

    12/04
  • 难样本筛选破局SFT依赖,GRPO-only斩获感知推理双最优

    11/28
  • 快手可灵 x 中山大学推出「GRPO卫兵」,显著缓解视觉生成过优化

    11/13
  • 腾讯优图GRPO:实现免训练AI智能优化

    11/11
  • X上63万人围观的Traning-Free GRPO:把GRPO搬进上下文空间学习

    10/22
  • 不强化学习也能推理,哈佛采样算法让基础模型比肩GRPO后训练版本

    10/22
  • 科普向:一文解构大模型后训练,GRPO和它的继任者们的前世今生

    09/01
  • 冗长响应缩减80%,DeepSeek GRPO获得颠覆性改进,微软GFPO问世

    08/14
  • DeepSeek的GRPO会导致模型崩溃?看下Qwen3新范式GSPO

    08/07
  • DeepSeek的GRPO会导致模型崩溃?看下Qwen3新范式GSPO

    08/07
  • 混元开源新方案 MixGRPO:训练效率大幅提升,性能反而更强

    08/04
  • 训练时间减半,性能不降反升!腾讯混元开源图像生成高效强化方案MixGRPO

    研究团队发现,即使滑动窗口保持不动(Frozen),仅优化较早的时间步,MixGRPO依然能够取得良好效果,尤其是在ImageReward和UnifiedReward指标上表现突出。 在评估计算开销时,研究…

    08/02
  • 苹果发布DiffuCode-7B-cpGRPO编程AI模型:基于Qwen2.5-7B,可不按顺序生成代码

    性能媲美顶级开源编码模型。

    07/06
    全部热门
  • 首款天玑9500s风冷手机来了!OPPO K15 Pro系列

    04/01 16:41

  • 微软在干嘛:Linux打游戏反超Windows!没有原

    04/01 16:41

  • 雷军:5小时,直播拆一台新SU7

    04/01 16:41

  • 中国联通提出新框架MeanCache,刷新多模态生成

    04/01 16:41

  • 农发行湖北省分行被罚150万,涉违反金融统计管

    10/31 16:58

  • 浙江平湖农商行被罚450万,涉关联交易管理不审

    10/31 16:58

  • 老铺黄金距离奢侈品牌有多远?

    10/31 16:56

  • 文华东方300亿元赎身,“老钱”找新路子了

    10/31 16:56

  • 思妍丽入局,美丽田园能否完成“二次蜕变”

    10/31 16:56

  • 预售比现货贵背刺“所有女生”,李佳琦们黄金

    10/31 16:56

关于我们| 联系方式| 用户协议| 隐私政策| 版权声明| 网站地图| 友情链接| 财经头条| 酒业之家
©2008-2025 DESTOON All Rights Reserved 京公网安备 11011402013531号