财经中国

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

  • 全部
  • 财经头条
  • 科技头条
  • 财经人物
  • 金融市场
  • 财经数据
  • 股市速递
  • AI 大模型
  • 智能汽车
  • 长文本挑战:1万tokens成新门槛,18款大模型性能集体下滑

    近期,一项针对大型语言模型(LLM)的研究揭示了一个惊人的发现:当输入文本的长度扩展到1万个tokens时,多个主流大模型的性能出现了显著下滑,宛如“智商”骤降。 这项研究由Chroma团队完成,他们利用升级…

    07/17
  • 1万tokens是检验长文本的新基准,超过后18款大模型集体失智

    07/17
  • 1万tokens是检验长文本的新基准,超过后18款大模型集体失智

    此外,模型对干扰项的响应存在差异:Claude系列倾向于在不确定时弃权(明确表示无法回答),幻觉率较低;GPT系列则更可能生成自信但错误的答案,受干扰影响更明显;Gemini和Qwen模型的表现波动较大,易…

    07/17
  • ChatGPT有望原生支持编辑Excel和PPT文件,OpenAI挑战微软Office

    OpenAI正在开发一个强大的AI智能体

    07/17
  • AWS也要入局,智能体商店成为大厂的新宠

    AWS在全球拥有数百万活跃用户和成千上万的合作伙伴。

    07/16
  • 谷歌安卓版Chrome浏览器正测试新搜索栏,新增AI Mode搜索入口

    快捷键被移到了搜索栏下方,为AI Mode快捷方式腾出了空间。

    07/15
  • 活久见,居然有科学家在论文里“贿赂”AI

    对于这件事,大家怎么看?

    07/14
  • Manus多平台账号清空 官网显示“地区不可用”

    Manus是中国的创业公司Monica发布的全球首款通用Agent(自主智能体)产品。

    07/11
  • 中兴努比亚宣布接入百度文心4.5开源大模型

    百度已于6月30日开源了文心大模型4.5系列。

    07/10
  • 4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能

    4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能

    07/09
  • 填补监管空白!全国首个直播带货合同示范文本发布

    该文本旨在厘清权责,填补商品推广监管空白,推动行业规范化发展。

    07/09
  • 北京发布全国首个直播带货合同示范文本

    07/08
  • 14%论文都有AI代写?Nature:每7篇就有1篇藏有ChatGPT特征词

    特征词大多都是风格性动词和形容词。

    07/06
  • 苹果发布DiffuCode-7B-cpGRPO编程AI模型:基于Qwen2.5-7B,可不按顺序生成代码

    性能媲美顶级开源编码模型。

    07/06
  •  «上一页   1   2   …   3   4   下一页»   共74条/4页 
    全部热门
  • 全球真C级豪华旗舰标杆 风云A9L置换价13.99万

    07/09 12:23

  • 风云A9L上市 超级置换抢购价13.99万元起

    07/09 12:23

  • 海豹06DM-i旅行版10.98万起,标配车载冰箱

    07/09 12:23

  • 30万元以内!乐道L90真能和理想较劲?

    07/09 12:23

  • 重塑全球真C级豪华旗舰标杆!风云A9L上市13.99

    07/09 12:22

  • 全球真C级旗舰风云A9L上市,抢购价13.99万元起

    07/09 12:22

  • 鉴真章 风云品牌焕新升级,风云A9L上市13.99万

    07/09 12:22

  • 网约车打一口价,原来是低人一等的?

    07/09 12:21

  • 游戏巨头Steam幕后:CEO隐居海上,六旬老人带7

    07/09 12:20

  • 4B小模型数学推理首超Claude 4,700步RL训练逼

    07/09 12:20

关于我们| 联系方式| 用户协议| 隐私政策| 版权声明| 网站地图| 友情链接| 财经头条| 酒业之家
©2008-2025 DESTOON All Rights Reserved 京公网安备 11011402013531号