财经中国

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

  • 全部
  • 财经头条
  • 科技头条
  • 财经人物
  • 金融市场
  • 财经数据
  • 股市速递
  • AI 大模型
  • 智能汽车
  • 在一台1970年代的PDP-11上训练Transformer要多久?答案是5.5分钟

    04/18
  • 石溪大学:状态空间模型挑战Transformer视觉语言领域主导地位

    04/01
  • 石溪大学:状态空间模型挑战Transformer视觉语言领域主导地位

    04/01
  • 石溪大学:状态空间模型挑战Transformer视觉语言领域主导地位

    03/31
  • 石溪大学:状态空间模型挑战Transformer视觉语言领域主导地位

    03/31
  • 早于DeepSeek Engram!用「查表」重置Transformer记忆 | ICLR

    03/31
  • Kimi“打破Transformer架构”真相

    03/25
  • 太疯了!MIT博士在Transformer里造计算机,攻破LLM终极缺陷

    03/21
  • 亚马逊时隔12年重启智能手机项目:内部代号Transformer

    曾致1.7亿美元巨亏,亚马逊再战苹果三星,拟推无App商店AI手机。

    03/20
  • 马斯克深夜点赞炸场!Kimi撕开Transformer十年铁幕,中国AI亮剑

    要知道,马斯克对AI技术的表态向来“毒舌”:2023年他批评GPT-4“缺乏创新”,2024年嘲讽GoogleGemini“过度营销”,却对Kimi团队的论文用了“Interesting approach(…

    03/20
  • Kimi“打破Transformer架构”真相

    它并非推翻Transformer的神话,而是为这座大厦添上了一块关键的砖石。

    03/19
  • 山大、理想汽车和中科院联合提出新范式:让Transformer去其糟粕

    03/16
  • ICLR 2026|早于DeepSeek Engram,STEM已重构Transformer记忆

    03/09
  • ​超越 Transformer 架构?Inception 发布全球首个基于扩散模型的推理大模型 Mercury 2

    02/25
  • 一图解读AI大模型基石:Transformer

    Transformer是2017年由谷歌团队提出的一种革命性神经网络架构,其核心创新在于摒弃了传统的循环神经网络(RNN),完全依赖“自注意力机制”来处理序列数据。它不仅是BERT、GPT等几乎所有现代大语言…

    02/21
  • 一图解读AI大模型基石:Transformer

    Transformer是2017年由谷歌团队提出的一种革命性神经网络架构,其核心创新在于摒弃了传统的循环神经网络(RNN),完全依赖“自注意力机制”来处理序列数据。它不仅是BERT、GPT等几乎所有现代大语言…

    02/21
  • 华为诺亚实验室:非平滑组件提升Vision Transformer学习效率

    这些理论分析不仅为实验观察提供了数学基础,更重要的是揭示了不同组件在学习过程中扮演的不同角色。研究结果显示,无论是预处理自注意力的LN1还是预处理前馈网络的LN2,它们的可塑性都明显低于其他组件,这解释了为…

    02/11
  • 华为诺亚实验室:非平滑组件提升Vision Transformer学习效率

    这些理论分析不仅为实验观察提供了数学基础,更重要的是揭示了不同组件在学习过程中扮演的不同角色。研究结果显示,无论是预处理自注意力的LN1还是预处理前馈网络的LN2,它们的可塑性都明显低于其他组件,这解释了为…

    02/11
  • 清华联手千问重塑归一化范式,让 Transformer 回归「深度」学习

    02/10
  • 华为诺亚实验室:非平滑组件提升Vision Transformer学习效率

    02/10
  •  «上一页   1   2   …   3   …   4   5   下一页»   共86条/5页 
    全部热门
  • 首款天玑9500s风冷手机来了!OPPO K15 Pro系列

    04/01 16:41

  • 微软在干嘛:Linux打游戏反超Windows!没有原

    04/01 16:41

  • 雷军:5小时,直播拆一台新SU7

    04/01 16:41

  • 中国联通提出新框架MeanCache,刷新多模态生成

    04/01 16:41

  • 农发行湖北省分行被罚150万,涉违反金融统计管

    10/31 16:58

  • 浙江平湖农商行被罚450万,涉关联交易管理不审

    10/31 16:58

  • 老铺黄金距离奢侈品牌有多远?

    10/31 16:56

  • 文华东方300亿元赎身,“老钱”找新路子了

    10/31 16:56

  • 思妍丽入局,美丽田园能否完成“二次蜕变”

    10/31 16:56

  • 预售比现货贵背刺“所有女生”,李佳琦们黄金

    10/31 16:56

关于我们| 联系方式| 用户协议| 隐私政策| 版权声明| 网站地图| 友情链接| 财经头条| 酒业之家
©2008-2025 DESTOON All Rights Reserved 京公网安备 11011402013531号