transformer_资讯搜索_财经中国

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

在一台1970年代的PDP-11上训练Transformer要多久？答案是5.5分钟

04/18

石溪大学：状态空间模型挑战Transformer视觉语言领域主导地位

04/01

石溪大学：状态空间模型挑战Transformer视觉语言领域主导地位

04/01

石溪大学：状态空间模型挑战Transformer视觉语言领域主导地位

03/31

石溪大学：状态空间模型挑战Transformer视觉语言领域主导地位

03/31

早于DeepSeek Engram！用「查表」重置Transformer记忆 | ICLR

03/31

Kimi“打破Transformer架构”真相

03/25

太疯了！MIT博士在Transformer里造计算机，攻破LLM终极缺陷

03/21

亚马逊时隔12年重启智能手机项目：内部代号Transformer

曾致1.7亿美元巨亏，亚马逊再战苹果三星，拟推无App商店AI手机。

03/20

马斯克深夜点赞炸场！Kimi撕开Transformer十年铁幕，中国AI亮剑

要知道，马斯克对AI技术的表态向来“毒舌”：2023年他批评GPT-4“缺乏创新”，2024年嘲讽GoogleGemini“过度营销”，却对Kimi团队的论文用了“Interesting approach（…

03/20

Kimi“打破Transformer架构”真相

它并非推翻Transformer的神话，而是为这座大厦添上了一块关键的砖石。

03/19

山大、理想汽车和中科院联合提出新范式：让Transformer去其糟粕

03/16

ICLR 2026｜早于DeepSeek Engram，STEM已重构Transformer记忆

03/09

超越 Transformer 架构？Inception 发布全球首个基于扩散模型的推理大模型 Mercury 2

02/25

一图解读AI大模型基石：Transformer

Transformer是2017年由谷歌团队提出的一种革命性神经网络架构，其核心创新在于摒弃了传统的循环神经网络（RNN），完全依赖“自注意力机制”来处理序列数据。它不仅是BERT、GPT等几乎所有现代大语言…

02/21

一图解读AI大模型基石：Transformer

Transformer是2017年由谷歌团队提出的一种革命性神经网络架构，其核心创新在于摒弃了传统的循环神经网络（RNN），完全依赖“自注意力机制”来处理序列数据。它不仅是BERT、GPT等几乎所有现代大语言…

02/21

华为诺亚实验室：非平滑组件提升Vision Transformer学习效率

这些理论分析不仅为实验观察提供了数学基础，更重要的是揭示了不同组件在学习过程中扮演的不同角色。研究结果显示，无论是预处理自注意力的LN1还是预处理前馈网络的LN2，它们的可塑性都明显低于其他组件，这解释了为…

02/11

华为诺亚实验室：非平滑组件提升Vision Transformer学习效率

这些理论分析不仅为实验观察提供了数学基础，更重要的是揭示了不同组件在学习过程中扮演的不同角色。研究结果显示，无论是预处理自注意力的LN1还是预处理前馈网络的LN2，它们的可塑性都明显低于其他组件，这解释了为…

02/11

清华联手千问重塑归一化范式，让 Transformer 回归「深度」学习

02/10

华为诺亚实验室：非平滑组件提升Vision Transformer学习效率

02/10

«上一页 1 2 … 3 … 4 5 下一页» 共86条/5页

全部热门

首款天玑9500s风冷手机来了！OPPO K15 Pro系列
04/01 16:41
微软在干嘛：Linux打游戏反超Windows！没有原
04/01 16:41
雷军：5小时，直播拆一台新SU7
04/01 16:41
中国联通提出新框架MeanCache，刷新多模态生成
04/01 16:41
农发行湖北省分行被罚150万，涉违反金融统计管
10/31 16:58
浙江平湖农商行被罚450万，涉关联交易管理不审
10/31 16:58
老铺黄金距离奢侈品牌有多远？
10/31 16:56
文华东方300亿元赎身，“老钱”找新路子了
10/31 16:56
思妍丽入局，美丽田园能否完成“二次蜕变”
10/31 16:56
预售比现货贵背刺“所有女生”，李佳琦们黄金
10/31 16:56