英伟达推出新一代多模态模型，智能体效率提升九倍

IP属地中国·北京 编辑：沈瑾瑜 Chinaz 时间：2026-05-01 00:02:25

英伟达发布了其开放式多模态模型 “Nemotron 3 Nano Omni”，这款新模型将视频、音频、图像和文本的推理能力整合到一个系统中，旨在为用户提供更快速和智能的响应。根据英伟达的介绍，这款模型采用了先进的 30B-A3B 混合专家架构，集成了视觉与音频编码器，无需依赖额外的感知模型，因此在大规模推理效率上显著提升。
在多个领域，Nemotron 3 Nano Omni 表现出色，特别是在复杂文档解析、视频及音频理解等方面，已在六大权威排行榜上名列前茅。其独特的设计使得该模型能够快速解读全高清屏幕录像，极大地改善了智能体与数字环境的交互方式。H Company 的首席执行官 Gautier Cloix 表示，基于该模型，公司能够实现以前无法达成的快速解读能力，这标志着智能体技术的重大进步。
此外，Nemotron 3 Nano Omni 不仅具备卓越的效率，且具备强大的多模态感知精度，其 AI 系统的吞吐量比同类模型高出 9 倍。这使得它在同类产品中独树一帜，为开放式多模态模型树立了新的效率标杆。英伟达透露，目前该模型已与多家公司的系统进行协作，显示出强大的应用潜力。
在过去的一年中，Nemotron 3 系列模型，包括 Nano、Super 和 Ultra 型号，累计下载量已突破 5000 万次，这表明了市场对该模型的高度认可和需求。英伟达的这一新发布无疑将推动多模态技术的发展，为各行各业带来更多的智能解决方案。
划重点：

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

全网疯抢大疆Pocket 4P

水田插秧之后马云低调现身麻省理工和哈佛大学

B站视频播客单日播放时长突破1亿分钟，专题创作手册发布

高通斥资近290亿元收购Modular，转向AI软件与数据中心

“三星电子”公众号，已注销

鸿蒙智行自带二层楼的MPV 华为申请车顶升降专利

全站最新

全网疯抢大疆Pocket 4P

水田插秧之后马云低调现身麻省理工和哈佛大学

B站视频播客单日播放时长突破1亿分钟，专题创作手册发布

高通斥资近290亿元收购Modular，转向AI软件与数据中心

热门推荐

志愿填报“参谋”到位：高考出分三日，大模型已助 500 万考生“定心”

近 400 家地方报纸起诉 OpenAI 和微软，指控侵犯版权

全网疯抢大疆Pocket 4P

水田插秧之后马云低调现身麻省理工和哈佛大学

B站视频播客单日播放时长突破1亿分钟，专题创作手册发布

《庆余年》《赘婿》续作要来了 20部阅文出品及IP改编作品官宣

高通斥资近290亿元收购Modular，转向AI软件与数据中心

“三星电子”公众号，已注销

鸿蒙智行自带二层楼的MPV 华为申请车顶升降专利

亚马逊AWS业务CEO加曼：半数白领工作或因AI而改变，而非被淘汰

iPhone 17生命周期拉长至18个月：成为苹果史上最长寿旗舰

曝苹果iPhone Ultra 2第二代阔折叠立项确定，Air 3还没开模

效仿小米命名策略 REDMI跳过16代：Note 17系列7月登场

比尔·盖茨第三段婚外情对象曝光

Windows 11内存标准再变！从32GB最佳、到8GB够用