IT时报记者 孙妍
“Token正在成为像空气和水一样的必需品。”5月21日,在巴黎举行的2026华为创新数据基础设施论坛上,华为公司副总裁、数据存储产品线总裁袁远表示,Token新经济之下,Agent等主流应用正在改变未来组织形态。
袁远分享了两组数据:第一组数据有关智能体,目前有超3000万个智能体为人类工作,五年内,活跃的智能体将增长至22亿;第二组数据有关Token,去年每分钟处理的Token量为60亿,今年将增加至150亿。“一个人+智能体”构建的“一人公司”改变了组织范式,Token正在成为我们生活中的基础设施。
Agent加速普及,成为新型数字生产力主体,逐步成长为企业的常态化“数字员工”。同时,AI应用持续深化,企业Token消耗量迎来爆发式增长。袁远指出,企业要加速AI落地,需推动现有IT架构向AIDC数据基础设施快速演进,围绕数据湖、知识与记忆平台、算力、模型、Agent框架与数据韧性等核心方向,开展系统性规划与建设。
在论坛上,华为正式发布AI DC数据基础设施全栈方案,助力企业加速推进AI数据中心建设,实现AI规模化落地。
在中国最大的医院之一,智能体已在帮助人类医生工作,生成病理报告的时间从40分钟缩短至15秒,还能准确识别超19种常见癌症。医院对数据和隐私的要求极高,多选择在本地部署AI模型并开发智能体,而在效率提升的背后,是海量数据的处理,包括注入300多本医学书籍作为知识库,将100多万份患者数字病理报告脱敏后训练模型等。
于是,企业需要构建一个AI数据湖,将企业数据投入湖中,它将生成语料库用于训练,并生成知识图谱,进而为智能体和推理流程服务。数据湖的三大优势是海量数据容量、全局可视性与快速语义检索。OceanStor Pacific全闪分布式存储以11PB/2U业界领先高容量密度,实现最优TCO存储海量数据;依托DME Omni-Dataverse统一数据空间,使能多模态、跨站点数据实时入湖、全局可视可管,同时具备千亿千维向量数据的秒级检索能力。
一家金融机构想要用AI来写代码,但可能需要多轮推理才能交付可用的结果。如果每一轮都将所有KV(键值对)放入上下文中,反复使用GPU,那必然不划算,也不节省时间,正确的做法是填充KV缓存。
面向超大规模推理集群场景,华为推出业界首个支持异构算力的上下文记忆存储CMS(Context Memory Storage),支持KV语义直通或采用专用DPU进行语义卸载,可扩展为PB级共享KV Cache池,降低推理首Token时延90%;面向企业AI推理场景,华为首创“3+1”AI数据平台,集成了超95%检索精度的知识库、KV Cache加速与持续进化的记忆库,并由UCM技术实现调度与管理,提升30%推理精准性。
一家医院想要提升GPU的利用率,是否可以白天跑面向患者端的模型,晚上跑科研任务端的模型?针对这一需求,华为结合算力资源细粒度切分与智能调度,最大可实现XPU卡1:10切分,实现“一卡多用”,提升资源利用率。
同时,智能体的需求正在爆发,某家头部银行正计划部署120个智能体来替代人工流程。华为ModelEngine Nexent智能体平台可通过自然语言交互方式直接生成Agent,比如医生、金融人士、教师等,大幅降低开发门槛,使Agent上线周期缩短80%。此外,它支持对Skill、提示词、记忆实现自动优化,助力Agent持续演进、越用越聪明。
最后,安全是底线。袁远分享道,很多企业或机构都曾遭受过恶意入侵,如果不控制智能体,它们可能会做很多危险的事,比如删除文件、改变规则等。胡伟通过构建防滥用、防投毒、防篡改、防勒索的端到端数据保护方案,将风险挡在数据湖外。
AI不再是辅助工具,而是正在成为企业运营的“操作系统”。构建本地化、安全可控、高效敏捷的AI就绪基础设施,已成为组织竞争力的关键所在。无论是医院还是银行,都在从数据、计算、模型、Agent、安全等方面进行布局。
“AI的第一篇章是计算能力,第二篇章是模型,第三篇章是智能体,我认为下一篇章是数据、安全,以及AI落地的能力。”袁远表示,“无论你是否喜欢AI,你都离不开它。”





京公网安备 11011402013531号