AI进化的“新燃料”从哪来？答案就在“数据工厂”里

IP属地中国·北京 央视财经 时间：2026-02-08 16:35:38

当人工智能以惊人的速度重塑世界，你是否想过，支撑它不断进化的“燃料”从何而来？这个答案就藏在“数据工厂”的新兴业态里。它不像传统工厂那样生产钢铁或汽车，而是专门“生产”高质量的数据集，为AI大模型提供源源不断的“粮食”。
“数据工厂”是什么？
当前，整个AI行业正面临一个巨大的瓶颈——高质量数据严重短缺。一个名为“数据工厂”的新兴事物，正试图成为这个瓶颈的破局者。它专门“生产”和“加工”数据，就是将散乱、原始的庞大数据资源，转化为人工智能可以直接吸收、高效利用的“高质量数据集”。
北京交通大学信息管理理论与技术国际研究中心教授张向宏介绍，我们在农业社会效率很低，是因为没有基础设施。工业社会效率提高的一个很重要的突破点就是有了基础设施，有自来水、燃气的供应。
如今进入数智社会，数据成为核心生产要素，同样需要类似“水厂”“电厂”这样的基础设施来规模化供给，这就是“数据工厂”。
张向宏表示，现在这些大模型其实都遇到了这个问题，原因就是数据就是那些公域数据，私域数据确实开发不出来，数据瓶颈非常突出。
这个瓶颈导致了一个怪圈：一边是手握海量数据的企业“有数不采、采而不存、存而不加工”；另一边是渴求数据的大模型公司，不得不重复“自己打井自己喝”，从采集、清洗到标注全部自己来，成本高昂且效率低下。“数据工厂”，正是破局的关键。
“数据工厂”建设路径如何走？
我国的“数据工厂”建设之路该如何走？张向宏指出，“数据工厂”本就有不同的形态，主要分为集中式、半集中式和分布式三种：
集中式是统一采集、统一汇聚、统一加工。目前做“数据工厂”的，90%以上采取的都是集中式。半集中式是通用的技术根据不同的应用搭建不同的平台。分布式是没有一个工厂的物理的形态，数据“采存算管用”技术就是数据编织技术。
业界认为，从长远看，能实现“数据可用不可见”的分布式数据工厂是必然趋势，因为它从根本上解决了数据持有者对安全和控制权的担忧。但短期内，三种模式将并行发展。
政策出台助力数据生产与人工智能深度对接
国家层面，国家数据局、工业和信息化部、公安部、证监会2月7日联合发布《关于培育数据流通服务机构加快推进数据要素市场化价值化的意见》（以下简称《意见》），首次明确我国将培育三类数据流通服务机构。三类数据流通服务机构包括：数据交易所（中心）、数据流通服务平台企业、数据商。《意见》提出，支持各类数据流通服务机构加强与人工智能企业等合作，依托数据基础设施提供数据汇聚、治理、模型训练等服务。
国务院发展研究中心研究员马源表示，当前人工智能企业普遍面临数据荒问题，现在数据流通服务机构就有了一个新的核心使命：汇聚、整合跨行业、跨领域的数据资源，促进数据供方和AI企业需求高效匹配。

展望未来，“数据工厂”不仅为AI“供粮”，它将成为国家数据基础设施的核心单元。它或许没有传统工厂的喧嚣，但它“生产”出的数据洪流，必将无声却深刻地重塑我们的时代。
（中央广播电视总台中国之声）

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

全站最新

英伟达在华启动机器人人才招聘，聚焦具身智能等四大方向

你天天用的Claude和Codex，Meta内部不让随便用了

马斯克抽调SpaceX顶尖星舰和星链工程师，全力攻坚Grok大模型

OPPO小布助手接入微信A2A：一句话发消息、打电话，语音操控成现实

热门推荐

中国空调卖爆欧洲，这次没靠低价

2026年首家面值退市股，要来了？

贝壳-W(02423.HK)6月18日耗资300万港元回购59.96万股

中信建投：VC进入供需错配期看好涨价业绩弹性

渣打集团(02888.HK)6月18日耗资1481.33万英镑回购72.72万股

周黑鸭(01458.HK)6月18日耗资48.99万港元回购38.3万股

AI泡沫警报拉响！两大顶流私募提示风险

除了京东方A、TCL，Micro LED封装四小龙还有这4家，三大外资重仓

士兰微涨价

本末科技通过港交所上市聆讯，构筑机器人三大集成化技术支柱

中通快递-W(02057.HK)6月18日耗资499.55万美元回购22.74万股

卓越睿新(02687.HK)与阿里云签署全面深度合作框架

韩国800万亿韩元砸存储，影响有多大？

本末动力通过港交所聆讯，专注机器人动力模块

星空华文(06698.HK)6月18日回购1600股