当前位置: 首页 » 资讯 » 科技头条 » 正文

H20解禁为本轮AI热潮填上一块重要拼图

IP属地 中国·北京 编辑:赵云飞 爱集微 时间:2025-07-18 20:05:47

近来,随着大模型的密集发布,以及各大AI巨头对数据中心的大规模投资,新一轮AI热潮正在形成。而英伟达H20的解禁又为本轮AI热潮填上了一块重要的拼图。

新一轮AI热潮形成

在全球市场上,新一轮的AI热潮正在快速形成。7月10日,马斯克旗下人工智能公司xAI正式发布最新一代大语言模型Grok 4,并同步推出多智能体协作版本Grok 4 Heavy。该模型基于 xAI 自研的 Colossus 超算集群训练,使用了超过20万张H100 GPU,训练量是Grok 3的10倍,推理性能提升显著。马斯克宣称,Grok 4的智能水平已经“全面超越博士智力”,尤其在学术问题上,它能在所有学科中达到甚至超越博士级别。

5月6日,谷歌DeepMind人工智能研究团队发布了Gemini 2.5 Pro “I/O”。这是今年3月谷歌发布的多模态大语言模型Gemini 2.5 Pro的升级版本。在AI排行榜LM Arena上,该模型在多个指标上登顶。目前该模型已向Google AI Studio的独立开发者、Vertex AI云平台的企业用户以及Gemini应用的普通用户开放。


OpenAI首席执行官奥尔特曼日前也透露,GPT-5 预计将在今年夏天发布。这将是该公司生成式 AI 能力的一次重大升级。据报道,GPT-5 将远超 GPT-4,早期测试者称其“在多个方面都有显著进步”。

中国战场同样硝烟弥漫。7月11日晚,月之暗面公司突然发布重要更新,正式推出Kimi K2模型并同步开源。Kimi K2采用MoE架构,总参数达到1T,激活参数为32B,相较于过去的基座模型,更强调代码能力和通用Agent任务能力。在多项基准性能测试中,Kimi K2表现出色,达到开源模型SOTA水平。

此外,百度“文心X1”引入知识增强技术,在中文法律文书生成领域达到专业律师水平;阿里云推出“通义千问Qwen2.5”,支持128种语言实时互译;腾讯“混元Pro”与微信生态深度融合,实现社交数据的闭环训练;字节跳动“豆包Pro”则凭借短视频场景的海量数据,在多模态创作领域形成独特优势。国内AI大模型的热度丝毫不弱。

H20加速产业链建设

大模型的发展有力带动了AI数据中心的建设热潮。Meta创始人马克·扎克伯格近日表示,Meta将斥资数千亿美元,为超级智能打造数个大型AI数据中心。扎克伯格表示,其首个数千兆瓦数据中心Prometheus预计将于2026年投入使用,另一个数据中心Hyperion将能够在未来几年内扩展到5000兆瓦。今年4月,Meta将其2025年的资本支出提高到640亿~720亿美元之间,以增强Meta在与OpenAI、谷歌竞争中的能力。

此外,微软宣布将在美国华盛顿州投资120亿美元扩建“星门计划”数据中心,部署超过50万片GB200;谷歌在俄克拉何马州建设全球首个液冷AI集群,PUE值突破1.05的行业极限。

国内同样大力投资AI数据中心的建设。 中国三大运营商同步发力,中国移动在内蒙古乌兰察布部署算力规模达10EFLOPS的数据中心,中国电信上海临港项目引入华为Atlas 900集群,中国联通则与百度合作建设智能计算专属云。地方政府也不甘示弱,北京发布“AI十千计划”(十万P级算力、千亿参数大模型),深圳前海推出全球首个算力期货交易平台。据统计,2025年全球AI基础设施投资预计突破3500亿美元,中国占比超过30%。


而英伟达H20的解禁将有效推进这一进程。此前,由于H20被禁,我国许多采用英伟达算力芯片的新建数据中心项目面临延期或缩减规模,如张北阿里云“云脑”项目、贵阳数据中心集群等。据报道,2024年第四季度至2025年第一季度,中国厂商采购了超60万张H20 GPU。此后由于美国政府的禁令,约有40%尚未交付。随着H20解除禁售,芯片供给受限的情况有望得到改善。

受此影响,AI算力相关产业链也将受益,包括服务器、光模块、交换机,以及AIDC建设相关的供配电系统、电源、散热器等环节。

AI芯片国产替代需同步推进

此前,H20 禁售的三个月真空期内,国产AI芯片订单量激增。此次,H20的解禁固然有效缓解了国内算力芯片的供应焦虑,但国产化替代进程仍不容忽视。这一轮AI热潮将对国内AI芯片的发展形成有力促进。短期内英伟达 H20 解禁虽然会对国产芯片带来一定冲击,但长期来看反而将会强化国内企业推进国产替代的决心。而AI在各行业的落地也将为国产芯片提供验证场景。

2025年第一季度,寒武纪营收同比增长42.3倍,首次实现季度盈利。据报道,目前寒武纪思元590芯片在互联网领域批量出货,单卡支持128K超长上下文,在电商推荐系统中响应延迟低于15ms。海光信息的深算3号芯片已进入互联网用户中展开测试。海光信息与中科曙光的千亿级重组,将形成“芯片-服务器-解决方案”的全链条能力。


在新锐企业方面,壁仞科技BR100芯片在短视频内容审核等场景性能优秀;摩尔线程 MTT S80 在单精度浮点算力性能上有着良好的表现。这些企业通过“定制化 + 开源”策略,快速抢占H20退出后的市场空白。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。