当前位置: 首页 » 资讯 » 科技头条 » 正文

沈向洋硬核演讲:全世界都给黄仁勋捐钱,灵巧手是人类最后尊严

IP属地 中国·北京 智东西 时间:2025-11-22 20:09:59


智东西
作者 许丽思
编辑 漠影

智东西11月22日报道,今天,一年一度的IDEA大会在深圳举行。这场人工智能盛会由IDEA研究院创院理事长、美国国家工程院外籍院士沈向洋发起,深入探讨了关于AI发展、AI Agent、具身智能、低空经济等前沿技术与热点议题。

沈向洋进行了近3个小时主题演讲,期间发布了多个IDEA研究院创新成果,包括企业决策智能体、数据分析智能体、药物计算发现平台、金融大模型、GPU原生渲染器、视觉大模型、低空管理与服务操作系统等。

想要理解人工智能演进,沈向洋强调,需要在算力、算法和数据之外,增加两个考虑维度:交互与载体。如今,谈大模型总绕不开英伟达CEO黄仁勋,沈向洋打趣说,“黄仁勋每天醒来都在笑,整个世界的人在给他捐钱。。”

在具身智能方面,沈向洋对格外看重灵巧手,强调,“人手的魔法在于它手既能搬箱子,也能穿针引线。所以,灵巧手可以说是人类在人工智能面前,最后的尊严。”他还提到去年与黄仁勋的对谈时,黄仁勋说,“具身智能是粤港澳大湾区非凡的机遇。”

据了解,IDEA大会于2021年首度举行,汇聚产学研企界领袖,致力构建一个凝聚数字经济多方力量的国际化平台,是粤港澳大湾区最具影响力的科技盛会之一。

一、AI发展路线五大维度:算力算法与数据之外,还要关注交互和载体

除了广为人知的了算力、算法、数据这三要素之外,沈向洋提出,未来理解AI的演进还必须加入两个维度:交互和载体。


1、算法范式

算法是AI发展的核心支撑。AI的算法演进有三个阶段:监督学习构筑表达与生成能力,强化学习引入因果与执行,自主学习迈向高层认知。技术本身从Transformer架构出发,向更高效、更稳健的体系演化;从自回归到扩散,再到混合式生成方法,这些变化共同推动智能的表达边界不断拓展。

2、智能载体

AI的载体发展遵循从抽象到具体、从虚拟到物理的扩展路径:从早期的语言模型,逐步演进到涵盖声音、图像、视频甚至4D内容的多模态模型;在此基础上,融入物理世界规律的世界模型成为新方向,而当世界模型落地到机器人、自动驾驶车辆、飞行器等物理实体时,便形成了具身模型。

“从载体的这个维度来看,AI很快就会帮助我们从理解这个世界,走向改变这个世界。”沈向洋说。

3、交互范式

过去七八十年,计算机科学的一条主线就是人机交互方式的演进:从命令行,到图形界面,到互联网搜索,再到推荐系统。AI的到来,则带来了自然语言和多模态的交互。

早期的第一代大模型,更像问一句答一句的搜索;而近两年的推理模型则让对话成为一个持续迭代的过程:你问、它答,你再追问、它再推理,过程越来越像真实的科研活动。

在他看来,“探索世界就应该是Search less,research more。”未来,AI会越来越多地主动提出问题、主动执行任务,但在人机系统中,人仍需在关键节点做决策、做最终判断,以确保AI的行为不偏离边界。

4、计算架构

GPU从2006年作为通用并行计算系统起步,从打游戏到“挖矿”再到支撑大模型训练,如今已成为基础设施。但当前算力需求呈现新变化:推理需求已经远超训练,端侧芯片和强化学习专用芯片的需求也迅速上升。强化学习芯片必须支持高速交互和大规模并行,推理芯片则要做到低功耗、高吞吐。

GPU刺激了深度学习的第一波爆发,但能耗与成本也不断攀升。随着应用多样化,推理、端侧、强化学习等专用芯片不断涌现;未来光子、量子、类脑等也可能在特定领域带来性能跃升。

5、数据

在智能演进的三个阶段,数据扮演不同的角色:在模拟世界阶段,数据是静态教材;在探索世界阶段,数据是动态反馈;在归纳世界阶段,数据是验证假设的证据。

当我们转向强化学习、探索世界时,模型需要的就不再是静态数据,而是带反馈的动态数据。沈向洋用一个朴素的类比强调这一点:“就像骑自行车这件事,你光看书的话不可能会学会骑自行车的。”

从人类数据枯竭到合成数据兴起,再到AI主动探索并获取实验数据,这一过程代表着数据从限制模型能力的约束,逐步转变为推动AI主动学习的工具。

在沈向洋看来,未来AI最强大的能力之一,是能够自己提出假设,并自己收集证据来提升智能水平。在这个过程中,数据和智能是相互推动的。

二、发布金融大模型、GPU渲染引擎等,下个月开源MoonBit agent SDK

合成数据已经成为大模型训练的刚需要素,尤其在小语种、隐私敏感行业、小样本场景等长尾领域,数据稀缺更是主要瓶颈。

成立于2025年的DataArc数创弧光,专注大模型合成数据技术,是IDEA研究院成立以来孵化速度最快的项目,成立不足一年已完成两轮融资。本届大会上,DataArc发布了SynData开源框架。

在沈向洋看来,除了数据层面的机会,模型层面也远不止超大模型这一条路,各类垂直应用场景同样蕴含巨大空间。金融,就是其中的典型代表。

本次大会发布的Quant 5.0,是一个基于金融时间序列的底座大模型。

传统金融投资面临行情预判精度不足、风险管控难度较大的挑战,Quant 5.0融合AI技术,凭借大参数算力支撑及高频数据训练,可支持三类任务:对未来收益和走势的预测,服务投资决策;为交易所、监管机构及机构投资者提供风控能力;为监管与决策提供市场模拟和压力测试工具。

由于Quant 5.0是通用时间序列底座模型,它可以轻松迁移到其他市场、其他资产类别以及其他交易策略上,并通过Agent方式实现策略自动化部署。


现场发布了国内首个提供公共服务的工业级AI驱动GPU渲染引擎SMARAY,在保证高质量渲染效果的前提下,其渲染效率较传统渲染器提升数十至数百倍,且可兼容主流动画特效建模软件,无需改变现有工作流 。

目前,SMARAY已获《流浪地球2》视效制作方More VFX、《哪吒》系列出品方光线动画等头部影视团队项目实践验证。


另外,现场还介绍了IDEA研究院的MoonBit团队的最新成果。MoonBit是IDEA研究院自研的AI时代新编程语言,今年,MoonBit从支持多后端的编程语言,逐步演进为涵盖AI原生工具集的全栈工具链,覆盖WebAssembly边缘计算、C/LLVM系统编程、JavaScript前端开发等全场景,构建起集开发者工具链与智能体开发生态于一体的开发者平台。

今年,MoonBit也开放了全球首个语言原生的智能体开发环境MoonBit Pilot,智能辅助生成MoonBit工具包,可快速扩展MoonBit生态。


下个月,IDEA研究院将正式开源用MoonBit编程语言开发的智能体平台MoonBit agent SDK,支持使用多种编程语言。

截至目前,MoonBit社区用户已从早期的500人、去年的2.6万人,增长到十万级规模;全球贡献代码行数超过1000万行,生态库约3000个。

三、从个体、公司到治理、创新,AI Agent带来了哪些影响?

AI Agent是大模型落地的重要产品载体,也是人工智能行业从业者多年来关注的核心方向。进入2025年,全球尤其是中国的AI Agent创新全面爆发。沈向洋从四个层面来梳理AI Agent的影响:个体、公司、治理与创新。

1、个体

AI Agent带来了生产力的巨大提升,彻底改变了传统工作模式,一个人加上一堆AI Agent,就会成为所谓的超级个体。这种生产力的飞跃直接推动了生产关系、组织机构、分工形式与协同方式的变革,而成为超级个体的关键在于是否愿意学习和运用AI Agent。

同时,沈向洋觉得,未来CEO可能不再是单纯的Chief Executive Officer,而更像Chief Entertaining Officer,个体与组织的关系将被重新定义。

2、企业决策

沈向洋判断,未来越来越多企业将成为“AI Native公司”,从组织结构到业务流程,从供应链到市场拓展,都围绕AI重新设计。

为此,IDEA研究院推出了KAIROS决策智能体,核心就是让AI真正进入企业的决策链路。

其能通过三大能力打造“决策-执行-反馈”闭环:一是借助通用大模型语言理解能力,结合企业数据与经验,精准解读业务需求;二是针对复杂决策提供更优的端到端优化方案;三是通过自动编程、代码生成实现模型自适应演变,降低维护成本。

落地场景中,KAIROS应用覆盖物流、仓储、港口、零售等多场景,可支撑规划类、调度类、预测类等全类型决策。


3、政府治理

在政府治理体系中,统计部门是一类关键角色。长期以来,统计局的工作人员需要“肩挑手扛”:去各处找数据、整材料,为领导写报告。而大模型的发展,正在推动这项流程走向自动化和智能化。

IDEA研究院去年发布的“经济超脑1.0”已能看懂数据、理解背后逻辑,而升级后的“经济超脑2.0”,能够构建全流程自动化数据分析体系,依托Agents驱动的智能框架,实现效率提升10-30倍,关联模糊需求与业务指标、自动拆解宏观分析需求,让数据分析回路从被动调试升级为主动修正,推动实现数据驱动的智能化决策,释放数据资产价值以形成更优政策建议。


4、科学创新

AI Agent对未来创新的影响,是沈向洋最为看重的。

去年,IDEA研究院已发布分子、抗体、反应、药物文献四大化学大模型;今年取得更大突破,研发的LightUnity模型用于创新药发现。

在此基础上,IDEA研究院发布Mozi平台,以“Agent+Toolbox”模式,结合多智能体架构、专家工具箱与自动化流程,解决传统药物早期计算发现中工具误导、研发黑箱、工作流瓶颈等痛点。


四、举办全球灵巧手+即时配送赛事,推出全新视觉大模型

不久前,传闻特斯拉人形机器人因手部“难产”而被迫缩减生产计划。沈向洋表示,在具身智能的众多攻关点里,灵巧手是技术复杂度的珠峰。

他分享到,今年的深圳智能机器人灵巧手大赛,是国内首个将灵巧手技术与即时配送场景结合的赛事。从取包裹、拆包裹、折纸箱、到按电梯,以场景为旗帜,以需求为标尺,牵引技术前进的方向。


在具身智能技术发展中,视觉感知是人工智能与物理世界交互的核心基础,更是赋能“感知-决策-执行”闭环的关键支撑。一年前,DINO-X视觉大模型诞生,以开放世界检测能力,“让机器看懂物理世界”。

今年IDEA大会上,DINO-X Grasp发布,实现世界开集2D认知理解、物体级抓取位姿预测、物体级3D形状感知,打造“更强”具身大脑。


沈向洋总结,过去一年,IDEA研究院在具身智能方面,新成立了三个中心:

福田实验室:这是由粤港澳大湾区数字经济研究院(IDEA)与腾讯合作共建的省级实验室,旨在通过跨领域合作提升技术研发能力,聚焦人居环境具身智能领域的研究。福田实验室联合腾讯Robotics X实验室推出的Tairos具身智能开放平台,是一款以模块化方式提供大模型、开发工具与数据服务的具身智能软件平台。

国际先进技术应用推进中心(深圳):聚焦人工智能、具身智能、低空经济等重点领域,依托粤港澳大湾区数字经济研究院建设的先进技术应用推广平台。

深港高等研究交流中心(SHARE):旨在依托深圳与香港的区位优势和大湾区的优质科研教育资源,搭建跨学科科研合作与国际交流平台。中心聚焦人工智能赋能的前沿科学问题,推动其在生物医药、材料科学、低空经济、无线通信、具身智能等关键领域的应用与突破。

会上,孵化自IDEA研究院的视觉大模型企业视启未来还宣布完成近亿元天使轮融资,该团队创始人兼CEO张磊曾任微软总部及亚洲研究院首席研究员。

低空经济方面,大会发布的OpenSILAS 2.0,通过可进化框架解构六大核心技术,依据城市与空域复杂度构建产品矩阵,实现“规划—运行—监管—服务”全环节管理与全流程服务,以分级化、模块化提供可落地扩展方案。

结语:“攀登珠峰”VS“修公路”,要走适合自己的AI发展之路

回到沈向洋反复提到的智能演进曲线,今天看到的,不只是一个个炫目的模型和 Demo,而是新一轮技术范式刚刚起步的信号。算力、算法、数据在加速迭代,交互和载体在重塑人机边界,AI 正从“问一句答一句”的工具,走向能与人类协同推理、共创知识的长期伙伴。

当被问及关于中美AI发展的差距时,沈向洋觉得,AI发展至少可以理解为两个维度:一条是“攀登珠峰”,以巨额投入追求最强模型;另一条是“修公路”,让更多人和更多场景用得上AI,让模型在更大范围内规模化应用,在每件事情上,都要走适合自己的发展之路。

未来,随着技术迭代与场景深耕的双向赋能,AI将更深刻地融入千行百业,开启智能社会的全新阶段。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。