当前位置: 首页 » 资讯 » 科技头条 » 正文

万字长谈丨同济工智院华先胜:工程智能,是 AI 的「成人礼」

IP属地 中国·北京 雷峰网 时间:2026-05-20 16:20:07



复杂工程系统,才是 AI 的深水区。

作者丨郑佳美

编辑丨马晓宁

今天的 AI 已经足够耀眼。它能在几秒钟内写出文章、生成代码、绘制图像,也能像助手一样拆解任务、调用工具、给出方案。对很多人来说,AI 的未来似乎已经清晰可见:更高效率、更低成本、更少人力,以及越来越自动化的生产流程。

但同济大学工程智能研究院的华先胜院长看到的则是另一面。

在他看来,AI 真正的挑战不在于能不能“说得像人”,而在于能不能进入那些不能靠语言流畅度解决的真实系统。工程世界就是这样的系统,它关乎楼宇是否安全、桥梁是否可靠、交通是否顺畅、能源能否稳定调度、城市能否持续运行。

这里没有简单的标准答案,也不能用幻觉冒充创造力。一个 AI 模型即使能写出完美方案,也不意味着它理解了工程现场。

所以,工程智能要回答的第一个问题是:AI 如何从数字世界走向物理世界?

华院长认为,工程智能不是 AI 与工程的简单相加,它既要用已有 AI 技术解决工程问题,也要从复杂工程系统中倒逼新的 AI 理论和方法,更要把这些能力沉淀为平台、模型、智能体和操作系统,让工程智能从单点突破走向规模化复制。

这也是他从微软、阿里、城市大脑一路走到同济工程智能研究院后形成的判断:AI 落地不能只靠“拿着锤子找钉子”,也不能只靠一个个项目堆起来。真正的工程智能,必须长在产业现场,也必须长成一套体系。

而更深层的是,华先胜并没有把工程智能仅仅看成产业效率工具。他同时追问了另一个更难的问题:当 AI 越来越强,人会不会被系统边缘化?

如果 AI 只沿着替代人的方向发展,它可能带来岗位替代、认知退化和精神操控。但如果换一条路,让 AI 成为人的共创伙伴,让模型/智能体的能力和人类的非逻辑创造力彼此激发,AI 就不再只是“完美机器”,而可能成为一种共生智能。

于是,工程智能在这里获得了双重含义:一方面,它是 AI 进入复杂工程系统的技术路径;另一方面,它也是重新设计人机关系的一次尝试。

基于这些判断,雷峰网与华院长进行了一次系统对话。对话从“工程智能究竟是什么”开始,一路延伸到复杂工程系统、产业规模化落地、工程智能操作系统、灵感计算、人机互信,以及 AI 时代人的位置。

某种意义上,这不仅是一场关于工程智能的访谈,也是一场关于 AI 未来路径的再追问。


01

工程,是 AI 的试金石

雷峰网:工程智能对很多人来说还是一个比较新的词。您能否先解释一下,它到底在解决什么问题?

华先胜:要解释工程智能,首先要讲清楚“工程”在这里指什么。今天很多人讲工程,尤其是做计算机的人讲工程,更多想到的是 software engineering,也就是软件工程。但我们讲工程智能时,“工程”至少有两层含义。

第一层是传统工程,也就是推动人类社会进步和发展的那些基础设施与产业系统。比如建造房子、楼宇、桥梁,属于建造;制造本身也是非常大的范围;交通是交通工程,能源有能源工程,材料、医学、海洋等领域里也都有工程问题。

如果稍微收窄一点,可以理解为传统工科所关注的工程问题,包括建造、制造、能源、汽车、交通、海洋等。很多时候,科学和工程之间的边界并不只是看题目本身,而是看推动这个领域发展的方式。比较偏工程方法的,都可以归入工程范畴。

第二层则更接近过去讲的软件工程,但我们不简单称之为软件工程,而是称为“硅基工程”。人工智能要真正实现产业规模化落地,也需要工程能力。

也就是说,当我们用 AI 方法解决了传统工程中的难点问题之后,怎样让它走向规模化?这就需要构建系统、平台和工具,让更多人能够使用,而不是每一个工程问题都必须由顶尖 AI 专家和顶尖工程专家坐在一起才能解决。这个世界上的工程问题太多了,如果都只能依靠少数顶尖专家一对一解决,就很难形成规模化。

所以,工程智能可以有一个比较正式的定义:人工智能与工程实践的深度融合,利用人工智能技术深入解决工程领域的核心问题,实现对工程实践规模化赋能的变革性技术范式。

不过这个定义比较书面,我更愿意从三个层次来解释。

第一层叫“工程 + 智能”。也就是用今天相对成熟的人工智能技术去解决传统工程中的具体问题。例如,在建造领域,设计一栋楼、一座桥时,能不能用 AI 辅助设计,让设计速度更快、方案更合理、更有创意?一栋楼已经建成之后,能不能用 AI 对楼宇健康状况进行预测?在交通领域,能不能用 AI 提升城市交通效率和交通安全?这些都属于工程 + 智能。

它当然也是工程智能的一部分,但还不是最核心的部分。因为这一层往往不一定会对人工智能本身提出非常高的新要求,更多是在已有技术基础上做一些增量创新,解决某个具体领域问题。

第二层才是真正作为一个词的“工程智能”。它不是工程和智能的简单相加,而是因为传统工程领域中存在大量今天技术难以直接解决的问题。

工程系统往往非常复杂,比如建一座桥、优化一座城市的交通、调度一个城市的能源或电力系统,这些都是复杂系统。今天的 AI 技术还不能直接解决这些核心问题,于是它反过来会给人工智能提出新的理论和方法要求。

我们发展新的 AI 理论与方法去解决这些工程问题,一方面推动工程学科和工程技术的发展,另一方面也推动人工智能技术本身的发展。到这个阶段,它就成为一个新的领域,放在学校里讲,也可以说是一个新的学科。

第三层是工程智能操作系统。我们希望把那些看起来高大上的技术,变成大家都能使用的工具。就像今天我们用 Windows、Office、PowerPoint,不需要微软工程师和我们一起写文档、做幻灯片;医生用 CT 做诊断,也不需要理解 CT 机内部如何成像、如何重建,只要会使用设备,就能做诊断、制定治疗方案。工程智能也要走到这个阶段,才能真正被规模化使用。

这三个层次不是先后割裂的。我们现在同时在做三件事:第一,用现有技术去看工程问题;第二,针对工程里的难点问题发展新的方法;第三,从现在开始构建平台系统,今天能解决多少问题,就把多少能力放进系统里。系统变成开放系统之后,更多人也可以一起贡献。

我还经常用“点、线、面”来解释工程智能。点,是解决某一个具体问题。比如某一个蛋白质结构预测,或者某一个作物的育种问题,都是点。线,是能解决一类问题,例如不仅能做大豆育种,也能做水稻、玉米等作物育种,形成一个加速育种的平台。面,或者体,是在一个领域里能解决一组相互关联的问题,比如农业里不仅做育种,还能做精准种植、农业机械化、加工等。

如果只做点,很难形成一个领域或学科;至少做到线,才可能成为一个领域,成为一个平台,成为一种赋能工具。我们的目标是从点到线,再到面。当然,从点到线相对容易,走到面需要很多年的积累。


(2025年5月20日同济大学工程智能研究院成立)

雷峰网:您过去做过城市大脑、视觉智能,也做过 AI 的平台化和系统化。现在推动工程智能,背后的判断是什么?为什么是现在?

华先胜:过去其实也在做,只是还没有那么成体系。今天把工程智能这件事提出来,是因为技术和产业发展到了一个可以更深入、更大规模推进的阶段。

第一个维度是工程本身的需要。工程非常重要,真正改变世界的很多东西其实是工程。当然,工程很多时候来自科学突破,科学理论再进入工程应用,推动人类改造和适应世界。

城市建设、大陆桥梁、飞机、大型水电站、大型建筑,本质上都是工程。中国本身也是工程大国,但今天的工程系统越来越复杂。大型水电站、飞机制造、大型建筑等系统一旦出问题,很多时候是灾难性的,因此迫切需要新的方法来保证可靠性和安全性。

我们过去一段时间做了很多探索,后来发现这和钱学森先生当年讲的“开放复杂巨系统”非常相关。

工程里的很多系统本质上就是开放复杂巨系统:组件非常多,耦合度非常高,相互依赖非常强;同时它不是封闭系统,而是在不断演进,并且与外部环境持续交互。比如电站会受到环境变化、水流变化、能量输入输出的影响;城市交通更是一个不断变化的开放系统。

这类系统还有涌现性。涌现就是从量变到质变,很多规律不是用以往方法能轻易计算出来的。今天大模型也有涌现,但老实说,背后的机制也还没有真正弄明白。

复杂工程系统也是这样:难以建模,模型建不好,就更谈不上推演、预测和优化。因此,工程需要人工智能去辅助、去赋能。

第二个维度是人工智能本身的需要。人工智能从深度学习时代发展到 2022 年底之后的大模型、智能体时代,速度非常快,威力也非常强。但它在数字世界里很强,在物理世界里仍然步履维艰。

今天机器人可以打拳、扭秧歌、跳舞,甚至可以跑马拉松,但你让它真正完成一个任务,哪怕不是特别复杂的任务,也并不容易。让它照顾老人、照顾小孩,或者到大街上帮你取一个东西回来,这些都没有那么容易。更不用说真正的工程场景。

如果人工智能要真正成为改变产业的生产力,就不能只成为数字世界的生产力,还要进入物理世界。我们说人工智能是新质生产力,但它只有被规模化使用,才会真正成为现实的生产力。

工业革命也是一样,如果一项技术只停留在少数领域、样板领域,就不会推动产业革命。人工智能接下来除了数字世界,还要进入物理世界;除了样板,还要走向真正的规模化。

第三个维度是技术已经具备了基础。大模型、智能体、物联网、算力,以及过去十几年产业数据化的实践,虽然有成功也有教训,但都为规模化工程智能提供了必要基础。

产业界、政府和社会对人工智能的接受度也比过去高,尤其在中国,大家更愿意尝试。过去十几年,AI 落地往往只解决了一部分核心问题,很多产业核心问题其实没有真正解决,这也是难以规模化的重要原因。

此外还有国际竞争格局。很多人把一些国际计划理解为偏科学智能,但仔细看,其中也包含制造等工程内容。贝索斯较早提出 Physical AI,要投入巨额资金做这件事。

本质上,这也是工程智能的一部分,只是他更多讲制造,我们讲的范围更广。他的做法可能是把传统产业买下来直接改造,而我们更希望提供平台和工具,让产业自己在工具上完成改变。

雷峰网:您刚才提到,人工智能要从数字世界进入物理世界,真正成为现实生产力。但如果 AI 越来越强,会不会也带来新的风险?比如工作被替代、人的能力退化,甚至被算法操控?

华先胜:这是一个必须正视的问题。我们在全速拥抱 AI 的同时,也要看到它发展路径里存在几重暗礁。

第一重是生存的替代。大模型和智能体已经开始改变岗位结构,特别是初级岗位、重复性岗位,受到的冲击会更明显。第二重是认知的退化。如果一个人习惯把思考、写作、判断都外包给 AI,大脑就会越来越少经历真正的训练。第三重是精神层面的操控。算法比你更了解你的喜好和弱点,它可以不断投喂你想看的东西,让人困在信息茧房里。

所以,问题不只是 AI 技术本身有多强,而是我们到底沿着什么路线发展 AI。如果我们追求的是一个“完美机器”,让它在越来越多场景中 100% 替代人,人就会被逐渐边缘化。它看起来提高了效率,但也可能带来岗位、认知和精神层面的长期风险。

我更关心的,是能不能用技术去解决技术带来的问题。也就是说,不只是靠伦理提醒、靠使用者自律,而是在系统设计之初就避免走向单纯替代人的路径。工程智能要进入物理世界、进入产业核心,就更不能只是做一个替代人的机器,而应该成为激发人类智慧和能力的合作伙伴。

02

工程智能,必须长在产业现场

雷峰网:您经历过淘宝以图搜图这类超大规模 to C 场景,也经历过城市大脑这类 to B、to G 的复杂系统级 AI 工程。站在今天回看,这些经历让您对 AI 进入工程世界有了哪些不同判断?

华先胜:人工智能领域有很多了不起的团队和人才,他们推动了技术和应用的发展。但如果要把“从技术到产业”这条路真正走通,需要一种综合能力:既要有算法研究能力,对算法原理有深入理解;也要有工程化能力,能够把技术转化为稳定可靠的系统和产品;同时还需要围绕真实业务和应用场景,持续打磨系统架构、产品体验和商业落地路径。

算法、系统、产品、产业落地之间不是一条简单的线,而是高度耦合的关系。过去很多讨论是在说,到底是锤子找钉子,还是钉子找锤子:是先有算法再找场景,还是先有需求再找算法。

经过这些年的经历,我现在想做的事情不是判断到底谁找谁,而是让所有钉子都能有合适的锤子,所有锤子都能找到合适的钉子。更准确地说,是构建一个更大范围的架构,让“找”的问题不再成为问题

如果总在纠结先做技术还是先找需求,就会一直停留在原来的问题里。我的想法是,把大的构想和系统架构设计出来,锤子和钉子都在里面,就可以直接用。

工程智能之所以强调认知,是因为认知会决定做法。为什么要区分“工程 + 智能”和“工程智能”?为什么要强调点、线、面?为什么要构建工程智能操作系统?这些都是过去二十多年经历逐渐沉淀出来的。

从微软搜索、必应搜索相关技术,到阿里拍立淘、城市大脑、医疗健康,再到今天做工程智能,很多理念是一脉相承的。只是今天技术和产业发展到了新的阶段,我想布一个更大的局,让人工智能技术和产业之间的 gap 在设计之初就被缩小,甚至不再成为最难的问题。

雷峰网:这是否也可以理解为同济大学工程智能研究院的核心定位和出发点?

华先胜:可以这么理解。从学校层面看,最早的初衷是新的工程学科建设需要人工智能介入。做工程智能其实有两拨人:一拨是做工程的人往人工智能方向走,另一拨是做人工智能的人往工程方向走。

这两拨人各有优势和短板。工程领域的人对工程本身的认知非常深,这是他们的专业,也是非常重要的优势,否则你甚至不知道真正应该做什么问题。但他们不一定擅长 AI。做 AI 的人 AI 能力强,但对工程本身问题的认知不够。

两边甚至可能互相觉得对方做得不够好:AI 人可能觉得工程方法太简单,工程人可能觉得 AI 人没有做到正确的问题上。工程智能研究院要解决的一个问题,就是让这两拨人不要割裂开做,而是在一起做。

同济的工程学科是优势,我来到同济做工程智能,也是希望发挥同济工程学科的底座,把工程智能真正变成一个词,而不是两个领域的松散拼接。更大的层面上,就是让人工智能从数字世界走向物理世界,真正成为生产力。


(发布《工程智能白皮书》)

雷峰网:研究院最终希望形成什么能力?是做一批项目,还是建立一套能够持续培养人才、沉淀方法、服务产业的工程智能体系?

华先胜:在回答这个问题之前,我想先补充一点。我过去做人工智能,落地性比较强,不只是写论文、做 demo,而是做真正有几千万、上亿人使用、被现实检验的系统。因此我对行业和领域本身一直有敬畏之心。

现在有一个趋势:谁都想去搞人工智能。这一方面是好事,但如果一个学科的人放弃自身领域,转而去做人工智能本身,不见得是好事。比如医学,如果医学生和医学研究者都去做人工智能,医学本身怎么办?你的优势可能不是人工智能本身,而是你的学科与人工智能的结合。

对于工程、医学等领域的人来说,目标应该是用人工智能推动本学科发展;对于我们做人工智能的人来说,目标则是推动这些学科发展,同时也推动人工智能发展。

我以前做医学人工智能时也有过困惑。我们做医学影像,效果也不错,但好像总是不温不火。后来我想明白了:医学人工智能的目标应该是推动医学的发展。不是说没有 AI 医学就不能发展,而是 AI 带来的技术进步要真正推动医学进步。

就像 CT、MRI 这类技术,它们在医学里有生命力,因为它们改变了医学。如果 AI 只是提升效率,当然也有价值,但生命力不够强。只有推动学科发展,它才会有更强的生命力。

回到研究院的目标,我们不是做项目制,而是要构建一套体系。从可见的结构上讲,我们按照平台、模型、智能体、应用四层来构建。

研究院不是公司,但它也不是一个只做学术的学院,而是一个产学研融合的设计。我们要做学术前沿,也要培养人才,但还要把成果变成可以产业化落地的东西。

不过,真正的产业化落地不一定由研究院本身完成。研究院更像是预研和孵化平台,把技术做到一定程度之后,再通过孵化企业或赋能企业完成产业化。研究院本身不是商业载体,但它承担产学研融合和产业孵化的重要责任。

这也反映在团队构成上。一般学院以学术人才为主,而我们既有学术人才,也有来自产业研究院的人才。他们既有前沿学术研究能力,又有系统设计、系统实现和产品化能力。我们讲产学研融合,不是表面上的融合,而是真正的产研融合。

在架构上,我们还设计了一个三级结构:学校层面的研究院、面向上海的新型研发机构,以及后续孵化或赋能的企业。最终,我们希望从研究院走向产业,从基础能力走向平台化系统,再走向真正的企业和产业生态。

雷峰网:您提到研究院要做的不是项目制,而是一套体系。放在更大的 AI 发展路径里,这套体系和您提出的“共生智能”之间是什么关系?

华先胜:我觉得可以这样理解:如果说传统 AI 落地更多强调“降本增效”,那么共生智能更强调“开智增能”。它不是简单用 AI 替代人工,而是让人与 AI 深度结合,用相同甚至更少的人力,完成更深入、更强大的创造。

我们要做的不是一个个孤立项目,而是把平台、模型、智能体、应用,以及未来的人机协同机制放在同一个体系里,让 AI 的能力和人的能力共同演进。

雷峰网:如果更具体地看,研究院目前已经在做哪些方向和成果?

华先胜:如果从应用领域看,我们目前有土木建造、交通、海洋等方向。比如在建造领域,我们做的是从设计到设计评估,再到建成建筑的状态预测。

一个具体技术叫 BIM to FEA。BIM 是建筑信息模型,主要描述建筑的物理和几何结构。过去很多年,行业一直在使用 BIM;它比平面图更形象,有三维信息,可以看到建筑长什么样。但是,如果要拿 BIM 去评估建筑健康状况、风险,或者分析极端天气、地震对建筑的影响,它还不够,因为这些问题需要进入力学层面。

进入力学层面,就要分析建筑结构中的应力,还要考虑材料等因素。工程上通常通过有限元仿真完成。过去这件事基本靠手工:先有 BIM 模型,再手工构建 FEA 有限元模型,画网格,进行仿真,分析应力。只有把这些分析清楚,才能判断房子会不会有风险。

我们现在希望把这个过程自动化:从 BIM 直接生成力学仿真模型,自动完成网格划分,甚至在某些情况下不经过反复迭代就得到满足条件的仿真结果,并且自动生成分析报告。报告可以告诉设计方案是否存在问题,也可以用于运维阶段,判断一栋建筑应该如何修理、如何保护。

交通领域,我们在交通安全方面有比较好的进展。我们对城市全量交通事故进行深入分析,分析事故成因、责任归属、车辆行为、碰撞位置和各种细节。过去这些都需要人来分析。一个直接应用是帮助交警做事故定责,并且把分析结果与法律法规结合,辅助判断责任。

更大的应用在于,当我们掌握了城市历史交通事故的发生机理,就可以知道事故到底由哪些因素造成:哪些是人的原因,哪些是道路原因,哪些是交通规则原因。这样就可以对城市交通基础设施提出建议,比如哪些地方应该改造,哪些通行规则应该调整,从而降低事故发生概率。

我觉得更有意思的是从司机角度入手。交通事故往往是多种因素叠加造成的。即使道路拥堵、路况不好,如果一个人足够仔细,也可能避免事故。很多时候,是多个条件凑在一起才发生事故。因此我们可以从司机层面去破坏促成事故的因素。

人的驾驶习惯、当天心情、天气状况、交通状况、实时驾驶行为都会影响事故风险。在某种条件下,我们可以提前预测:某位司机今天走到某个地方时,发生事故的概率可能比平时高好几倍。这时就可以提醒他注意驾驶行为,甚至调整路线。过去没有大模型技术,这件事不太好做,但时至今日,这件事已经变得相对更容易了一些。

海洋方向,我们综合多源海洋数据和预测模型,对海洋情况进行分析和预测,例如海面温度变化趋势等,并构建相应的智能体。

还有一个很重要的点是:我们做的东西不是论文,也不是博士论文,而是一个可用系统。当然,今天说它已经是成熟产品还为时过早,但至少它是真正在跑的东西。有些能力要真正落地,还需要和外部系统连接。比如交通中对个人进行提醒,就需要和高德或其他 GPS 系统连接;要做全城市全量事故分析,则需要和城市大脑这类系统连接等等。

除了这些具体领域,我们还做了两个偏通用的能力。第一个是传统工程的全科工程智能体。它不是只面向土木、交通、能源或制造,而是把工程学科里的知识和能力放在一起。我们不是简单做一个大模型,而是做智能体,同时嵌入我们自己调优的模型、知识图谱,以及一些物理约束。

这个智能体主要用于交互式工程教学和研究探索。我们不希望它变成学生直接拿答案的工具,因此设计了启发式模式:学生不知道怎么做时,系统会一步步提醒他从哪里思考,避免直接抄答案。它也针对工程领域做了优化,能够处理全科问题,包括读图、图纸理解、计算、建模等。

第二个是偏科研场景的工具,用来辅助工程智能或人工智能科研。它可以自动追踪全球前沿研究进展和资讯,帮助研究者把握趋势。我们每天做分析,每个人可以有自己的订阅。订阅不是简单推送一条信息,而是拿到信息之后还可以继续和系统沟通:让它进一步总结,与其他论文或资讯关联,或者用不同文风解释。

对于管理者,它可以用通俗语言解释艰深论文;对于技术人员,它可以深入到技术细节。更重要的是,我们希望它不仅是信息工具,还能把人、模型和智能体的能力融合起来,实现互相激发:人激发智能体产生更多有创意的想法,智能体也反过来激发人的想法


(研究院展览体验中心)

03

创造力的「下一维」

雷峰网:灵感计算听起来很特别,我们该如何去理解这个概念?

华先胜:灵感本来看起来是不可计算的。如果能计算,为什么还叫灵感?但我们不是说所有灵感都能计算,而是想解决其中能够被计算的一部分。

比如,一个研究者要产生一个新方法来解决问题,首先会有上下文:可能是一篇论文、一条资讯,或者一个很粗浅的想法。其次,可以放入当前领域最前沿技术的一些关键词;再次,可以放入这个领域存在的各种问题。这些都可以成为不同维度。当然维度可以不止三个,理论上可以有很多维度。

这个想法其实来自我很多年前在北大听过的一堂课。那位老师讲了两个概念,一个叫“维论”,另一个叫“寻找新的自由度”。很多时候我们觉得没有路,是因为把自己限制在二维或三维空间里。换到另一个空间,增加一个维度,问题可能就很简单。

我以前在团队里讲研究方法时,也常说要寻找新的自由度。而灵感的产生,在某种意义上就是升维,或者是在已有维度中寻找没有被挖掘过的地方。

关键在于,如何创造这些维度,而一旦维度创造出来,空间就会变得很广阔。

这也和大模型的创新能力相关。今天大模型能画画、做视频、写诗,看起来有创新能力。但它为什么能创新?创新天花板在哪里?

我用文字来打个比方:第一类是已经存在的有意义文字,也就是人类已经写出来的文本;第二类是所有可能的、有意义的文字组合,它们现实中未必已经存在,但大模型可能生成出来;第三类是任意文字组合,其中很多并没有意义。

大模型今天能够创新的地方,主要是在第二类空间里:现实世界还不存在,但它确实是有意义的组合。它的天花板也在这里,因为它是从已知内容中学出来的。

如果存在一种文字组合,人类现在还不知道它是否有意义,大模型也很难真正判断。它可以随机产生,但无法保证体系性,也无法判断对错。它也无法从文言文直接创造出现代汉语这种语言演化。人类不同的地方在于,人类可以创造逐渐演变的新状态。

所以,灵感计算的思路是构建不同维度,在维度形成的空间里寻找还没有被探索的可能性。这只能解决一部分问题,但已经能大幅提升人的能力。

比如构建一个三维空间,每一维有 10 个向量,就可能产生 1000 个 idea。其中可能 100 个已经被人做过,800 个不靠谱,但剩下 100 个也许有价值。系统可以自动判断哪些已经被做过,哪些不太靠谱,剩下的就可能成为有意义的启发。

难点在于如何“造维”,也就是如何描述创新空间。我们不求完整描述,只要能描述其中一部分空间,就有价值。

雷峰网:这样看,灵感计算其实不是为了让 AI 独自完成创新,而是为了让人和 AI 互相激发?

先胜:是的。AI 的超强能力需要和人类独特的非逻辑创造力结合,才能突破自身能力的天花板。一个好的共生智能系统,不是把答案直接交给人,而是把人推到更高价值的创造环节上。它可以完成大量繁重的信息搜集、比对、推理和生成工作,让人把精力集中在决定性、创造性的部分。

比如教育场景里,如果一个 AI 只是帮助孩子更快刷题、拿到标准答案,它可能把孩子训练成应试高手,却未必能让孩子爱上学习,更难让他成为提出问题的人。但如果 AI 像一位特级教师,引导孩子在学习引力时亲手拖动虚拟行星,再追问“如果引力规则完全不同,会发生什么”,它就可能点燃孩子的好奇心。

科研也是如此。前几年,DeepMind 和牛津大学数学家合作,把 AI 引入拓扑学研究。AI 分析大量被称为“纽结”的复杂拓扑对象,在代数和几何表征之间发现了新的关联模式;人类数学家再把这个模式提炼、理解并完成证明。这个例子说明,AI 可以发现人类难以穷尽搜索的模式,但最终的理解、判断和理论化,仍然需要人的智慧。

灵感计算想做的,就是把这种“互相激发”变得更系统、更可规模化。通过构建不同维度、探索没有被走过的组合空间,智能体可以不断向人提出可能性,而人则用自己的经验、直觉和非逻辑创造力,去判断哪些可能性真正有价值。


(华先胜院长讲共生智能)

04

在碎片世界里建立秩序

雷峰网:工程项目往往很碎片化,不同城市、不同场景差异很大,那么工程智能如何提炼共性,实现规模化复制?

华先胜:这正是为什么要打造工程智能操作系统。我们把工程智能中的核心问题总结为几个层面。第一个问题是建模:怎样用相对统一的方式把一个工程问题建模?工程问题非常复杂,数据量和数据模态都很多,有时间数据、空间数据、图纸、文本、视觉信息、时间序列等。工程领域首先需要一套相对统一的建模机制,能够处理这些异构数据。

这里有两类问题。一类是能够建模的数据,我们尽量通过统一方法建模;另一类是很难放进统一模型的数据,就作为外部数据来使用。有些数据语义不强,数据量又不多,很难 token 化,硬放进统一模型反而没有用。这类数据可以作为上下文,或者作为外部数据,由模型通过另一层能力读取和操作。

工程领域还会涉及物理规律和各种约束,比如成本约束、时间约束、安全性约束等。这些都会比较复杂。我们会把它们抽象成基础能力,但进入具体领域时,还要针对该领域优化和调优。

不能指望一个大一统模型解决所有工程问题,语言模型也许可以某种程度上统一很多语言任务,但工程世界很难这样。因此,我们会有基础框架、基础模型,也会在每个领域进行针对性优化。

这就是工程世界模型,它不是通常意义上只关注三维空间的世界模型,而是要刻画工程场景中的复杂问题,包括设备数据、建筑、机械以及它们之间的关系。刻画之后,还要进行推理,包括优化、预测、仿真等。这个过程不容易,但我们要用相对统一的方法逐步往前走。

雷峰网:如果把这些能力合在一起,工程智能操作系统的技术架构是什么?

华先胜:我们可以把它概括为三层,或者说三个基础研究维度。第一层是工程世界模型。它解决的是可信建模和可信推理:如何准确刻画工程世界,如何在模型之上进行优化、预测、仿真。

第二层是多人多智能体协同系统,也可以叫工程共创的多人多智能体体系。到了这一层,问题不只是模型能不能刻画世界,还包括任务能不能被可靠执行,智能体之间能不能协作,智能体和人之间能不能协同。我们提出四个关键词:可信建模、可信推理、可信执行、可信协同。前两个偏模型层,后两个偏任务执行和协同层。

现在业界非常关注智能体执行框架和 harness,本质上是因为大模型不可靠。怎样在真正完成任务时,让它安全、可靠、可控?工程智能对这一点要求更高,因为工程场景不能简单试错重来,它有更多约束,对可靠性、可解释性和安全性的要求也更高。

第三层是人机互信,这是我们很重要的创新。早期它还是一个概念,后来我们希望把它变成可计算的东西。未来社会生产和生活可能是人机融合的:你的同事、同伴可能是人,也可能是智能体。人和人之间、人和机器之间、机器和机器之间,都需要信任。只有互相信任,协同效率才会高。

但这件事不能停留在理念层面,我们要把信任变成系统中可以计算、可以演化的变量。系统运行的目标之一,是让信任度随着协同不断提升。信任度提升后,工程世界模型对世界的刻画能力会更强,多人多智能体系统完成任务的质量和效率也会更高。

也就是说,人机互信成为系统演进中的一个约束和优化目标。我们也定义了信任如何度量、如何演化,并把它称为信任的动力学方程。

过去,信任更多是管理学或心理学概念。我们希望把它变成可计算概念,与模型精度优化、任务完成能力优化并列,成为系统优化的一部分。这样,模型与模型之间、人和模型之间、人和人之间协同更可信,整个系统运行的效率和可靠性也更高。

这也和我提出的“共生智能”有关。我去年在一个报告里提出这个概念,并在此基础上写了一本书,暂名叫《共生智能:人工智能的下一代》。它有技术哲学,也有系统架构。它不是只讲理念,因为里面的很多东西可以一行一行写成代码,落成系统。

对此我的一个观点是:要让最好的选择成为唯一的选择。也就是说,当我们设计出一个足够好的、人机协同、共生共创的系统,大家自然会选择它。

所以,工程智能操作系统可以由三个基础部分构成:工程世界模型、工程共创的多人多智能体体系,以及人机互信优化。三者合在一起,才构成真正意义上的工程智能操作系统。

而从实现工程智能的技术路径上讲的,共生智能并不是一个抽象口号。未来可以有“共生智能大模型”:它不只是知识问答机,而是在模型和智能体的设计中融入人类长期积累的创新理论和方法,使模型具备一定的“灵感激活能力”。

智能体则像总指挥,负责规划和执行复杂任务。更重要的是,它要能识别逻辑和计算的尽头:当模型靠自身计算无法继续突破时,它就应该主动转向人类伙伴,开启高质量的创造性对话。

如果这个智能体还有长期记忆,能够记住与人的每一次互动,理解人的能力结构、兴趣、偏好和思考方式,那么它就不再只是一次性工具,而会逐渐成为与人共同进化的伙伴。人、模型和系统之间的能力,也会形成螺旋式上升的闭环。


(研究院回廊展厅)

05

人机共事,才是下一站

雷峰网:如果工程智能既有技术、又有信任、还能协同,它会不会取代工程师?

华先胜:我觉得更大的可能不是取代这个职业,而是取代这个职业中的大量人力。可以用一个非常简化的例子来讲:如果工作量是 100,过去可能需要 100 个工程师完成,未来可能 10 个工程师加一批智能体就可以完成,甚至 5 个工程师加一批智能体就可以完成。这是工作量固定时的情况。

换一个角度,如果仍然有 100 个工程师,但他们带着 1000 个智能体,就不是完成 100 的工作量,而可能完成 1000 甚至 10000 的工作量。所以,它不一定取代工程师这个职业,但会改变这个职业中的人力结构和工作方式。

AI 完全取代一个职业,我认为很难,因为大模型的本质是概率预测。我们说它在生成,其实它是在预测。为什么有幻觉?为什么有时候不听话,甚至违反人的某些指令?因为它是概率模型,它根据上下文认为那是最好的结果。它不像人一样有 common sense,它不是不想听话,而是它并不知道自己是否违反了什么。

完全替代人是不现实的。人可以在系统里发挥重要作用,尤其是创新部分。刚才讲灵感计算时也提到,大模型创新有天花板。即使它通过随机方式跳过某些限制,也很难判断那个东西到底对还是错。人有很大的灵活性,也有非逻辑的部分。今天所有 AI 都基于计算,本质上基于逻辑,而人可以超越这部分。

因此,我们设计系统时,会考虑如何充分发挥人的能力,让人在未来有位置。工程智能不是简单取代人,而是让人机共创成为一种新的范式。它会让会使用 AI 的工程师拥有更强能力,也会让不会使用 AI、不能用 AI 赋能自己的人被淘汰。

所以,我更愿意说:AI 不只是帮你完成任务的工具,也应该成为让你自己进步的工具。

从这个意义上说,工程智能真正要避免的是把人挤出系统。一个共生智能系统的目标,不是让人不再思考,而是让人的思考进入更高层次。它会让 AI 承担大量低价值、重复性、计算性的工作,同时不断把人拉回到判断、创造、责任和价值选择的位置。

我觉得,未来最好的 AI 系统,不是让人越来越依赖它,而是让人因为使用它而变得更强。它不是只给你一个答案,而是让你在和它共同完成任务的过程中,逐渐拥有更强的洞察力、判断力和创造力。

雷峰网:展望 5 年后,您认为中国工程智能会达到什么水平?

华先胜:前面描绘的很多东西,可能到那时会逐步成为现实。首先,工程领域里一些核心难点问题,会通过与人工智能的深度融合得到相当程度的解决。比如开放复杂巨系统中的很多问题,今天还没有解,这也是人工智能难以规模化落地的重要原因之一。过去很多 AI 落地没有进入产业核心,只是在外围做了一些事情。

我经常举一个例子:智慧校园如果只是做通行、安防、消防,重要吗?当然重要,但它并没有进入学校的核心。中小学的核心是教育和教学,大学还有科研。只有 AI 进入教学和科研,才真正进入学校核心。

工厂也是一样,如果只做通行、安全检查、有没有人违反安全规定,也不能说不重要,但如果没有进入生产、设计、营销等环节,就没有进入核心。工程智能必须进入工程和产业的核心问题。未来几年,这件事会得到比较好的解决。

第二,工程智能体会全面渗透。当然,“全面”怎么定义还需要讨论,但渗透面一定会很广。工程全生命周期中的策划、设计、施工、运维、运营等阶段,都会出现专业智能体。智能体和人类工程师一起工作,会成为司空见惯的事情。

这背后是人机协同范式的常态化。在大型工程、大城市治理、制造等领域,专业智能体会和专业工程师一起完成任务。我们正在做的人机共创协同平台,或者人机共生共创平台,本质上就是为了这个场景。

智能体和人有不同特点。智能体可以 24 小时工作,只要有 token budget,就可以持续做调研、实验、各种可能性探索。人类则更多贡献 out of the box 的想法,或者非逻辑的创新。

不同智能体也可以扮演不同角色,有的偏创新,有的偏质疑,总是提出不同意见。未来,人还可以把自己的经验和思维习惯培养进智能体,甚至培养自己的 N 个分身。

不过,工程领域有很多核心能力不是今天一个模型就能解决的。体系本身可能很快跑起来,但真正面向工程核心问题的能力,需要深入到具体领域里,一点点构建。

我也希望,通过基础能力、平台化方式和系统构件,中国能够在工程智能技术方面走在世界前沿,甚至形成引领。

更长远地看,AI 带来的挑战不只是效率问题,也不只是生产力问题,而是人在智能系统中的位置问题。如果技术只制造一个无挑战、无摩擦的舒适区,人可能会在极度便利中失去目标。共生智能的意义,是为人类提供持续探索的前沿,以及值得尊敬、能够共同成长的智能伙伴。

我希望未来的 AI,不只是机器越来越像人,而是人与机器能够一起持续成长。工程智能,以及作为工程智能规模化实现形式的共生智能,最终要回答的,都是同一个问题:如何让技术真正以人为本,不是靠说教,而是靠更好的系统设计,让最好的选择成为唯一的选择。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新