德克萨斯大学阿灵顿分校研发：让AI替你操控工程仿真软件

IP属地中国·北京 科技行者 时间：2026-06-09 22:24:28

这项由德克萨斯大学阿灵顿分校联合伦斯勒理工学院共同完成的研究，以arXiv预印本形式于2026年5月28日发布，论文编号为arXiv:2606.00138v1，感兴趣的读者可通过该编号检索完整论文。
有没有想过，工程师在电脑前对着一堆复杂软件发呆的画面？那种软件叫做有限元分析软件，是现代工程设计里不可缺少的"虚拟实验室"。当一座桥梁还没有建成，工程师就能用它模拟这座桥在各种压力下会不会断裂；当一款手机外壳还在设计阶段，工程师就能用它预测摔落时会不会开裂。问题在于，这类软件极其难以掌握，需要多年的专业训练，稍有不慎还可能产生完全错误却看起来没问题的结果，酿成真实事故。
现在，这项研究带来了一个新思路：既然大型语言模型（也就是ChatGPT这类AI）已经能够理解人类说话的意思，为什么不让AI来充当这个"虚拟工程助手"，帮普通人甚至经验不足的学生直接操控这套复杂软件呢？这个系统被称为AbaqusAgent，其中Abaqus是全球工业界使用最广泛的有限元分析软件之一，而Agent则是"代理人"的意思——它代替你完成所有繁琐的专业操作。
一、工程仿真软件到底难在哪里
要理解这项研究的价值，得先理解那个问题有多棘手。有限元分析，英文缩写FEA，诞生于上世纪五十年代，是一种把复杂结构切分成无数小块、分别计算再拼合的数值方法。你可以把它理解成这样：当你想知道一块不规则形状的橡皮泥被捏压后会如何变形，直接用公式算几乎不可能，但如果你把橡皮泥切成成千上万个微小方块，每个方块的变形都能用简单公式算出来，再把所有方块的结果拼在一起，就能得到整体变形的图像。这就是有限元的核心思想。
问题在于，要让这套计算正确运行，使用者必须精确定义一大堆参数：结构的几何形状要怎么描述、材料的力学性质是什么、哪些地方固定住不能动（边界条件）、哪些地方受到了力（载荷条件），以及最后要提取哪些计算结果。任何一个参数定义错误，计算都可能顺利完成但结果完全不对——软件本身不会告诉你物理上是否合理，只会按照你给的参数算出答案。就像你拜托一个非常勤快但不思考的助手帮你烤蛋糕，你如果把糖的用量写错了，他会严格按照错误配方烤出一个根本不能吃的成品，还信心满满地递给你。
正因为如此，有限元分析在全球工程教育和工业应用中都面临着巨大的"入门门槛"。这项研究指出，在真实工程问题中运用有限元分析，通常需要多年的实际工作经验积累。
二、AbaqusAgent是怎么工作的
研究团队设计AbaqusAgent的方式，就像打造一个由六名不同专长成员组成的工作小组，每个成员负责整个流程中的一个环节，彼此配合完成从"用户说了什么"到"仿真结果呈现在屏幕上"的全过程。
这个小组的第一位成员叫做"解读员"（Interpreter Agent）。当用户用自然语言描述自己的工程问题时，解读员的任务是检查这段描述是否完整。它会核查五个关键要素是否都提到了：几何形状的描述、材料的力学性质、边界条件（哪里固定）、加载条件（施加什么力），以及需要提取什么结果。如果有遗漏，它会提示用户补充，而不是自己脑补一个可能出错的假设。同时，它还会把用户的原始描述重新改写成更规范的工程语言，方便后续成员处理。
第二位成员是"架构师"（Architect Agent）。它的任务是从一个预先建好的案例库里，找到与用户当前问题最相似的参考案例。这个案例库就像一个包含了104个经典工程题目的"题库"，每道题都有详细的问题描述和对应的Abaqus输入文件。架构师通过一套精密的搜索算法，在这个题库里找到最合适的参考，作为后续生成文件的模板。
第三位成员是"代码生成员"（Input Writer Agent）。Abaqus软件的核心是一个后缀名为.inp的输入文件，这个文件用特定的关键词语法描述了整个仿真模型——节点坐标、单元连接关系、材料参数、边界条件、载荷、输出请求，一行都不能少，格式必须精确。代码生成员的任务就是以架构师找到的参考案例为语法模板，以用户的实际需求为物理内容，生成这个完整的输入文件。
第四位成员是"执行员"（Runner Agent）。它把生成的输入文件提交给Abaqus求解器运行，等待计算完成后收集结果文件，包括那个包含了所有应力、应变、位移数据的.odb结果文件。
如果计算失败了怎么办？这时候第五位成员"审查员"（Reviewer Agent）就登场了。Abaqus在运行失败时会生成错误日志文件，审查员会仔细分析这些错误信息，判断是哪里出了问题，并提出修改建议，再把任务交回给代码生成员重新生成修正后的输入文件，重新提交运行。这个循环可以最多进行十五次，大多数问题在这个过程中都能被逐步修正解决。
第六位成员是"可视化员"（Visualization Agent）。当计算成功后，它会自动提取变形数据和应力云图，生成直观的图片和数据文件，让用户能直接看到仿真结果。
这六位成员协同工作的整个流程，从用户输入一段自然语言描述开始，到屏幕上出现彩色的仿真云图结束，完全不需要用户具备任何Abaqus的专业知识。
三、那个"题库"是怎么建成的
AbaqusAgent里这个叫做RAG（检索增强生成）的案例库，是整个系统最关键也最费心思的部分之一。RAG是"Retrieval-Augmented Generation"的缩写，通俗地说就是"先查资料再回答"，而不是让AI凭空想象一个答案。
为什么这个题库这么重要？因为Abaqus是商业软件，它的官方案例和代码并不像开源软件那样在网上唾手可得。研究团队花费了大量精力，从Abaqus官方基准手册中整理了71个经典案例，再自行开发了33个教材风格的习题，合计104个案例构成了整个知识库。每个案例都包含三层信息：案例的基本标签（名称、分析类型、结构类别、材料类型），自然语言的问题描述，以及完整可运行的Abaqus输入文件。
这104个案例覆盖了固体力学的五大类问题。静力分析有35个案例，是基础中的基础，研究结构在稳定载荷下的变形和应力。动力分析有26个案例，涉及时间相关的运动和冲击问题。非线性材料有19个案例，包括金属塑性变形、接触摩擦、断裂等复杂行为。结构屈曲有14个案例，研究细长结构在压力下突然失稳的现象，就像用力按压一根细长的木棍时它会突然弯折。复合材料与层合板有10个案例，针对碳纤维增强复合材料这类各方向性质不同的特殊材料。
在搜索算法上，研究团队设计了一套两阶段的混合检索策略。第一阶段使用Facebook开发的FAISS向量搜索库，把用户的问题描述和题库中的所有案例都转换成高维数字向量，通过计算向量之间的距离找出语义上最相似的15个候选案例。第二阶段则进行精细筛选：首先按照分析类型做严格过滤（比如用户问的是动力问题，就只保留动力类案例），然后对剩余候选案例按照三个维度打分：案例名称的相似度占30%的权重，案例类别的相似度占60%的权重，材料类型的相似度占10%的权重，综合得分最高的那个案例就成为参考模板。经过多次试验，研究团队确认这套权重分配能让检索准确率达到最优。
四、实际测试的成绩单
研究团队用50个工程问题对AbaqusAgent进行了全面测试。这50个问题的构成颇为讲究：40个来自RAG题库内部但做了参数修改（比如把材料换掉、把几何尺寸改变、把边界条件调整），另外10个是完全来自题库之外的新问题。这样的设计是为了同时考察系统在"见过类似题目"和"从没见过"两种情况下的表现。
总体结果是86%的成功率——50道题里，43道成功完成了仿真并得到了正确结果。这个数字意味着什么？可以参考一下其他同类系统的成绩：同样针对工程仿真的ALL-FEM系统，在39道测试题上的最高成功率是71.79%，而且那还是用了专门微调过的大型语言模型才达到的；MooseAgent系统在9道测试题上达到了93%，但测试规模小得多；MechAgents系统只成功演示了两个案例。AbaqusAgent在50个案例这个相对大的测试规模上实现86%，是一个相当有竞争力的成绩。
在题库内部40道修改题上，系统的案例检索准确率达到了85%，仿真成功率和结果准确率都是92.5%。对比之下，题库之外10道全新题目的成功率降到了60%，这个对比直观说明了题库的价值：有参考案例时，系统表现明显更好。
效率上的差异同样明显。有题库参考的成功案例平均消耗28761个token（可以粗略理解为AI处理文字的计量单位）、耗时157秒；没有题库参考的成功案例平均消耗48200个token、耗时312秒。有题库参考的情况下，token消耗降低了约40%，时间缩短了约50%。这意味着题库不仅提高了准确率，还显著降低了计算成本。
五、从简单拉伸到高速冲击，都能搞定
研究展示了AbaqusAgent在各种复杂程度问题上的表现，最令人印象深刻的是那些高度非线性的动力学问题。
其中一个测试案例模拟的是铜棒高速撞击刚性墙壁的过程——这是经典的泰勒冲击棒实验。铜棒以227米每秒的初速度（约等于一颗步枪子弹的速度）撞上固定的刚性壁面，整个过程持续80微秒。这类问题涉及极大的塑性变形、材料的动态响应以及显式动力学求解，属于有限元分析中难度很高的一类。AbaqusAgent成功生成了正确的轴对称模型，施加了正确的初始速度和对称边界条件，并捕捉到了铜棒棒头在撞击后因惯性展开的"蘑菇状"变形演化过程。
另一个案例是模拟金属圆棒的颈缩失效——就是拉伸金属棒时它会在某一位置越来越细直至断裂的那个过程。这个过程涉及几何非线性（大变形）和材料非线性（弹塑性），同样需要大量专业设置才能正确求解。AbaqusAgent正确打开了大变形选项，定义了弹塑性材料模型，并输出了位移云图、应力云图和等效塑性应变云图，清晰展示了颈缩区域的局部化变形。
在几何多样性方面，研究展示了针对同一道开孔板拉伸问题，系统能够处理圆孔、椭圆孔和方孔三种不同几何形状。其中圆孔的案例在题库中有参考，而椭圆孔和方孔是在没有直接参考的情况下根据用户描述生成的，三种情况都成功得到了正确的应力集中分布图像。
六、各个设计决策的有效性验证
研究团队专门做了一套"去掉某个部件看看会怎样"的对照实验，用20个测试案例评估了三种不同配置的效果。
当RAG题库和审查员都正常工作时，案例检索准确率80%、仿真成功率90%、结果准确率90%，token消耗634690，用时3518秒。当保留审查员但去掉RAG时，系统没有了参考案例可查，成功率降到80%，同时token消耗暴增至2203778，用时7758秒——成功率降低了，代价却增加了约3.5倍。当保留RAG但去掉审查员时，成功率从90%骤降到45%——几乎一半的问题因为第一次生成的代码有错误而无法自我修复。这两个对比清晰地说明了两件事：题库让系统又快又好，审查员让系统具备了从错误中恢复的能力，两者缺一不可。
研究还对比了两种不同大型语言模型作为底层引擎时的表现差异。使用Anthropic公司的Claude Opus 4.6时，仿真成功率90%、结果准确率90%；使用OpenAI的GPT-5.2时，成功率降至65%、准确率降至45%。这个差距在一个具体案例中体现得淋漓尽致：用户要求模拟一根圆柱形金属轴受扭转载荷的情况，Opus 4.6生成的是正确的圆柱体模型，而GPT-5.2生成的是一根方形截面的棱柱体，几何形状就已经完全错了，后续结果自然也无从验证。这说明底层语言模型对几何描述的理解能力直接影响了整个系统的可靠性。
此外，提示词质量对结果的影响也被专门展示出来。针对同一个圆孔板拉伸问题，第一个提示词只是粗略地描述了问题，没有说明网格划分方式，结果系统自动生成的网格在圆孔附近出现了严重的几何失真，孔的形状都不圆了，应力结果当然也不对。第二个提示词明确指定了以圆孔为中心的辐射状结构化网格、每个象限10个径向分区和8个周向分区，结果网格非常精细规整，应力集中区域的计算结果也准确得多。这提示用户，尽管系统大大降低了使用门槛，但对于几何复杂的问题，越详细的描述仍然意味着越好的结果。
七、用数学公式检验了答案的准确性
研究团队还专门选取了一道有精确理论解的经典问题，用来验证AbaqusAgent生成的仿真结果是否在数值上也是正确的。这道题是简支矩形薄板在单轴压缩下的屈曲临界载荷计算——通俗地说，就是一块四边被简单支撑住的薄板，在面内压力作用下会在多大载荷时突然弯折失稳。
理论公式（基于两百年前发展起来的经典薄板理论）给出的答案是每毫米宽度承受2.0675牛顿的压力时薄板会屈曲。AbaqusAgent生成的仿真给出的答案是2.1026牛顿每毫米，两者之间的误差仅为1.7%，也就是98.3%的准确率。这个小小的差距完全属于有限元方法本身因为网格离散化带来的正常误差，而不是建模错误。这个验证说明系统不仅能够跑通仿真，给出的物理结果也是可信的。
说到底，AbaqusAgent这项研究要回答的是这样一个问题：那些真正有价值的专业工具，是否可以因为AI的存在而变得人人可及？从测试结果来看，答案是"相当程度上，是的"。86%的成功率、覆盖五大类固体力学问题、从简单线弹性到高速冲击的跨度，已经证明这个系统的实用性远超"演示品"的级别。
对于工程教育来说，这意味着学生可以更快进入"做仿真"的阶段，而把更多精力放在理解物理现象本身，而不是花大量时间啃软件手册。对于工程实践来说，这意味着当优化算法或材料表征流程需要反复调用仿真时，这类循环可以更容易地自动化。
当然，研究团队也坦诚地指出了当前的局限：系统还不支持多物理场耦合仿真（比如同时考虑热和力的相互影响），也不支持用户自定义网格导入的场景，这些都是未来要解决的方向。另外，题库目前只有104个案例，当用户的问题与题库中任何案例都差距较大时，成功率会明显下降，题库的扩充是提升系统能力最直接的途径之一。
感兴趣的读者可以通过arXiv:2606.00138这个编号找到完整论文，研究团队也已将代码开源，地址是github.com/LIRAM-LIN/AbaqusAgent，有编程基础的读者可以直接尝试。
Q&A
Q1：AbaqusAgent需要用户自己安装Abaqus软件吗？
A：是的，AbaqusAgent目前只支持本地运行模式，用户需要在自己的计算机上安装并拥有合法授权的Abaqus软件，AbaqusAgent相当于一个操控Abaqus的智能助手，而不是替代Abaqus本身的计算引擎。Abaqus学习版是免费的，但限制模型节点数不超过1000个；完整授权版本无节点数限制，适合复杂工程仿真。
Q2：AbaqusAgent在没有找到相似案例时还能正常工作吗？
A：可以工作，但效果会明显下降。测试数据显示，题库内部案例的成功率是92.5%，而题库之外全新案例的成功率降至60%。没有参考案例时，系统仍会尝试从头生成仿真文件，但消耗的token会增加约40%，耗时也会增加约一倍，而且出错概率更高，需要审查员进行更多轮次的修正才能成功。
Q3：提示词写得越详细结果越好吗？
A：对于几何形状复杂的问题，是的。研究对比了两个针对圆孔板的提示词，详细指定网格划分方式的提示词生成的模型，其网格质量和应力计算结果都明显优于只做粗略描述的版本。不过对于简单规则的几何形体，系统通常能自动做出合理的默认选择，不一定需要非常详细的网格说明。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

四部门发文指引互联网基础资源升级——从政策新规看域名战略与品牌数字化机遇

AII in“旗舰大模型”！亚马逊AI战略大转向摘要：

中央广播电视总台首届智能机器人应用技能大展启动

中国老头乐席卷美国！美方征收高额关税企业海外建厂突围

菲尔兹奖得主王虹赴法留学推荐信首次曝光：由北大教师雷军所写

不止Kimi K3，北京AI正在补上Action拼图

全站最新

四部门发文指引互联网基础资源升级——从政策新规看域名战略与品牌数字化机遇

AII in“旗舰大模型”！亚马逊AI战略大转向摘要：

中央广播电视总台首届智能机器人应用技能大展启动

中国老头乐席卷美国！美方征收高额关税企业海外建厂突围

热门推荐

四部门发文指引互联网基础资源升级——从政策新规看域名战略与品牌数字化机遇

AII in“旗舰大模型”！亚马逊AI战略大转向摘要：

中央广播电视总台首届智能机器人应用技能大展启动

中国老头乐席卷美国！美方征收高额关税企业海外建厂突围

菲尔兹奖得主王虹赴法留学推荐信首次曝光：由北大教师雷军所写

不止Kimi K3，北京AI正在补上Action拼图

宝马i4敞篷版路试谍照首次曝光：基于新世代平台打造，预计2028年发布

招聘骑手优先985、211硕士？山姆回应

播放量超2亿，吸粉几十万，第一代AI明星出现了？

苹果公司在美国推出设备升级租赁计划

破产的德国半导体巨头，在西安和合肥“重生”

英伟达，左手出资、右手卖芯片

Kimi正式开源：硅谷深陷分裂，内战打响，黄仁勋罕见与白宫唱反调

外媒罕见对长鑫低头

广汽埃安全新车系“Ray”登场，首款车型命名Ray 7