【新智元导读】首个工程自动化任务评估基准DrafterBench,可用于测试大语言模型在土木工程图纸修改任务中的表现。 DrafterBench以图纸修改为核心任务,在20个真实项目中收集并设计了1920个…
自主换电可以减少人力维护成本,提升整体生产效率。
ChatGPT智能体模型在Humanity's Last Exam(pass@1)中得分率为41.6%
OpenAI交出了Agent的答案。
OpenAI的“Manus时刻”来了:ChatGPT Agent正式发布
你有模型,DrafterBench有任务。
深度学习史证明:凡是能被测量的,都能被优化。
许多公司正使用AI为其软件编写代码以节省成本并减少对人的依赖。
场景落地方面,“人工智能+”行动全面推进,2025年政府工作报告明确支持大模型在工业、农业、服务业等垂直领域应用,工信部通过“揭榜挂帅”机制攻关制造业重点场景,组织“十大行业、百大场景、千家标杆”赋能活动,…
有了“脑眼手脚”能真正为人类做事的智能体,会场里“秀技”的具身智能机器人,已在新能源汽车中批量“上车”的多模态大模型……正在举办的第三届中国国际供应链促进博览会(简称“链博会”)上,数字科技链展区的中国数字科…
研究显示,大语言模型可能对自己的答案过于自信,但在面对反驳时会迅速失去信心并改变想法,即使反驳是错误的。分析重点关注大语言模型对其原始选择的信心在第一轮和第二轮之间如何变化,清楚地显示了初始信念或先验如何…
更重要的是,治理规则和业务场景深度绑定:比如在 “跨境贷款审批” 时,平台预设了征信、纳税证明等校验规则,AI实时扫描数据,若发现贷款申请缺 “海关进出口数据”,会自动补全并标准化,让数据在流动中完成80%…
近日,宁波城知产业链数据科技有限公司与浙江天启微网能源股份有限公司正式达成“汇同AI智电大模型”项目合作,以城知科技的人工智能技术产业链赋能能力,联合生态伙伴资源在光伏新能源领域开展AI赋能实践,以算法直抵电…
李开复在策略会中指出,美国的前沿技术研究是领先中国的,但是中国吸收消化技术快速迭代的能力很强,中国工程能力也处于世界第一梯队,更可贵的是,中国的创业者很有拼劲,目前看,世界大模型竞赛中只有中美两国,没有第三…
07/09 12:23
07/09 12:22
07/09 12:21
07/09 12:20