【新智元导读】首个工程自动化任务评估基准DrafterBench,可用于测试大语言模型在土木工程图纸修改任务中的表现。 DrafterBench以图纸修改为核心任务,在20个真实项目中收集并设计了1920个…
你有模型,DrafterBench有任务。
07/09 12:23
07/09 12:22
07/09 12:21
07/09 12:20