近日,国内首个地质领域专用大语言模型“坤枢”在郑州上线,标志着郑州超算在地质信息化与国产化技术融合方面取得重要突破。
据介绍,该大模型由郑州大学国家超级计算郑州中心联合河南省地质研究院自主研发,是国内首个基于国产高性能计算与人工智能融合平台打造的地质行业大模型。
“坤枢”大模型基于国产超智融合技术,通过双层分组路由策略和任务驱动的跨组路由调整机制,有效缓解了领域模型在持续学习过程中的灾难性遗忘问题,实现专业知识与通用能力平衡优化,为复杂多变地质调查任务提供更加精准、高效的解决方案。
“地质调查领域专业性强、数据海量,传统模型常因知识更新出现‘学新忘旧’的难题。”郑州超算“坤枢”大模型研发团队负责人介绍,该大模型的部署有助于夯实地质产业数字化基础,在保障国家能源资源信息安全前提下完成多项任务,为矿产勘查模式研究提供新范式,是AI赋能新一轮找矿突破战略行动的重要成果。
同时,该模型还将为地学科普工作带来创新体验,利用其智能交互能力,以更加生动、易懂的方式向公众普及地质科学知识,提升全民科学素养。
目前,模型体验通道已开通,用户可通过国家超算郑州中心工单系统申请账号,直观感受“AI地质专家”的智能服务。未来,郑州超算将持续优化“坤枢”模型性能,深化在深地探测、深空对地观测等场景的应用拓展,为新时代地质事业高质量发展注入新动能。
据悉,“坤枢”大模型在训练中也得到了中科曙光超智融合技术方案支持。该方案采用AI计算开放架构设计,配备曙光国产云计算平台、高性能计算集群管理调度平台、人工智能平台以及专业的在线运维平台,可提供类型多样的算力服务。
作为河南区域经济发展、科技创新的重点平台,超智融合算力中心自投入运行以来,已服务于高端装备、智能制造、生物医疗、地球环境、人工智能等领域数智化创新,成为当地超智融合算力中心的标杆。
(河南日报)