新加坡初创公司 Sapient Intelligence 最近推出了一种创新的人工智能架构,名为 “层次推理模型”(HRM)。该模型在复杂推理任务中能够与现有的大型语言模型(LLMs)相媲美,甚至在某些情况下表现更佳,且其数据需求和模型规模均远低于传统模型。HRM 的设计理念源自人类大脑,旨在通过不同的思维系统实现高效推理。
当前的 LLMs 在解决复杂问题时,通常依赖于链式思维(CoT)方法,通过生成一系列文本步骤来进行推理。虽然这一方法在一定程度上提升了模型的推理能力,但也存在明显的不足。研究人员指出,链式思维依赖于人为定义的步骤,一旦出现错误,可能导致整个推理过程的失败。因此,Sapient Intelligence 的研究团队提出了一种新方式,即 “潜在推理”。该方式使得模型能够在内部抽象的空间中进行推理,而不是仅仅依赖于文本生成。
HRM 由两个相互作用的模块构成:一个是高层模块,负责缓慢而抽象的规划;另一个是低层模块,进行快速而详细的计算。这种层次化的设计使 HRM 在进行深度推理时,无需依赖大量的输入数据。测试结果表明,HRM 在处理如抽象推理和复杂数独等高难度任务时,取得了优异的成绩,展现了其在复杂任务中的强大能力。
除了准确性,HRM 还在推理速度方面表现出色。根据 Sapient Intelligence 的创始人王冠的介绍,HRM 在执行特定复杂推理任务时,能够实现 “任务完成时间的100倍提速”。这意味着 HRM 能够在边缘设备上快速进行强大的推理计算,显著降低企业的时间和成本。
展望未来,Sapient Intelligence 正在努力将 HRM 发展为一种更通用的推理解决方案,计划将其应用于医疗、气候预测和机器人等多个领域。这一发展标志着,未来 AI 的成功之道,可能并不在于简单地扩大模型规模,而是借鉴人类大脑的结构,开发出更智能、更高效的推理架构。
划重点: