本报讯 5月11日,科技圈传来重磅消息。OpenAI前首席技术官Mira Murati创立的AI实验室Thinking Machines发布了一款名为"交互模型"的新产品,这款产品的亮相,有望彻底改变我们使用AI的方式。
对话不再"一问一答"
长期以来,我们对AI的认知还停留在"说句话-等回复"的模式。无论语音还是文字交互,用户必须等模型完全处理完毕才能得到回应,这种模式切断了人与人对话时那种自然流畅的感觉。
"共在"是人与人之间交流的核心要素之一——我们能感知对方的表情、语气和情绪。而现有的AI系统往往缺少这种感知能力,导致互动生硬。Thinking Machines提出的新概念,就是要让AI真正"在场"。
技术突破在哪?
这款新模型的核心技术有三大亮点。首先是采用统一的多模态架构,从训练到推理保持时间精度统一,让语音、图像等输入输出同步进行。其次,模型运行在200毫秒的微循环上,即使没有说话也在持续处理信息,实现真正的"永不停机"。
另外,系统采用双模型架构设计。主模型负责维持对话心跳和即时回复,背景模型则处理深度推理和资料查询,两者共享上下文,各司其职。
效果如何?
测试数据显示,这款模型在对话质量评测中得分达到77.8分,相比之下OpenAI同期的GPT-4o实时版本得分46.8分,普通GPT-4也只有48.3分。在打断响应速度测试中,准确率达到64.7%,而对比产品仅为4.3%。这意味着用户可以随时打断对话,AI能迅速理解并调整,更接近真人交流。
技术门槛与未来
不过,这项技术并非没有挑战。200毫秒的心跳机制对算力要求极高,2760亿参数的模型成本也不菲。但思考机器实验室表示,这代表了AI交互的发展方向——不是让人适应AI,而是让AI主动融入人的思考节奏。
业内分析认为,如果这项技术能够落地普及,人机交互将进入全新的时代。我们不再需要刻意训练如何与AI对话,AI会主动感知我们的需求,成为真正"懂你"的智能助手。
目前,该实验室尚未公布商业化时间表,但这一原型机已在业内引发广泛关注。





京公网安备 11011402013531号