当前位置: 首页 » 资讯 » 科技头条 » 正文

从感知到推理,ViSCALE 2.0 邀你重塑计算机视觉的 System 2

IP属地 中国·北京 机器之心Pro 时间:2026-02-13 16:13:55



当大语言模型通过 Test-time Scaling(推理时计算扩展)在逻辑推理上不仅 “读万卷书”,更能 “行万里路” 时,计算机视觉的 “System 2” 时刻也已悄然降临。

从单纯的像素感知,到构建符合物理规律的世界模型(World Models);从平面的模式识别,到复杂的空间推理(Spatial Reasoning)—— 视觉智能正站在新范式的路口。

2026 年 6 月,CVPR 第二届计算机视觉推理扩展研讨会(ViSCALE 2026) 将在美国重磅回归!继首届研讨会成功开启 TTS 在视觉领域的无限可能后,本届 ViSCALE 由来自清华、普林斯顿、UC Santa Cruz、NUS等全球顶尖机构的学者联合举办,将汇聚全球顶尖学者,共同探索如何让视觉模型通过计算扩展突破现有模型的能力瓶颈。



研讨会亮点:重新定义 “看” 与 “想”

如果说上一代视觉模型是 “直觉反应”,ViSCALE 关注的则是深度推理。我们不再满足于静态的输出,而是探索模型如何在测试时动态分配计算资源,实现从 “看懂画面” 到 “模拟世界” 的跃迁。

我们将重点探讨:

世界模型与视频生成: 如何利用 TTS 提升视频生成的物理一致性与长时序因果推理能力?空间与几何推理: 突破 2D 限制,让模型在 3D 空间中具备类似人类的导航与操作直觉。视觉思维链 (Visual CoT): 像 LLM Reasoning 一样,让视觉模型学会 “反思”、“自我修正” 与多步推理。推理扩展律 (Scaling Laws): 探索测试时计算量与视觉推理性能之间的 Scaling Law。

ViSCALE 已经邀请到包括 Sergey Levine, Manling Li, Ziwei Liu 在内的诸多学界和业界顶尖学者,将会围绕空间智能、世界模型等计算机视觉领域新兴的热点话题展开讨论,期待碰撞出新的火花。

论文征稿 (Call for Papers)

我们要寻找的,是能打破现有视觉模型天花板的原创性研究。无论你是深耕理论,还是专注应用,ViSCALE 都是你展示成果的最佳舞台。

核心议题包括但不限于:

Test-time Scaling 的理论基础与高效算法世界模型、视频生成与复杂决策中的推理扩展具身智能与自动驾驶中的长时序空间推理统一模型中的推理扩展问题Visual Chain-of-Thought 与模型可解释性推理扩展带来的安全性、鲁棒性与幻觉问题

研讨会特别鼓励提交新颖观点和创意思路的研究,将会接受多种类型的投稿:

Track 1: 正式论文 (Full Papers)

收录类型: Archival篇幅限制: 8 页 (不含参考文献)格式要求: 必须使用 CVPR 2026 Author Kit。

Track 2: 扩展摘要 (Extended Abstracts)

收录类型: Non-Archival篇幅限制: 不超过 4 页 (不含参考文献)格式要求: 需使用 CVPR 2026 Author Kit。

重要日期:

截止日期: 2026 年 3 月 10 日 (AoE)录用通知: 2026 年 3 月 18 日研讨会时间: 2026 年 6 月 3 日或 4 日(半天,线上线下混合)

Test-time Scaling 作为一项前沿技术,正在为模型推理增强带来革命性的变化。欢迎大家积极参与,踊跃投稿并参与讨论。投稿方式和详细信息参见:https://viscale.github.io/

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新