传统工业机器人只能按固定逻辑干活,没法应对复杂环境,而人形机器人的目标是成为“通用智能体”,得能感知环境、理解任务、灵活执行,这就离不开高智能大模型的支撑。 从技术进展看,架构上,从早期的SayCan到最新…
目前公开的三条主线:RealQA 用多模态大模型给图像质量与美感打分,FLUX-Text 支持 512×512起的高保真场景文字编辑,海报、路牌一键改字;UniVG-R1 则是推理引导的视觉定位模型,一句…
10/31 16:58
10/31 16:56
10/31 16:55