AI卷王本王。
为此,腾讯优图实验室正式开源Youtu-agent——一个简单而强大的智能体框架,兼顾极简设计与高性能表现,既能服务科研基线需求,也能支撑实际应用构建,最重要的是不需要训练模型、不依赖闭源API,就能取得极…
针对图像分割任务对细粒度多尺度特征的需求,设计了分割连接器,为分割解码器提供丰富的多尺度信息。一是与 SAM2集成实现图像和视频的统一分割,进一步扩展应用范围;二是将 VGD 分割扩展到视频中,引入视频中…
最新开源的首个多模态大模型dots.vlm1,基于自研视觉编码器构建,实测看穿色盲图,破解数独,解高考数学题,一句话写李白诗风,视觉理解和推理能力都逼近Gemini2.5 Pro闭源模型。 一个理由是,hi…
05/29 10:26
04/01 16:41
10/31 16:58