《科创板日报》17日讯,《科创板日报》记者独家获悉,京东团队即将开源视觉语言实时交互模型JoyAI-VL-Interaction。记者从一份在开源社区和海外AI技术圈受到关注的技术报告获悉,JoyAI-VL-Interaction把多模态大模型从一问一答,推进到实时流式交互,适合需要AI持续在场的场景。报告将JoyAI-VL-Interaction与豆包、Gemini 的App内视频通话助手进行了人工评测,覆盖监控预警、实时计数、实时翻译、时间感知、直播解说和引导、长程记忆六类场景。在58个案例中,JoyAI-VL-Interaction对豆包的总体胜率为77.6%,对Gemini的总体胜率为87.9%。其中,在监控预警场景中,对两个基线均取得100%胜率。
京东即将开源视觉语言实时交互模型
IP属地 中国·北京
编辑:刘敏 财联社 时间:2026-06-17 10:05:14
免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
全站最新
热门推荐
- AI移花接木造谣“地铁塌顶”,一女子博流量被依法拘留
- Adobe发布创作者报告:超八成受访者称AI加速粉丝与业务增长
- WordPress VIP发布AI生存报告:超八成消费者不完全信任AI生成内容,42%因缺乏出处降低信任度
- SpaceX将以600亿美元估值全股票收购Cursor,交易预计2026年Q3完成
- 大厂网盘变天?腾讯悄然上线“AI原生网盘”打破传统
- Sensor Tower:ChatGPT全球份额跌破50%,Gemini与Claude加速追赶
- 消息称豆包日活超2亿但收入不足百万,字节AI资源或向企业端倾斜
- 被美国政府点名“太危险”,Anthropic 企业销量反而反超 OpenAI
- 马来西亚AI客聊系统Respond.io获6250万美元B轮融资,ARR达3500万美元
- 微软Copilot Cowork拟转向按量计费,或引入Azure托管版DeepSeek V4
- 蚂蚁数科发布Agentar金融行业智能体专家团 覆盖十大金融核心岗位
- 防止AI依赖风险升级:苹果拟在Siri中加入“休息一下”提示机制
- 针对「幽灵外卖」,美团、淘宝闪购、京东被集中约谈
- 华硕上架新款破晓7S锐龙版:AI 5 330 + 16G + 1T售6999元
- 亚马逊(AMZN.US)“现金奶牛”业务再遭监管狙击:传FTC拟指控广告拍卖“隐藏底价”,或重罚数十亿美元




京公网安备 11011402013531号