AI前瞻7月8日报道,昨日,阿里巴巴通义实验室正式开源其最新网络智能体WebSailor,该智能体在多个高难度任务评测中刷新了开源系统的最好成绩,成为首个在BrowseComp等基准上逼近闭源系统能力…
HumanOmniV2通过引入强制上下文总结机制、大模型驱动的多维度奖励体系,以及基于GRPO的优化训练方法,实现了对多模态信息的全面理解,使得模型不会错过图像、视频、音频中的隐藏信息,一定程度上规避其在全…
今日阿里云宣布,通义实验室正式开源网络智能体WebSailor,该智能体凭借强大的推理与检索能力,在OpenAI发布的高难度智能体评测集BrowseComp上位列开源榜单首位。目前,其构建方案及部分数据集已在…
获悉,近日,阿里通义开源了网络智能体WebSailor,该智能体具备强大的推理和检索能力,在高难度智能体评测集BrowseComp上,WebSailor的成绩超越了DeepSeek R1、Gro…
为此,在构建数据集阶段,通义实验室大规模合成了具有高不确定性的复杂任务数据SailorFog-QA,并基于Qwen模型进行冷启动微调,让模型学到超越人类的复杂推理模式;该团队还提出了高效的强化学习算法 …
百度6月30日一次性开源10款文心大模型4.5模型。
据了解,飞桨是中国首个自主研发、功能丰富、开源开放的产业级深度平台,基于多年飞桨开源技术与生态系统积累,此次文心大模型4.5开源系列同步升级发布文心大模型开发套件ERNIEKit和大模型高效部署套件Fast…
Trae Agent是一个基于LLM通用软件工程任务的智能体。
AniSora支持一键生成多种动漫风格的视频镜头。
此次价格调整主要影响现有付费用户。
这是开源社区的通行做法,也符合开源协作的精神。
阿里通义实验室近期在音频技术领域取得了突破性进展,正式推出了名为ThinkSound的音频生成模型,并宣布将其开源。 为了训练ThinkSound模型,通义语音团队构建了首个支持链式推理的多模态音频数据集Au…
华为团队回应盘古开源AI模型抄袭争议:并非基于其他模型增量训练,已严格遵循开源许可
分析人士认为,平安在AI领域“深厚的垂直行业专长”与“强大的技术整合能力”,结合其金融、医疗等垂直领域的海量数据和应用场景,开发定制化的行业模型属于“AI+行业Know-How”模式,构筑了难以复制的竞争壁…
根据通义语音团队介绍,传统V2A技术常难以精确捕捉视觉与声音的时空关联,导致生成音频与画面关键事件错位。ThinkSound由一个多模态大语言模型(负责“思考”推理链)和一个统一音频生成模型(负责“输出”声…
07/09 12:20
07/09 12:19
07/09 12:18