今日阿里云宣布,通义实验室正式开源网络智能体WebSailor,该智能体凭借强大的推理与检索能力,在OpenAI发布的高难度智能体评测集BrowseComp上位列开源榜单首位。目前,其构建方案及部分数据集已在…
获悉,近日,阿里通义开源了网络智能体WebSailor,该智能体具备强大的推理和检索能力,在高难度智能体评测集BrowseComp上,WebSailor的成绩超越了DeepSeek R1、Gro…
为此,在构建数据集阶段,通义实验室大规模合成了具有高不确定性的复杂任务数据SailorFog-QA,并基于Qwen模型进行冷启动微调,让模型学到超越人类的复杂推理模式;该团队还提出了高效的强化学习算法 …
百度6月30日一次性开源10款文心大模型4.5模型。
据了解,飞桨是中国首个自主研发、功能丰富、开源开放的产业级深度平台,基于多年飞桨开源技术与生态系统积累,此次文心大模型4.5开源系列同步升级发布文心大模型开发套件ERNIEKit和大模型高效部署套件Fast…
Trae Agent是一个基于LLM通用软件工程任务的智能体。
AniSora支持一键生成多种动漫风格的视频镜头。
此次价格调整主要影响现有付费用户。
这是开源社区的通行做法,也符合开源协作的精神。
阿里通义实验室近期在音频技术领域取得了突破性进展,正式推出了名为ThinkSound的音频生成模型,并宣布将其开源。 为了训练ThinkSound模型,通义语音团队构建了首个支持链式推理的多模态音频数据集Au…
华为团队回应盘古开源AI模型抄袭争议:并非基于其他模型增量训练,已严格遵循开源许可
分析人士认为,平安在AI领域“深厚的垂直行业专长”与“强大的技术整合能力”,结合其金融、医疗等垂直领域的海量数据和应用场景,开发定制化的行业模型属于“AI+行业Know-How”模式,构筑了难以复制的竞争壁…
根据通义语音团队介绍,传统V2A技术常难以精确捕捉视觉与声音的时空关联,导致生成音频与画面关键事件错位。ThinkSound由一个多模态大语言模型(负责“思考”推理链)和一个统一音频生成模型(负责“输出”声…
他主导的Meta AI实验室以开放研究著称,公开发布代码和成果,推动行业技术共享。 近日,杨立昆在社交平台间接回应了Meta声势浩大的“挖人”操作,他觉得Meta起码比OpenAI有道德优势,因为“开源”。…
该模型支持视频内容结构化推理生成匹配音频。
性能媲美顶级开源编码模型。
10/31 16:58
10/31 16:56
10/31 16:55