在训练集上,OpenAI 在一个主要是英文的文本数据集上训练了两款模型,重点关注 STEM、编程和常识类内容,并使用一个比 o4-mini 和GPT‑4o 所使用更为广泛的分词器(tokenizer)对数…
钛媒体App 8月6日消息,亚马逊云科技宣布,OpenAI的开源模型首次可通过Amazon Bedrock和Amazon SageMaker AI访问,帮助客户快速构建生成式AI应用。OpenAI最新发布两款…
让模型自信的深度思考。
德国正考虑在政府工作中放弃微软软件,转而采用开源替代方案。
当一家公司在短短4年内估值从零飙升至1700亿美元,它到底做对了什么?
本次升级包含以下主要变化:混合推理架构:一个模型同时支持思考模式与非思考模式;更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;更强的Agen…
总言,Thyme 通过赋予模型“代码生成与执行”的能力,极大地扩展了多模态模型的工具使用范围和自主决策水平,并在近 20 个基准测试中取得了显著且稳定的性能提升,尤其在处理高分辨率图像和复杂推理任务上表现出…
智东西8月21日报道,今天,字节跳动Seed团队开源了Seed-OSS系列模型,这些模型专为长上下文、推理、Agent和通用场景设计,将上下文窗口扩展至512k,是业界常见上下文窗口(128k)的4倍,GP…
代码能力超强。
Qwen2.5,这位文本领域的佼佼者,在数学推理、代码生成、多语言理解等关键赛道上,与国际顶尖模型GPT-4、Llama 3并驾齐驱,甚至在MMLU基准测试中,以87.3%的准确率逼近GPT-4的88.1%,…
奥尔特曼在访谈中深刻指出,美国对于中国在人工智能领域的快速发展存在低估,尤其是下一代AI技术方面。奥尔特曼特别提到了几个来自中国的AI模型,如DeepSeek和Kimi K2,他认为这些模型给OpenAI带…
这一举措不仅彰显了中国科技企业在AI底层技术上的突破能力,更通过开源生态的构建,为全球AI社区注入了新的活力。国际权威机构IDC在报告中指出,Qwen系列的性能与开源策略,使中国在AI基础模型领域首次形成对西…
07/09 12:23
07/09 12:22
07/09 12:21
07/09 12:20