7月22日,阿里云通义千问Qwen大模型官方账号公布对旗舰版Qwen3模型进行了更新,推出Qwen3-235B-A22B-FP8非思考模式(Non-thinking)的更新版本,命名为Qwen3-235B-A…
Qwen3新模型已在魔搭社区和HuggingFace上开源更新。
为了提供更为准确、公平的评估,微软亚洲研究院推出了MMLU-CF,它是基于公开数据源,经过去污染设计的大语言模型理解基准,并已在Huggingface上开放。 对于MMLU-CF,研究人员在数据收集时应用了…
一流的公司靠“栈”文化,二流的公司靠创始人文化。
05/29 10:26
04/01 16:41
10/31 16:58