DeepSeek有两个特点:第一个特点是它投资额比较少,但性能和ChatGPT-5很接近,这颠覆了美国大模型要用很多芯片、花很多钱的模式;第二个特点就是DeepSeek通过蒸馏技术,实现了投资少、性能优的效果…
一位开发者分享了其部署Qwen3.5-35B-A3B的情况,称模型可以跑在16GB的显存机器上,处理32k上下文时,每秒处理数能达到60-70个任务;但他也提到,模型吞token的速度惊人,一个短谜题就用了…
有群打工人,用AI克隆了老板
截至目前,宝马集团在沈阳生产基地的累计投资已超过1200亿元。
10/31 16:58
10/31 16:56
10/31 16:55