从大模型应用角度出发,面对单点算力/显存的天花板,构建大规模Scale Up 系统,通过并行计算技术(如专家并行、张量并行)将模型权重与KV Cache拆分到多个AI芯片上协同工作,在赵帅看来,这种路径是解…
07/09 12:23
07/09 12:22
07/09 12:21
07/09 12:20