大厂要流量,小龙要资本体量
LLM模型部署框架根据场景可分为四类:个人开发首选Ollama,支持量化模型一键部署;资源受限设备推荐llama.cpp,通过CPU优化实现极致轻量;企业高并发服务采用vLLM,其PagedAttentio…
总理座谈会上的年轻人,春节暴涨超千亿
三星、苹果也将推出AI眼镜相关产品
性能暴增价格不变。
诸神之战,不一而足。
到了大模型时代,真正决定应用爆发速度的,也不会是模型规模,更可能是每一次推理被调用的成本。
Qwen3.5效能再跃迁,每百万Token低至0.8元
阿里除夕夜甩出王炸!千问Qwen3.5重磅发布 登顶全球最强开源模型
它采用了全新的混合注意力机制(Hybrid Attention),将线性注意力与标准注意力相结合,从而在保持强大推理能力的同时,大幅提升了长文本和复杂任务的处理效率。行业分析人士认为,阿里选择在除夕夜这一关键…
字节跳动于2月12日发布新一代视频创作模型Seedance 2.0
屏幕里的两个“贾樟柯”
对于字节乃至整个行业而言,AI就是这个时代必须攀登的高峰
中国AI圈集体抛弃OpenAI。
豆包2.0的跨代升级,标志着字节正式进入“原生多模态Agent”时代
重新画起跑线
10/31 16:58
10/31 16:56
10/31 16:55