据《科创板日报》消息,DeepSeek 即将于下周发布其最新的大型模型 ——V4。这款新模型备受期待,具备图像、视频和文本生成功能,标志着 DeepSeek 在多模态技术上的又一次飞跃。
据知情人士透露,DeepSeek V4 在硬件适配上将全面支持国产算力,目的是优化与中国制造芯片的兼容性。这不仅有望提升中国市场对其半导体产品的需求,还能加速 AI 模型在推理阶段与本土芯片的融合。
在 V4 发布的同时,DeepSeek 还计划推出一份简短的技术说明,预计一个月后会有更详尽的技术报告。这一系列动作显示了 DeepSeek 在技术透明度和市场反应上的决心。
目前,DeepSeek 的 “V4 Lite” 测试版本也正在进行中。这一版本被称为 “sealion-lite”,具有 100 万 tokens 的上下文窗口,相较于 V3 系列的 128K 提升了近 8 倍,理论上能够一次性处理《三体》全集的文本量。值得注意的是,V4 Lite 是原生多模态架构,意味着它在预训练阶段就将文本和视觉理解相结合,而非后期拼接。
从参数规模来看,V4 Lite 预计有 2000 亿参数,而完整的 V4 版本参数可能会突破 1 万亿。此外,V4 Lite 在生成 SVG 图像的能力上也表现出色,使用极简代码(仅 54 行)即可生成高质量图像,显示出其在空间推理和结构化输出方面的提升。
回顾 DeepSeek 的发展历程,该公司自 2023 年以来在推理能力和模型效率上不断创新。自 2024 年发布 V2 以来,DeepSeek 不断追求综合性能与推理效率的平衡。到 2025 年,DeepSeek 推出的 V3 系列不仅确立了强大的综合性能基础,更通过持续的小版本更新提升了用户体验。
总的来看,DeepSeek 在等待 V4 发布的同时,始终在技术革新和多模态能力的布局上不遗余力。这无疑将为 AI 领域带来新的活力与可能性。





京公网安备 11011402013531号