国产开源模型DeepSeek-V3发布代码能力媲美Claude性能超越顶尖模型

DeepSeek-V3 全新系列模型现已正式上线并全面开源，用户可通过官网 chat.deepseek.com 体验最新版 V3 模型的强大功能。API 服务同步更新，接口配置无需任何调整，确保无缝衔接。值得注意的是，当前版本暂不支持多模态输入输出，但已展现出卓越的性能表现。

性能对齐海外顶尖闭源模型
DeepSeek-V3 是我们自主研发的 MoE 模型，拥有 671B 参数规模，激活参数达 37B，在 14.8T token 上完成预训练。其性能表现已达到国际领先水平，与 GPT-4o 及 Claude-3.5-Sonnet 等闭源模型不相上下。详细技术论文请参考：https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf

国产开源模型DeepSeek-V3发布代码能力媲美Claude性能超越顶尖模型

多项评测成绩超越主流开源模型
在各类权威评测中，DeepSeek-V3 多项指标超越 Qwen2.5-72B 和 Llama-3.1-405B 等开源模型，尤其在知识类任务（MMLU, MMLU-Pro, GPQA, SimpleQA）上表现突出，显著优于前代 DeepSeek-V2.5，接近 Claude-3.5-Sonnet-1022 的顶尖水平。

国产开源模型DeepSeek-V3发布代码能力媲美Claude性能超越顶尖模型

长文本处理能力突出
在 DROP、FRAMES 和 LongBench v2 等长文本测评中，DeepSeek-V3 均展现出超越其他模型的平均表现，为长文本理解与生成提供强大支持。

国产开源模型DeepSeek-V3发布代码能力媲美Claude性能超越顶尖模型

代码能力全面领先
在算法类代码场景（Codeforces）中，DeepSeek-V3 远超市面上所有非 o1 类模型；在工程类代码场景（SWE-Bench Verified）中，其表现已逼近 Claude-3.5-Sonnet-1022。

国产开源模型DeepSeek-V3发布代码能力媲美Claude性能超越顶尖模型

数学能力大幅提升
在美国数学竞赛（AIME 2024, MATH）和全国高中数学联赛（CNMO 2024）等数学测评中，DeepSeek-V3 大幅领先于所有开源闭源模型，展现出卓越的逻辑推理能力。

国产开源模型DeepSeek-V3发布代码能力媲美Claude性能超越顶尖模型

中文能力表现优异
在教育类测评 C-Eval 和代词消歧等评测集上，DeepSeek-V3 与 Qwen2.5-72B 表现相近；在事实知识 C-SimpleQA 上则更为领先，充分彰显中文理解与生成优势。

国产开源模型DeepSeek-V3发布代码能力媲美Claude性能超越顶尖模型

生成速度提升至 3 倍
通过算法与工程创新，DeepSeek-V3 的生成吞吐量从 20 TPS 大幅提升至 60 TPS，较 V2.5 模型实现 3 倍性能飞跃，为用户带来更流畅高效的使用体验。

API 服务价格调整
为匹配 V3 模型的卓越性能，API 服务定价将调整为：每百万输入 tokens 0.5 元（缓存命中）/ 2 元（缓存未命中），每百万输出 tokens 8 元。同时推出 45 天优惠体验期：即日起至 2025 年 2 月 8 日，DeepSeek-V3 API 服务价格将维持在每百万输入 tokens 0.1 元（缓存命中）/ 1 元（缓存未命中），每百万输出 tokens 2 元，新老用户均可享受。

开源权重与本地部署支持
DeepSeek-V3 采用 FP8 训练并开源原生 FP8 权重，SGLang、LMDeploy 等框架第一时间支持原生 FP8 推理，TensorRT-LLM、MindIE 实现 BF16 推理。我们还提供 FP8 到 BF16 的转换脚本，方便社区适配与拓展。模型权重下载及本地部署详情：https://huggingface.co/deepseek-ai/DeepSeek-V3-Base

秉持开源精神与长期主义
“以开源精神和长期主义追求普惠 AGI”是 DeepSeek 的核心理念。我们欣喜地与社区分享模型预训练的阶段性成果，见证开源模型与闭源模型能力差距的持续缩小。未来，我们将基于 DeepSeek-V3 打造深度思考、多模态等更丰富功能，并持续与社区分享最新探索成果，共同推动 AI 技术进步。

文章网址：https://www.wpbull.com/ai/1008.html