国产开源模型DeepSeek-V3发布 代码能力媲美Claude性能超越顶尖模型

DeepSeek-V3 全新系列模型现已正式上线并全面开源,用户可通过官网 chat.deepseek.com 体验最新版 V3 模型的强大功能。API 服务同步更新,接口配置无需任何调整,确保无缝衔接。值得注意的是,当前版本暂不支持多模态输入输出,但已展现出卓越的性能表现。

国产开源模型DeepSeek-V3发布 代码能力媲美Claude性能超越顶尖模型

性能对齐海外顶尖闭源模型
DeepSeek-V3 是我们自主研发的 MoE 模型,拥有 671B 参数规模,激活参数达 37B,在 14.8T token 上完成预训练。其性能表现已达到国际领先水平,与 GPT-4o 及 Claude-3.5-Sonnet 等闭源模型不相上下。详细技术论文请参考:https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf

国产开源模型DeepSeek-V3发布 代码能力媲美Claude性能超越顶尖模型

多项评测成绩超越主流开源模型
在各类权威评测中,DeepSeek-V3 多项指标超越 Qwen2.5-72B 和 Llama-3.1-405B 等开源模型,尤其在知识类任务(MMLU, MMLU-Pro, GPQA, SimpleQA)上表现突出,显著优于前代 DeepSeek-V2.5,接近 Claude-3.5-Sonnet-1022 的顶尖水平。

国产开源模型DeepSeek-V3发布 代码能力媲美Claude性能超越顶尖模型

长文本处理能力突出
在 DROP、FRAMES 和 LongBench v2 等长文本测评中,DeepSeek-V3 均展现出超越其他模型的平均表现,为长文本理解与生成提供强大支持。

国产开源模型DeepSeek-V3发布 代码能力媲美Claude性能超越顶尖模型

代码能力全面领先
在算法类代码场景(Codeforces)中,DeepSeek-V3 远超市面上所有非 o1 类模型;在工程类代码场景(SWE-Bench Verified)中,其表现已逼近 Claude-3.5-Sonnet-1022。

国产开源模型DeepSeek-V3发布 代码能力媲美Claude性能超越顶尖模型

数学能力大幅提升
在美国数学竞赛(AIME 2024, MATH)和全国高中数学联赛(CNMO 2024)等数学测评中,DeepSeek-V3 大幅领先于所有开源闭源模型,展现出卓越的逻辑推理能力。

国产开源模型DeepSeek-V3发布 代码能力媲美Claude性能超越顶尖模型

中文能力表现优异
在教育类测评 C-Eval 和代词消歧等评测集上,DeepSeek-V3 与 Qwen2.5-72B 表现相近;在事实知识 C-SimpleQA 上则更为领先,充分彰显中文理解与生成优势。

国产开源模型DeepSeek-V3发布 代码能力媲美Claude性能超越顶尖模型

生成速度提升至 3 倍
通过算法与工程创新,DeepSeek-V3 的生成吞吐量从 20 TPS 大幅提升至 60 TPS,较 V2.5 模型实现 3 倍性能飞跃,为用户带来更流畅高效的使用体验。

API 服务价格调整
为匹配 V3 模型的卓越性能,API 服务定价将调整为:每百万输入 tokens 0.5 元(缓存命中)/ 2 元(缓存未命中),每百万输出 tokens 8 元。同时推出 45 天优惠体验期:即日起至 2025 年 2 月 8 日,DeepSeek-V3 API 服务价格将维持在每百万输入 tokens 0.1 元(缓存命中)/ 1 元(缓存未命中),每百万输出 tokens 2 元,新老用户均可享受。

开源权重与本地部署支持
DeepSeek-V3 采用 FP8 训练并开源原生 FP8 权重,SGLang、LMDeploy 等框架第一时间支持原生 FP8 推理,TensorRT-LLM、MindIE 实现 BF16 推理。我们还提供 FP8 到 BF16 的转换脚本,方便社区适配与拓展。模型权重下载及本地部署详情:https://huggingface.co/deepseek-ai/DeepSeek-V3-Base

秉持开源精神与长期主义
“以开源精神和长期主义追求普惠 AGI”是 DeepSeek 的核心理念。我们欣喜地与社区分享模型预训练的阶段性成果,见证开源模型与闭源模型能力差距的持续缩小。未来,我们将基于 DeepSeek-V3 打造深度思考、多模态等更丰富功能,并持续与社区分享最新探索成果,共同推动 AI 技术进步。

文章网址:https://www.wpbull.com/ai/1008.html