DeepSeek-V3：性价比之王的崛起性能媲美GPT-4o_产品中心

2025-02-19 产品中心

　　在人工智能模型的竞争中，一种新兴力量正逐渐获得市场的关注。近日，幻方量化正式公开宣布推出其最新的DeepSeek-V3模型，极具性价比的特性和强大的性能使其成为了业界的瞩目焦点。该模型在训练周期仅为两个月的情况下，便展现出与GPT-4o相媲美的能力，令人惊叹。

　　DeepSeek-V3是幻方量化自研的混合专家模型（MoE），在工程实现上进行了深度优化，模型参数数量达到6710亿，其中激活参数为370亿，经过14.8万亿token的预训练，生成速度比其前身DeepSeek-V2.5提升了三倍，每秒吞吐量高达60token。有必要注意一下的是，当前版本仍不支持多模态输入输出，但在自然语言处理和算法生成方面表现出色，特别是在数学问题的解答上，大幅超过了其他领先的开源和闭源模型。

　　探索DeepSeek-V3的核心技术，能够正常的看到其在训练成本上的显著优势。通过对算法、框架及硬件的协同优化，该模型的训练总成本仅为558万美元，相较于传统模型需要的数千万美元投入，显得很友好。根据幻方量化提供的多个方面数据显示，使用2048个H800 GPU训练只需3.7天，这一速度与所需的GPU资源相比，低至行业标准的11倍。前OpenAI技术大牛Andrej Karpathy对此也表示，达到相似性能常常要大约16000个GPU，而DeepSeek-V3凭借280万GPU小时的训练量，实现了质的飞跃。

　　在应用场景上，DeepSeek-V3不仅为开发者提供了强大的代码理解与生成工具，而且在多语言实时翻译、语音识别等方面也具备出色的能力，支持多达20种语言的处理。此外，集成的视觉理解技术更是让用户通过简单的文本描述生成高质量图像，极大丰富了创作的自由度。

　　针对API服务的定价，DeepSeek-V3的使用成本较前代模型有所上调，但仍就保持了极具竞争力的价格。新版本的API服务定价为每百万token输入2块钱，而输出为每百万token8元，合计的操作成本大约是10块钱。尽管价格有所提升，但与OPENAI的GPT-4o相比，DeepSeek-V3的性价比仍显得极为突出，后者高达20美元的费用使其在开发者心中形成了较高的使用门槛。

　　总结来看，DeepSeek-V3的发布标志着在AI领域性价比与性能的重大突破。预计将为开发者、企业与研究者提供新的动力与选择，促使AI服务普及化。未来，随着AI技术的持续不断的发展与创新，我们有理由相信，像DeepSeek-V3这样的模型将持续推动人工智能的应用与发展，带来更多可能性与机遇。在这一进程中，企业、开发者及用户要保持理性与开放的态度，积极探索AI工具的广泛应用。

　　解放周末！用AI写周报又被老板夸了！点击这里，一键生成周报总结，无脑直接抄 → →

[上一篇] 讯飞听见帮助听障人士“听见春晚”

[下一篇] 全球科学技术巨头发布新一代AI芯片引领人工智能新浪潮