中国AI初创DeepSeek颠覆硅谷巨头低成本高性能激发全球关注！_新闻中心

2025-02-13 新闻中心

　　近年来，人工智能（AI）技术快速地发展，成为科技界的焦点。而在全球AI领域的军备竞赛中，中国初创公司DeepSeek（深度求索）却以令人意想不到的方式闯入视野，打破了许多传统观念。在短短一个月内，DeepSeek连续推出了两款重磅级的AI模型——DeepSeek-V3和DeepSeek-R1，引发了全球技术界的热烈讨论和关注。

　　2023年1月20日，DeepSeek-R1模型的开源发布引发了AI评估网站ChatbotArena的注目。在综合排名中，DeepSeek-R1一举攀升至第三位，与另一个顶尖模型——GPT-4o并列。尤其在高难度提示词、代码及数学等技术领域，DeepSeek-R1更是以压倒性的优势夺得了榜首。

　　不止如此，另一家AI分析平台Artificial-Analysis的基准测试显示，DeepSeek-R1的分析质量指数位列全球第二，而其API定价仅为GPT-4o的三十分之一。这些惊人的数据让硅谷的许多科技巨头感到震惊，例如，ScaleAI的创始人Alexander Wang在1月24日的采访中坦言，DeepSeek的表现与美国最顶尖模型难分伯仲。

　　DeepSeek的崛起并非偶然，而是与其背后的强大技术上的支持紧密相关。DeepSeek成立于2023年7月17日，其根源来自于成立于2012年的对冲基金公司幻方量化，专注于量化投资和机器学习领域，管理着约80亿美元的资产。

　　公司团队80%以上毕业于全球顶尖高校，通过高频交易与机器学习策略，积累了丰富的实战经验。同时，幻方量化注重研发技术，投入12亿元建设了“萤火一号”和“萤火二号”深度学习平台，拥有超过1万张英伟达A100芯片的算力储备。这一雄厚的硬件基础为DeepSeek的开发和创新提供了强大后盾。

　　与行业惯常依赖大量算力的做法不同，DeepSeek的策略是注重提升训练效率。其团队大胆采用了稀疏的混合专家（Mixture of Experts, MoE）架构，在模型训练过程中仅激活5%至10%的专家网络单元，从而明显降低了计算资源的消耗。此外，DeepSeek还采用了FP8混合精度训练，优化了显存占用和计算能力，这些技术突破让DeepSeek在实现高性能的同时，保持了低成本。

　　简而言之，DeepSeek的策略更像是将一辆普通家用车进行性能改装，以更小的投入实现更优的表现。

　　DeepSeek的API服务价格也极具竞争力，每百万输入tokens的成本最低仅需0.5元（缓存命中）/2元（缓存未命中），每百万输出tokens则为8元，这些价格不仅远低于GPT-4o等著名模型，甚至使得其在市场中的表现尤为出色。2024年12月最后6天，仅DeepSeek的访问量就暴增了164%，达到1180万次。

　　2025年1月20日，DeepSeek再度发布新模型DeepSeek-R1，其核心突破在于采用一种全新的“纯”强化学习方法，抛弃了传统的预设思维链模板和监督式微调，单纯依靠简单的奖惩信号来优化模型的行为。在AIME数学竞赛中，R1-Zero的准确率从15.6%提升至71%，而当模型对同一问题进行多次尝试时，准确率甚至达到了惊人的86.7%！

　　这一系列技术创新不仅使DeepSeek在AI界实现了低成本、高性能的突破，更可能改变未来AI模型训练的基本规则。

　　DeepSeek的成功引发了投资的人对AI行业传统高额投资的质疑，尤其是在当前压榨算力资源的趋势下，DeepSeek的低成本高效能模式为未来AI训练提供了新思路。实际上，AI行业正面临范式的转变，全球AI大语言模型数量已达1328个，其中中国贡献了36%，成为全世界第二大AI技术贡献国。

　　诺贝尔奖得主、被称为“AI教父”的杰弗里·辛顿表示，中国在STEM教育方面的优势将为AI技术的发展打下良好的基础。随着AI技术慢慢的变多地被应用，关于技术壁垒的讨论也随之升温。加州大学伯克利分校的AI政策研究员Ritwik Gupta指出，DeepSeek的成功显示出“AI能力没有护城河”，尤其是中国庞大的系统工程师人才库，使得技术开发的效率得以提升。

　　DeepSeek-R1的技术突破无疑给长期资金市场带来了震动。在DeepSeek模型的快速崛起后，作为“AI石油”的英伟达股价在2025年1月24日下跌了3.12%。这种低成本、高性能的模型一旦成为主流，可能会彻底改变美国公司在AI领域的技术优势和估值体系。

　　考虑到AI市场的持续变化与竞争加剧，DeepSeek选择了开源模型并公开技术报告的创新策略，虽然赢得了开发者的喜爱，但也代表着他们的技术优势可能面临被快速模仿的风险。同时，由于DeepSeek团队的技术专长大多分布在在数学、代码等特定领域，未来在知识问答和长文本处理等多个应用场景的表现还有待观察。

　　不管怎样，DeepSeek的成就为我们展示了一条全新的AI发展道路，也让整个行业为之振奋。正如DeepSeek的崛起证明了，一个更具性价比的AI模型不仅是未来发展的方向，更是观察与挑战传统巨头的新契机。返回搜狐，查看更加多

[上一篇] ASIC与GPU共存共生：人工智能技术的新兴算力路径

[下一篇] 上海ai软件开发公司