< 中国AI初创DeepSeek颠覆硅谷巨头低成本高性能激发全球关注!_新闻中心_华体育app官网登录|华体会手机版
2025-02-13 新闻中心

  近年来,人工智能(AI)技术快速地发展,成为科技界的焦点。而在全球AI领域的军备竞赛中,中国初创公司DeepSeek(深度求索)却以令人意想不到的方式闯入视野,打破了许多传统观念。在短短一个月内,DeepSeek连续推出了两款重磅级的AI模型——DeepSeek-V3和DeepSeek-R1,引发了全球技术界的热烈讨论和关注。

  2023年1月20日,DeepSeek-R1模型的开源发布引发了AI评估网站ChatbotArena的注目。在综合排名中,DeepSeek-R1一举攀升至第三位,与另一个顶尖模型——GPT-4o并列。尤其在高难度提示词、代码及数学等技术领域,DeepSeek-R1更是以压倒性的优势夺得了榜首。

  不止如此,另一家AI分析平台Artificial-Analysis的基准测试显示,DeepSeek-R1的分析质量指数位列全球第二,而其API定价仅为GPT-4o的三十分之一。这些惊人的数据让硅谷的许多科技巨头感到震惊,例如,ScaleAI的创始人Alexander Wang在1月24日的采访中坦言,DeepSeek的表现与美国最顶尖模型难分伯仲。

  DeepSeek的崛起并非偶然,而是与其背后的强大技术上的支持紧密相关。DeepSeek成立于2023年7月17日,其根源来自于成立于2012年的对冲基金公司幻方量化,专注于量化投资和机器学习领域,管理着约80亿美元的资产。

  公司团队80%以上毕业于全球顶尖高校,通过高频交易与机器学习策略,积累了丰富的实战经验。同时,幻方量化注重研发技术,投入12亿元建设了“萤火一号”和“萤火二号”深度学习平台,拥有超过1万张英伟达A100芯片的算力储备。这一雄厚的硬件基础为DeepSeek的开发和创新提供了强大后盾。

  与行业惯常依赖大量算力的做法不同,DeepSeek的策略是注重提升训练效率。其团队大胆采用了稀疏的混合专家(Mixture of Experts, MoE)架构,在模型训练过程中仅激活5%至10%的专家网络单元,从而明显降低了计算资源的消耗。此外,DeepSeek还采用了FP8混合精度训练,优化了显存占用和计算能力,这些技术突破让DeepSeek在实现高性能的同时,保持了低成本。

  简而言之,DeepSeek的策略更像是将一辆普通家用车进行性能改装,以更小的投入实现更优的表现。

  DeepSeek的API服务价格也极具竞争力,每百万输入tokens的成本最低仅需0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens则为8元,这些价格不仅远低于GPT-4o等著名模型,甚至使得其在市场中的表现尤为出色。2024年12月最后6天,仅DeepSeek的访问量就暴增了164%,达到1180万次。

  2025年1月20日,DeepSeek再度发布新模型DeepSeek-R1,其核心突破在于采用一种全新的“纯”强化学习方法,抛弃了传统的预设思维链模板和监督式微调,单纯依靠简单的奖惩信号来优化模型的行为。在AIME数学竞赛中,R1-Zero的准确率从15.6%提升至71%,而当模型对同一问题进行多次尝试时,准确率甚至达到了惊人的86.7%!

  这一系列技术创新不仅使DeepSeek在AI界实现了低成本、高性能的突破,更可能改变未来AI模型训练的基本规则。

  DeepSeek的成功引发了投资的人对AI行业传统高额投资的质疑,尤其是在当前压榨算力资源的趋势下,DeepSeek的低成本高效能模式为未来AI训练提供了新思路。实际上,AI行业正面临范式的转变,全球AI大语言模型数量已达1328个,其中中国贡献了36%,成为全世界第二大AI技术贡献国。

  诺贝尔奖得主、被称为“AI教父”的杰弗里·辛顿表示,中国在STEM教育方面的优势将为AI技术的发展打下良好的基础。随着AI技术慢慢的变多地被应用,关于技术壁垒的讨论也随之升温。加州大学伯克利分校的AI政策研究员Ritwik Gupta指出,DeepSeek的成功显示出“AI能力没有护城河”,尤其是中国庞大的系统工程师人才库,使得技术开发的效率得以提升。

  DeepSeek-R1的技术突破无疑给长期资金市场带来了震动。在DeepSeek模型的快速崛起后,作为“AI石油”的英伟达股价在2025年1月24日下跌了3.12%。这种低成本、高性能的模型一旦成为主流,可能会彻底改变美国公司在AI领域的技术优势和估值体系。

  考虑到AI市场的持续变化与竞争加剧,DeepSeek选择了开源模型并公开技术报告的创新策略,虽然赢得了开发者的喜爱,但也代表着他们的技术优势可能面临被快速模仿的风险。同时,由于DeepSeek团队的技术专长大多分布在在数学、代码等特定领域,未来在知识问答和长文本处理等多个应用场景的表现还有待观察。

  不管怎样,DeepSeek的成就为我们展示了一条全新的AI发展道路,也让整个行业为之振奋。正如DeepSeek的崛起证明了,一个更具性价比的AI模型不仅是未来发展的方向,更是观察与挑战传统巨头的新契机。返回搜狐,查看更加多

CONTACT US
欢迎随时与我们联系