登顶全球应用市场下载榜，DeepSeek为何如此爆火？

出品｜派财经原创

文｜小玖

今年以来DeepSeek横空出世震撼了投资圈和资本市场。

2月21日，DeepSeek在社交平台X发文称，构建了一支探索AGI（通用人工智能）小团队，从下周起将开源5个代码库，以完全透明的方式分享研究进展。

前日，DeepSeek刚刚否认了对外融资为不实消息，此前，曾有外媒报道称据DeepSeek首次考虑进行外部融资，以应对不断增长的算力需求。早在2月初，就有消息称阿里巴巴拟以100亿美元估值投资DeepSeek，认购10%股权，但随后阿里副总裁颜乔在社交媒体平台辟谣称网传消息不实。

事实上，今年以来，已有多家头部企业、投资机构与DeepSeek取得接洽。不过，DeepSeek背后有着强大的资金支持，并不缺钱。

DeepSeek到底有多强？谁在DeepSeek中受益了？

1、DeepSeek有多强？

今年春节期间，Deepseek发布了开源模型DeepSeek-R1，以强大的推理能力和极高性价比快速横扫全球，一经发布引发业内外广泛关注。

Deepseek有多火？在苹果App Store上，Deepseek在中国区应用商店免费榜排名第一，还在美国地区超越了ChatGPT、Meta旗下社交媒体平台Threads、Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品，飙升至第一位。据统计，Deepseek还在在全球140个市场的应用商店下载榜上强势夺冠，成为了全球用户追捧的对象。‌这一排名背后，是用户市场对Deepseek的高度认可，也是其在全球人工智能市场上迅速崛起并获得了一席之地的铁证。

在DeepSeek之前，令全球AI行业为之震撼的还是由Open AI开发的ChatGPT。从2024年9月OpenAI发布o1-preview到现在，在市场上掀起了大规模追赶，可以与之性能相媲美甚至在其之上的推理模型层出不穷。

而DeepSeek之所以能杀出重围，主要原因在于其不仅率先达到了Open AI – o1模型的效果，更是将推理模型的成本压缩到了极低。

具体来说，DeepSeek-R1的技术突破在于，用纯深度学习的方法让AI自发涌现出推理能力。据DeepSeek官网介绍，DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有很少标注数据的情况下极大提升了模型的推理能力，在数学、代码、自然语言推理等任务上，测评性能与美国开放人工智能研究中心（OpenAI）开发的GPT-o1模型正式版接近，o1模型首次实现真正的通用推理能力，能在“博士级别”的科学问答环节上超越人类专家。

DeepSeek R1有多强？有测试者以常用的碰撞检测来验证，要求大模型编写一个程序，使得一颗小球在某个缓慢旋转的几何形状内弹跳，并保持小球停留在形状内，碰撞检测对于模型的推理能力考验巨大，稍有不慎便会导致出现肉眼可见的物流错误。而测试结果表面，R1的表现要明显优于OpenAI o1pro模式。

除了性能强大外，R1的另一大优势在于超高性价比。据了解，DeepSeek-R1模型训练成本仅为560万美元，这一数值要远低于美国一众科技巨头公司在人工智能技术上高达数亿甚至数十亿美元的投入，比如ChatGPT-4的训练成本就高达超1亿美元。另据技术报告显示，R1面向开发者的服务定价为每百万token（输入字符串）1—4元，仅为o1的1/30左右。

DeepSeek创始人梁文峰曾在媒体采访时表示，无论是API还是AI都应该是普惠的、人人可以用得起的东西。

值得一提是，DeepSeek采用了完全开源策略，一方面降低了用户的使用门槛，另一方面开源之后的DeepSeek吸引了不少开发者和研究人员的关注，进一步促进了AI开发者社区的协作生态繁荣，推动了AI技术的发展。

此前OpenAI 也曾表达了希望以最有可能造福全人类的方式推进数字智能发展，而不受产生财务回报需求的限制。但OpenAI的开源策略只坚持到了GPT-3发布之前，GPT-4发布之后更是隐藏了其训练数据和模型权重，逐步走向闭合。

英伟达高级研究科学家JimFan在其个人社交平台表示，“我们正身处这样一个历史时刻：一家非美国公司正在延续OpenAI最初使命——通过真正开放的前沿研究赋能全人类。

DeepSeek这股“神秘的东方力量”，让二级市场开始对美国科技行业的竞争力产生质疑，受此冲击，美国芯片巨头英伟达股价暴跌17%。

DeepSeek的母公司深度求索成立于2023年7月17日，由著名量化私募幻方基金支持，资金实力雄厚，这也为其不以盈利为目的持续深挖技术提供了坚实支持。

早在2024年5月7日，深度求索发布的DeepSeek-V2，也采用了开源模式，一经发布成为开源模型中中文综合能力（AlignBench）最强的代表，并在测评中与 GPT-4-Turbo，文心 4.0 等闭源模型被列入同一梯队；英文综合能力（MT-Bench）与最强的开源模型 LLaMA3-70B 处于同一梯队，超过最强 MoE 开源模型 Mixtral8x22B；知识、数学、推理、编程等榜单结果位居前列。

另外，其API价格只有 GPT-4o 的 2.7%，进一步激化了国内大模型价格战，在此后一周，字节、阿里、百度、腾讯先后宣布降价。

2024年底，DeepSeek-V3发布，在知识类任务、长文本理解、编程和数学运算等领域，其性能接近甚至超越了国际顶尖的闭源模型如GPT-4o和Claude-3.5-Sonnet。

DeepSeek的入局直接在全球AI领域掀起了一股连锁反应，放眼全球市场，微软、英伟达、亚马逊等云计算平台纷纷接入DeepSeek，更是变相刺激OpenAI上线了 OpenAI o3-mini 系列模型，面向用户首次开放了推理模型的使用权限。

2、谁接入了DeepSeek？

DeepSeek浪潮下，据不完全统计，当前已有超过200家企业宣布接入DeepSeek，覆盖基础电信企业、云计算、芯片、金融、汽车、手机等多领域。其中，包括华为、阿里、百度、腾讯、京东等在内的多家云平台宣布接入DeepSeek大模型，约20家车企宣布在智舱场景或AI运营领域完成与DeepSeek的深度融合。此外，多家券商、银行、公募基金也表示已接入DeepSeek大模型。

事实上，国内大厂此前已经在自研AI大模型战略上均有所布局，自家主力APP接入第三方大模型服务，可以看做是国内大厂的一次战略转变，也是对企业未来的押注。

腾讯在最近一次灰度测试中上线了基于DeepSeek-R1的“AI搜索”功能，被看做是其积极拥抱AI的策略，紧接着又在腾讯地图、 QQ音乐、腾讯文档等产品均快速接入了DeepSeek。

紧接着百度搜索也跟进了DeepSeek，在宣布接入DeepSeek前，百度已经改变了大模型发展路线，先是宣布全部免费使用，接着改变闭源策略，开始拥抱开源路线，称将推出文心大模型4.5系列，走向开源。

当前几家互联网大厂中，字节对于拥抱接入DeepSeek的态度较为谨慎，当前在业务侧只有飞书官宣上线了DeepSeek系列模型，但入口也比较隐藏。

值得肯定的是，DeepSeek的开源生态极大加速了AI场景落地进程，推动AI行业从硬件设施向软件应用层的进一步转变。大厂云服务率先接入了DeepSeek，就是源于DeepSeek带来的空前热度和极低成本优势，有望成为打破市场价格战的突破口，进一步巩固现有市场地位。

DeepSeek有多强？随着DeepSeek的爆火，大批流量涌入，伴随着一些黑客攻击，DeepSeek官网时不时会卡顿。

相较于市面上其他大模型语言产品，DeepSeek在用户端的区别是，展现了详尽的思考过程。

如何使用好AI大模型，让其成为有效提升工作效率的工具，也是一门学问。细心网友已经总结出了一套规律，成为AI们的领导，就会和真的领导一样面临着一些用人的困境。

一个聪明但是不干活的deepseek，一个愚蠢但是很勤劳的豆包，一个中等但是不给你情绪价值的kimi和一个海外留学我请不起的chatGPT。

亦有网友细心总结称，需要利用一些管理才能。先用聪明的deepseek制定策略（只能回答1次，需珍惜机会），再用勤劳的豆包填充内容（能输出无数次，无限使用），kimi可以用于赛马，把kimi和豆包的方案对比取优，涉及海外的信息可以再用chatGPT查一遍。

但值得注意的是，这些AI都会欺骗你，如果你不认真分辨分分钟被忽悠。

3、落地到应用层面，DeepSeek的暴利与隐忧