2025 年 1 月开源生态数据洞察报告
OpenRank 指标是对工信部电子标准院的“信息技术 开源治理”系列标准中评价指标的开源实现,能够有效反映开源项目在开发者中的协作影响力,从而帮助我们了解开源世界,发现开源趋势,洞察开源事件。
DeepSeek 的全球影响力:中美印开发者共舞,开创AI新时代
2025 年 1 月 20 日,中国人工智能公司 DeepSeek 发布的 R1 系列大模型引发全球 AI 行业震动。该模型以低成本、高性能和开源特性为核心,该事件不仅在短期内对美国金融市场造成了巨大冲击,同时对大模型发展的技术路线、行业格局及地缘政治将产生深远影响。因此本期洞察报告将从 DeepSeek 的全系列模型切入,进行一次较完整的专栏式数据解析。
总体数据
2025 年 1 月 20 日 DeepSeek 发布 R1 推理模型,同日 GitHub 仓库开源,后续 1 月 28 日发布 Janus Pro 多模态大模型,这两个模型以其低成本高性能引爆全球。自 R1 模型发布以来,截止到 2 月 6 日,DeepSeek 官方 GitHub 组织获得新增 Star 数总计超 15 万,活跃开发者数量 1679 人。DeepSeek 组织有 5 个仓库在 2025 年 1 月进入中国 OpenRank 仓库榜 Top 300,DeepSeek-R1 仅开源 10 天强势空降至中国第 62 位。DeepSeek 在 OpenRank 企业榜单中在 2025 年 1 月达到 207 分,快速上升至全球第 86 位以及中国第 13 位。

# | 企业 | OpenRank | 活跃仓库数 | 活跃开发者数 |
---|---|---|---|---|
1 | ![]() | 10416.91 | 3005 | 4782 |
2 | ![]() | 1822.95 | 1410 | 2026 |
3 | ![]() | 1329.97 | 542 | 1671 |
4 | ![]() | 1119.37 | 192 | 978 |
5 | ![]() | 684.21 | 371 | 1112 |
6 | ![]() | 529.56 | 168 | 868 |
7 | ![]() | 476.51 | 237 | 687 |
8 | ![]() | 424.47 | 49 | 555 |
9 | ![]() | 423.89 | 76 | 252 |
10 | ![]() | 419.89 | 57 | 348 |
11 | ![]() | 294.02 | 44 | 241 |
12 | ![]() | 215.46 | 11 | 160 |
13 | ![]() | 207.45 | 16 | 1386 |
14 | ![]() | 204.37 | 117 | 118 |
15 | ![]() | 162.04 | 122 | 83 |
Star 增长情况
下图给出了截止 2 月 6 日 DeepSeek 的 GitHub 账号下 Star 增长最快的 5 个仓库的 Star 每日变化情况。可以看到,在 20 日 DeepSeek-R1 发布后,开发者有了迅速的响应,其仓库在 20 日当天就有 2k+ 增长,而直至 26 日间每日均有 2k - 4k 的 Star 增长,此时其他仓库,如基座模型 V3 等尚无明显变化。后续真正的爆发点来自于 27 日美股因 DeepSeek-R1 的发布及后续数日的学界业界的验证和极佳的口碑出现了暴跌,NVIDIA 当日收盘跌幅达 17%,金融市场的冲击导致 DeepSeek-R1 彻底出圈,并同时带火了其基座模型 V3 以及在 28 日发布的多模态模型 Janus Pro。1 月 28 日当天 V3、R1 的 Star 增长均超过 10k,而 Janus 仓库也有 4k+ 的增长。之后增长逐渐趋缓,而 2 月 5 日春节复工后又迎来了一波小幅的增长。
下图给出了这段时间内 Star 增长的来源国家与地区的分 布比例情况,据 OpenDigger 数据显示,这段时间内增长的 15 万 Star 来自全球 185 个国家和地区,几乎覆盖全球所有主要国家和地区。从数据上来看,1 月 20 日 DeepSeek-R1 模型发布后,当日 Star 增长来自 82 个国家,其中来源最多的国家为美国,占比 28%,远超中国的 17.4%,虽部分受到时区影响,但依然可见其敏锐的科技嗅觉。后续随着全球各地开发者和用户的验证与使用,各地区的开发者快速响应,在 28 日前,如印度、德国等的开发者响应速度明显较快,28 日当天其全球影响力达到巅峰,当日增长来源于全球 149 个国家,而后巴西、韩国等国的大量开发者也迅速加入。而 2 月 5 日的增长则八成以上来自中国,也证明当日增长应该主要因春节复工导致。
下图给出了整体增长中各国的开发者的占比情况,中国依然以 24.4% 排名第一,美国 15.7% 紧随其后,之后的开发者最多的十个国家为:印度、巴西、德国、英国、加拿大、韩国、法国、日本、印度尼西亚和澳大利亚。而非洲开发者关注数量最多的几个国家也为互联网化程度最高的几个国家,如尼日利亚、埃及、南非、肯尼亚及阿尔及利亚等。
参与开发者分布
虽然作为大模型,DeepSeek 系列模型的主要使用与下载发生在 HuggingFace、魔搭等模型托管平台,但 GitHub 依然承担了一大部分论坛的作用,有大量开发者在 GitHub 进行讨论与问答,数量远高于 HuggingFace 社区中的讨论量。我们也从这段时间在 DeepSeek-R1 和 V3 仓库中活跃的开发者在过去半年的全域活跃情况进一步分析一下 DeepSeek 吸引了哪些地区的开发者参与到了讨论之中。
下图给出了 DeepSeek 组织中 OpenRank 贡献度的全球分布情况,从参与者的贡献度情况而言,可以看到中美印处于第一梯队,后续英国、巴西、德国处于第二梯队,澳大利亚、巴基斯坦、新加坡等则处于第三梯队。值得注意的是,虽然新加坡的开发者数量并不占优,在开发者来源的数量分布中相对靠后,但在贡献度层面却很靠前,而以色列近年来科技产业的崛起在这个数据中也得到了显现。
更详细的数据显示,DeepSeek 吸引到了大量在过去半年中深耕大语言模型领域的开发者和爱好者。如 LiteLLM(OpenRank 193)的创始人和 CEO Krish Dholakia(@krrishdholakia)、SGLang(OpenRank 180)的核心维护者 Yineng Zhang(@zhyncs)、Promptfoo(OpenRank 46) 的核心维护者 Michael(@mldangelo)、avante.nvim(OpenRank 57)的作者 yetone(@yetone),Mem0 AI(OpenRank 31) 的联合创始人 Dev Khant(@Dev-Khant)、LangBot 的作者 Junyan Qin(@RockChinQ)、ChatHub 的作者 wong2(@wong2