OpenDigger 简介
OpenDigger 是由 X-lab 发起的一个开源数据分析与指标生产开源项目,这个项目旨在凝聚全球开发者的智慧共同对开源相关数据进行分析统计,以使开发者可以更好的理解和参与开源。
指标使用
OpenDigger 实现的所有指标对所有人开放使用, 您可以通过以下链接找到数据,OpenDigger 的静态数据根链接为 https://oss.x-lab.info/open_digger/{platform}/{org/login}/{repo}/
,其中 platform
支持 github
或 gitee
,只需要替换 org/repo
或用户 login
即可获取数据。
您可随意使用这些数据来构建自己的数据应用程序,您可以将 OpenDigger 作为您的数据源,并且欢迎在您的项目中使用以下徽章来展示数据源。
仓库指标
开发者指标
类型 | 名称 | 来源 | 例子 | 代码 | CodePen |
---|---|---|---|---|---|
指标 | OpenRank | X-lab | openrank.json | Link | Demo |
Activity | X-lab | activity.json | Link | Demo | |
网络 | Developer network | X-lab | developer_network.json | Link | Demo |
Repo network | X-lab | repo_network.json | Link | Demo |
用户案例
对于以上数据,OpenDigger 目前有一些用户。
应用
- OpenLeaderboard: 带有标签数据的 Github 排行榜
- HyperCRX: 对查看 Github 用户和仓库有帮助的浏览器插件
- Mulan Dashboard: 用于 木兰社区 的仪表板.
- Hacking Force China: 与 思否 合作发布的 Github 中国开发者排行榜
开源报告
- 2021中国开源报告: 中国最全面的开源报告 开源社.
- 2022中国开源蓝皮书: 中国开源开发蓝皮书 COPU.
- 开源大数据热力报告: 大数据领域内开源项目热力报告
活动
OpenDigger 社区也主办或参加社区间的合作活动,如竞赛或黑客松。
- 开放原子开源大赛 OpenDigger 开源软件生态数据分析挖掘平台挑战赛。
- 第三届 PaddlePaddle 黑客松,黑客马拉松的最终报告在 这里。
数据
GitHub 全域日志数据
我们使用 GHArchive 作为 GitHub 日志数据源,数 据服务由 X-lab 维护的 ClickHouse 云服务。关于数据的详细细节,请查看数据文档。
标签数据
为了进行更深入的分析,我们正在收集打过标签的数据。您可以在 “labeled_data” 文件夹中查看相应的数据。关于数据的详细细节,请查看标签数据 文档。
采样数据集
OpenDigger 提供 ClickHouse 示例数据和 Jupyter notebook,从而可以在本地环境运行 OpenDigger,详情可参考 示例数据文档。
贡献指南
在对项目贡献之前,请务必查阅我们的贡献指南。
沟通
如果想和我们取得联系,欢迎在 GitHub 提交 Issue 或 Discussion,也欢迎通过下面的微信群二维码加入微信群交流。
许可证
对于代码部分,我们使用了 Apache-2.0 许可证。在使用项目输出内容前请确保使用符合许可证要求。