信息通信技术与政策

信息通信技术与政策

信息通信技术与政策 ›› 2020, Vol. 46 ›› Issue (5): 38-44.

上一篇    下一篇

全球开源生态发展现状研究

Research on the development of global open source ecology

  

  1. 1. 华东师范大学,上海 200062 2. 同济大学,上海 201800
  • 出版日期:2020-05-15 发布日期:2020-11-10
  • 作者简介:
    王伟:华东师范大学研究员,博士生导师,计算机科学教育教学部主任,中国计算机学会高级会员,开源社理事会成员、执行长,研究方向为计算教育学、开源数字化创新、复杂数据网络
    周添一:华东师范大学数据科学与工程学院xlab 实验室,硕士研究生
    赵生宇:同济大学电子与信息工程学院xlab 实验室,博士研究生
    范家宽:华东师范大学数据科学与工程学院xlab 实验室,硕士研究生

  1. 1. East China Normal University, Shanghai 200062, China 2. Tongji University, Shanghai 201800, China
  • Online:2020-05-15 Published:2020-11-10

摘要: 在开源日益重要的今天,建立在全域开源大数据基础上的相对完整、可以反复进行推演的数据分析尤为重要。使用 2019 年全年 GitHub 的日志进行统计,总日志条数约 5. 46 亿,通过分析GitHub 全网的开发者行为日志,从数据的视角,来观察全球范围内的开源现状、进展趋势、演化特征,以及未来挑战等问题,除了展现目前开源世界全貌之外,还特别关注中国的开发者和企业组织在整个开源产业中的表现。

关键词: 开源, 行为数据, 开发者行为, GitHub

Abstract: As open source is becoming more and more important, data analysis that is relatively complete and can be deduced repeatedly based on global open source big data is particularly important. In this work, we use the GitHub trace data of 2019 with the total number of 546 million logs for analysis. It aims to observe the current status, progress,and trends of open source worldwide from the perspective of data by analyzing the developer behavior logs of the entire GitHub. In addition to showing the full picture of the current open source world, evolutionary characteristics and future challenges, we pay special attention to the performance of Chinese developers and enterprise organizations in the entire open source industry.

Key words: open source, behavioral data, developer behavior, GitHub