信息通信技术与政策

信息通信技术与政策

信息通信技术与政策 ›› 2021, Vol. 47 ›› Issue (7): 59-.doi: 10.12267/j.issn.2096-5931.2021.07.009

上一篇    下一篇

基于文本内容分析法的公共数据开放政策研究

Research on opening public data policy based on text content analysis

阳静,赵扬,张超峰   

  1. 广东省电信规划设计院有限公司电信咨询设计院长沙分院,长沙 410008
  • 出版日期:2021-07-15 发布日期:2021-08-01
  • 作者简介:
    阳静:广东省电信规划设计院有限公司注册咨询工程师,主要从事新型智慧城市、数字政府、数据治理等规划咨询工作和数据资源管理研究工作
    赵扬:广东省电信规划设计院有限公司电信咨询设计院副院长,长沙分院院长,经济师,长期从事新型智慧城市、5G、新基建、云计算、大数据、互联网金融等方面的研究与咨询设计工作
    张超峰:广东省电信规划设计院有限公司工程师,主要从事新型智慧城市、互联网金融、区块链、大数据及数据治理等方面的研究与咨询设计工作

YANG Jing, ZHAO Yang, ZHANG Chaofeng   

  1. Guangdong Planning and Designing Institute of Telecommunications Co. , Ltd. , Changsha Branch of Telecom Consulting Design Institute, Changsha 410008, China
  • Online:2021-07-15 Published:2021-08-01

摘要: 在数据已经正式成为新型生产要素的背景下,公共数据开放问题显得越发重要。通过采用Python编程实现多地公共数据开放政策文本的自动化获取,然后研究发文时间、发文数量和地域分布特点,并进行词频统计及文本相似度计算,进而分析政策总体情况和存在问题,为各地制定相关政策文本提供建议和参考。一是研究各地公共数据的定义问题并搭建其表达框架;二是讨论研究开放对象是否面向所有人;三是针对开放安全问题,拓建政府安全政策的工具维度,并发掘该问题演变趋势。

关键词: 公共数据开放, Python, 词频统计, 文本相似度

Abstract: Since data was officially regarded as a production factor, the issue of opening public data has been becoming more and more important. This paper acquires policy texts of opening public data in multiple places by means of Python programming, then analyzes their publishing time, quantity and geographical distribution characteristics, and uses word frequency statistics and text similarity calculation, to study the overall situation and existing problems so as to provide suggestions and reference for the formulation of relevant policy texts. Firstly, it investigates the definition of public data and builds the expression framework; secondly, it discusses whether public data should be opening to everyone; thirdly, it expands the tool dimensions of government security policy for the subsequent security issue, and explores the
evolution trend.

Key words: opening public data, Python, word frequency statistics, text similarity