中央如何面对肺炎_复旦教授郑磊:面对肺炎疫情,政府的数据开放还有很大空间

中央如何面对肺炎

大数据摘要产生

来源:澎湃新闻< br>

作者:郑雷

自武汉爆发新冠状病毒感染肺炎以来,国家和地方各级政府部门通过各种渠道发布了许多领导指示、疫情通报、自我保护知识和相关政策通知。此类信息的发布有助于公众了解疫情发展情况和相关知识,从而在一定程度上满足公众的信息需求

然而,在大数据时代,除了政府公布的上述信息之外,公众可能还想知道一些更具体的数据,例如:在城市或区/县有多少确诊和疑似病例,增长如何?我还想知道一些关于病人基本情况的数据,例如:病人来自哪里,他们去过哪里,疾病发生在哪一天,这些疑似病例是否在后来得到确认,如果没有,他们患了什么疾病?虽然我也从网上和我周围的朋友那里听到各种各样的流言蜚语,但是很难判断这个消息是真是假。此外,这一信息相当零碎,不能让我充分和系统地了解这一流行病的进展。我想知道关于疫情的最新、权威和准确的官方数据。

国家卫生委员会网站数据

所以,我去了国家卫生委员会的网站看看这里是否有任何官方数据在打开国家健康与安全委员会的官方网站后,我看到了网页顶部的横幅“尽最大努力预防和控制由新冠状病毒感染引起的肺炎”(以下截图是在1月23日拍摄的,除非另有说明。))

中央如何面对肺炎

国家卫生委员会网站的主页,1月24日的截图指向水平栏。你可以在页面顶部看到“疫情通报”和“防空动态”。在“疫情公报”中,您可以看到国家卫生委员会发布的各省确诊病例和疑似病例的数据。

中央如何面对肺炎

国家卫生委员会的网站、1月24日的截屏和1月23日发布的流行病公告详细描述了17例死亡病例的疾病描述。然而,如果我想知道数百个其他确诊和疑似病例,我无从知晓。

中央如何面对肺炎

此外,尽管这些案例足够详细,但数据是以包含在文本中的形式而不是以结构化形式呈现的,结构化形式不够清晰和直观,不利于用户的分析和利用。如果我想对这些数据做一些分析,我还需要从这些单词中提取和整理数据,并制作一张表格或地图。除了这些大块的文本之外,拥有一个一目了然的数据表要方便得多。此外,国家卫生与安全委员会发布的数据仅达到省级,没有每个城市或地区的数据。所以,我搜索了武汉市卫生委员会的官方网站,看看这里是否有市级数据。武汉市卫生委员会网站数据

中央如何面对肺炎

在该网站的首页,没有关于疫情一见钟情的信息或专栏。在逐一点击每一栏后,我们在“公告”栏下找到了“肺炎情况通报”。

中央如何面对肺炎

相关通知公布了当天武汉累计病例数和新病例数据。然而,这些数据仍然不以表格形式出现。在1月21日发布的简报中,只能看到20日新病例的数据。如果你想在20号之前知道数据,你必须再次搜索之前发布的简报。

中央如何面对肺炎

进一步搜索后,发现这些信息公告与其他信息一起发布,如医疗机构列表、知识问答、结果公布等。,用户不容易找到和获得。更重要的是,这些简报不会每天更新,数据也不完整。例如,1月17日或1月6日至1月10日没有发布简报。这些天没有发现新病例。还是没有新的案件被释放?没有笔记

中央如何面对肺炎

9-哪里可以找到流行病数据表?这种形式不需要很花哨,只需要每天清晰地显示每个地方的疫情数据。然而,我还没有在国家、湖北或武汉卫生委员会的网站上找到这样的表格。实际情况是,关于疫情的数据分散在不同的政府网站、网页和文件上,分散得支离破碎、不连续和不完整。大多数公众没有精力和能力在各种政府网站上提取和整理这些数据。因此,尽管各级政府认为他们已经公布了这些疫情数据,但人们并没有感觉到。武汉市卫生委员会发布的信息通报还包括新增患者人数、患者最小和最大年龄等统计数据。然而,这些数据是原始数据处理和聚合的结果,而不是第一手原始数据。原始数据可以用于进一步的深入分析,但是统计数据的重用空间非常小。例如,简报宣布新病例的最低年龄为15岁,最高年龄为88岁。然而,从15岁到88岁的范围太大了。如果我想知道哪个年龄组的病人主要集中在15岁到88岁之间,我和我的家人是否属于这个年龄组,就不可能只通过15岁和88岁这两个统计数据来回答这些问题。只有在统计汇总之前获得每个患者的年龄数据,我才能做到这一点。当然,我不需要知道每个病人的姓名、地址和电话号码等个人信息,只需要获得一些关于他们基本特征的数据。这些匿名数据可以用来进行有用的分析,而不会侵犯病人的隐私。之后,我还在人民日报官方微博上看到了《疫情报告》。这些帖子以简短、平实和快速的方式发布了最新的疫情。然而,这些数据仍然支离破碎,无法帮助我系统和全面地了解整个疫情。——10月-1月24日,我在北京市卫生委员会官方微博“首都卫生”上发现了一张表格,显示了一些关于患者病情的基本数据。然而,这只是当天的新病例数据,而不是每天的数据,而且数据仍然不完整。

中央如何面对肺炎

社会化组织发布的疫情数据1月24日,我在手机上看到了医学知识共享网站“丁香花园”产生的全国疫情数据和澎湃新闻的“美容课”栏目。这些数据的呈现比政府网站更加系统、直观和清晰。——12——微信公众号“丁香花园”,1月24 -13日截图——澎湃新闻“美容课”栏目,1月24 -14日截图——这些社会组织一定花了很多时间和精力来收集和整理这些数据,让它们满足受众的需求然而,由于政府发布的数据碎片化、不完整和粒度低,虽然它们的数据呈现方法已经很好,但仍然无法在呈现内容中提供更完整和详细的数据。为此,我访问了香港特别行政区政府卫生署的网站在这个网站的首页,我在第一行的显著位置看到了“严重新传染病源呼吸系统疾病”部分。

中央如何面对肺炎

16-点击此部分后,我在页面的第一行看到了内容“本地最新情况”,点击后,我跳出了以下表单

中央如何面对肺炎

18

中央如何面对肺炎

20-在此表格上,您可以看到每个疑似患者的急救日期、性别、年龄、报告来源、医院名称、检测结果和患者状态。该表结构清晰,字段丰富,内容详细,便于公众解读、分析和利用。从表中可以看出,经过检测,绝大多数疑似患者没有感染武汉新肺炎病毒,而是感染了其他病毒。这些细节一一列出,令人信服。与此同时,该表格中有许多细节值得关注。首先,在公布病人的基本信息时,病人的具体姓名被删除,个人信息受到保护。其次,当新数据在同一天发布时,以前发布的累积数据也列在后面,同一天的数据和历史数据用白色和阴影区分开来。这样,公众将不再需要“爬楼梯”,下载并整合以前发布的表单。这种深思熟虑的姿态将给用户带来极大的便利。第三,需要特别注意的一个细节是,表格附有一个“备注”,详细解释数据收集的背景方法和表示方法。不要低估这句话,它可以帮助公众更准确地理解和使用表格中的数据,避免误解和误用。一个简单干净的表格充满了细节和温度,反映了真实的用户视角和数据思维。唯一的遗憾是,这些数据仍然以PDF格式发布,需要手动转换后才能直接使用。PDF格式易于阅读,不容易修改,但不容易被机器读取进行处理和利用。如果它能提供机器可读的格式,如excel或csv,除了PDF格式,它将更方便专业研究人员和用户分析和利用它。政府数据开放的基本原则是设想,如果像“丁香花园”这样的社会组织也能获得这样的疫情数据,他们能开发的可视化应用程序将会更加完整和详细,给用户带来更好的体验。此外,他们不再需要花费大量时间和精力来收集和整理各种不符合标准格式的零散政府数据,而是可以集中精力使数据可视化应用程序更加直观和生动。在这个过程中,政府开放数据作为数据的供应方,市场上的专业组织将数据作为数据的用户开发成各种应用,然后共同为公众提供信息服务。政府和市场实际上是以数据为原料实现协同治理,便于共同应对疫情

中央如何面对肺炎

此外,数据将在平等和非歧视的基础上开放,以便不同的社会组织能够开发和利用这些数据。它也可能比“丁香花园”有更好的应用这些机构也可以实现良性竞争,最大限度地造福用户。关键之一是政府是否以方便使用的格式向用户提供了完整、准确和及时的数据。否则,像“丁香花园”这样的组织,即使他们的手很熟练,也不能不用米饭做饭。这是数据开放和信息开放之间的一个重要区别。政府信息公开的主要目标是保护公众的知情权,提高政府的透明度。然而,政府数据公开不仅要求社会知道,而且使社会能够开发和利用政府数据,从而释放数据的能量,创造社会和经济价值。目前,在各国开放政府数据的实践中,开放数据通常以电子、结构化和机器可读的格式呈现为开放数据集。数据集是指由数据组成的集合,通常以表格的形式出现,每一列代表一个特定变量,每一行代表一个样本单元。这种形式更便于数据用户开发和利用。为了促进数据的开放和利用,2007年,一批开放数据倡导者提出了政府数据开放的八项基本原则:第一,完整除非涉及国家安全、商业秘密、个人隐私或其他特殊限制,所有政府数据都应向公众开放,开放和非开放原则除外。第二,小学打开从源收集的第一手数据,尽可能保持数据的高粒度,而不是打开修改或处理的数据。第三,及时尽快发布数据以保持其价值。第四,无障碍尽可能扩大用户范围和使用开放数据的目的。第五,机器可读对数据进行合理的结构化处理,以便计算机自动处理。第六,非歧视性这些数据不经登记对所有人平等开放。第七,非专业化数据以非排他性的格式存在,因此任何实体都不能是排他性的或排他性的。第八,免执照除非有合理的隐私、安全和特殊限制,否则数据不受版权、专利、商标或商业秘密规则的约束。目前,该标准已被国际开放数据领域广泛接受。面对这种流行病,政府数据的公开应该有很大帮助。面对疫情,公众只有掌握了足够的信息,才能做出更理性的决策,采取更有利的行动。定量研究表明,媒体报道数量将增加十倍,传染病数量将减少33.5%在互联网和社交媒体如此发达的数字社会,如果公众不能及时从政府那里获得权威数据,只能在互联网上看到各种真假八卦,只会增加他们的恐慌感。因此,公众可以在疫情早期获得足够的信息,从而加强自我保护,减少出行者,有利于政府防控疫情。相反,政府以避免社会恐慌为出发点,采取“外松内紧”的策略,即虽然政府努力防控疫情,但并未将疫情信息充分告知社会,这将导致公众继续无所不知、无所保护地四处游荡,最终会助长疫情的蔓延。进入大数据时代,公众的信息需求也发生了变化。面对疫情,公众不仅要了解自我保护知识、官方疫情通报和相关政策通报,还要了解权威、完整、第一手、准确、及时的数据。显然,各级政府相关部门通过各种渠道发布的零散、不连续、不完整的数据不能满足公众的数据需求。传统的信息披露主要以非结构化和文本的形式提供。在大数据时代,公众希望获得结构化和机器可读的数据,以便于理解、处理和利用。政府数据的开放因此来到前台,将开放的对象推到信息的底部——数据层此外,这种流行病的预防和控制不能仅仅依靠政府,还需要整个社会的充分参与。政府将其流行病数据作为基本原材料向社会开放,然后社会力量可以将这些数据开发成各种应用程序,以更好地满足公众的数据需求。最终,政府和社会可以实现协调治理,控制疫情,让广大公众受益于大数据带来的便利。近年来,中国中央和地方出台了一系列公开数据的政策法规。2017年2月,中央全面深化改革领导小组第三十二次会议审议通过了《关于推进公共信息资源开放的若干意见》,呼吁推进公共信息资源开放,提升信息效益,努力推进重点领域公共信息资源开放,释放经济价值和社会效应。2018年1月,中央网络信息办公室等部委联合发布了《公共信息资源开放试点工作计划》。他们决定在北京、上海、浙江、福建和贵州开展公共信息资源开放试点项目。他们还要求试点领域将重点放在提高开放数据的质量、促进社会利用和探索建立体制规范上。2019年8月,上海市政府第61次常务会议审议通过了《上海市公开数据暂行办法》,这是中国第一部专门针对公开数据的地方政府规章。这些措施要求上海各级公共管理和服务机构向社会提供原始的、机器可读的和社会化的公共数据集,以供重用。近年来,我国政府数据开放工作也在稳步推进。根据复旦大学数字与移动治理实验室近日发布的《中国地方政府数据开放报告(2019年下半年)》,自2012年6月上海推出中国首个地方政府数据开放平台以来,截至2019年下半年,中国大陆已有102个地级以上地方政府推出数据开放平台,国家公共数据开放平台也将在近期推出然而,当前政府数据开放仍然面临许多挑战和困难例如,当政府数据开放时,字段和粒度有多详细?如何开放数据不仅能满足公众的知情权,帮助社会开发和利用数据,还能维护社会稳定和个人隐私?开放后如何防止数据被滥用,以保护公共利益和第三方利益?如何在数据开放和利用的全过程中,不仅提高数据利用率,而且加强各个阶段的安全保护?如何以不同的方式向不同的组和不同类型的数据开放?所有这些问题都需要各地区各级政府进一步探索和研究。然而,面对疫情,政府数据仍有很大的开放空间。

郑雷,复旦大学国际关系与公共事务学院教授,数字与移动治理实验室主任

实习/全职编辑记者招募

加入我们,亲身体验专业科技媒体撰写的每一个细节,与世界上最有前途行业的一群精英一起成长配合北京清华东门,详情请回复大数据摘要主页对话框页面的“招聘”请将您的简历直接发送至zz@bigdatadigest.cn

大家都在看

相关专题