首先,数据来源有限。从各大互联网案例中不难看出,大部分企业的抗疫大数据产品的数据基本都来自于政府公开数据,而这些数据的纬度并不够高。在大数据时代,公众还想瞭解关于疫情更具体、量化的数据,如每日病例数字变化以及具体病例个体数据,这些要求很多地区的政府公开数据都很难满足。
其次,数据资源质量不高。长期以来,很多政府管理的信息系统往往有各式各样的问题,如数据不全或数据重复,数据获取不规范,数据格式、数据统计时间等纬度不统一,数据加工的过程缺乏严格的质量控制机制,导致许多数据品质较低,为后面的数据清洗和数据分析带来很大困难。
再次,信息孤岛问题突出。大数据的关键是“大”,而大数据的核心则在于互联互通,疫情防控涉及方方面面,不仅要结合多个政府部门的数据仓库,如卫健、交通、公安和民政等系统,还要与电信、铁路、航空以及互联网大数据企业进行广泛合作。但由于缺乏数据共享交换协同机制,政府部门以及企业之间、甚至政府部门或企业内部之间都存在信息壁垒,很难实现共享和互通,跨地区、跨层级和跨部门的数据流转更是难以实现,严重抑制了大数据的效用。
最后,个人信息安全隐患。出于防疫需要,各级各地政府部门都上线了与疫情相关的大数据产品,广泛搜集民众包括身份证号、个人住所、健康状况以及近期活动的个人隐私信息。在信息上报期间,也形成了个人信息被窃取和泄露等方面的隐患,比如网上售卖疫情期间的个人信息等,造成有湖北旅居史人群受到匿名辱骂,给返乡人员和确诊患者的生活带来极大困扰。
面对疫情带来的危机和挑战,大数据技术获得了前所未有的应用契机。从最早追问500万武汉人去哪里了,到摸排人口流动情况,从各地陆续推出的“健康码”,到企业学校复工复产,疫情防控给大数据提供了绝佳的应用场景。目前,境内疫情已经基本得到控制,全国疫情防控进入常态化,大数据技术将继续发挥作用,打赢这场疫情防控的阻击战、攻坚战。 |