全国新冠疫情实时动态_抗击新冠肺炎,如何进行实时动态时序图谱建模与分析?

全国新冠疫情实时动态

作者|关

来源| thutmosai

背景介绍

新皇冠肺炎是一种新型的突发性传染病,潜伏期可达24天。这一特点给疫情防控带来了巨大挑战。随着感染规模的不断扩大,简单的人力管理并不十分有效。使用“大数据”技术来辅助人类管理社会,有助于快速准确地定位关键问题,帮助决策者及时制定下一步计划< br>

在本月,我们将每天检查受感染人数的更新和主要站点病例时间表的发布。然而,相互关联的信息的更新永远赶不上大众渴望的手...

全国新冠疫情实时动态

技术背景

知识地图技术作为迈向人工智能的大数据步骤,以最适合的社会行为形式表达复杂的社会结构,非常适合分析具有相关关系的数据。利用知识地图技术来分析传染病关系和社会趋势,不仅有助于流行病的预防和控制,也有助于流行病后的研究和分析。虽然大数据和人工智能的应用还处于起步阶段,但以知识地图为核心的研究成果正在带来新一轮的科技潮流。< br>

“图形数据库”是知识地图背后的关键技术:

图形数据库是关系图论的一种应用,用于存储复杂实体之间的关系信息,即“点”和“边”用于存储数据。最常见的例子是社交网络中人与人之间的关系,这是这场流行病的关键线索。< br>

使用技术

本文使用tootmose技术开发的第一个时间序列atlas平台分离作为技术支持。主要技术突破点是:邻接图+动态图+时序图+多维存储形式< br>

问题解决:

疫情实时统计:医院/市/省确诊病例/疑似病例/死亡/联系电话等实时统计。

疫情实时分析:病例接触人群可追溯性及时调查、高危人群分析、城区风险等级计算等。

疫情数据研究:病毒传播渠道和途径,寻找疾病候选药物,提供相关药物作用机制等

使用数据:

本演示使用5种类型的实体数据:包括正常人、病例、地址、交通、医院等数据信息,以及各种实体之间的关系,如“患者曾出现在超市”等关系我们根据真实场景使用邻接图进行建模。由于详细数据未披露,本文中使用模拟数据进行分析。

和普通图形存储之间的技术差异

在建模之前,我们需要了解图形存储中多维、动态和时间序列的新概念

1)一维图谱与多维图谱的区别

一维图谱:

全国新冠疫情实时动态

(常见的图形存储结构,如在JanusGraph、secondary等中使用的那些。)

多维图集:

全国新冠疫情实时动态

绝对图唯一存储形式(实体属性细分,任何维度的数据,包括例如张某有二维数据,而李某没有患病,可能不包括“维度2”)< br>

2“静态”、“动态”和“时间序列”图谱差异

假设情景:实时统计每个人之间的交易总额

1。静态图集:

。静态图谱历史票据总金额统计方法:10+5+5=20元

(所有交易信息搜索后逐一累加)

2。动态图谱:

全国新冠疫情实时动态

。动态地图集历史票据总金额统计方法:数据生成后存储并自动实时采集,及时查询获得20元

3。动静结合:

全国新冠疫情实时动态

静态图谱+动态图谱是邻接图的一种独特形式,它不仅可以保持历史数据不变,而且可以根据历史数据实时统计指标,无需人工干预

4。时间序列图谱:

全国新冠疫情实时动态

时间序列指数计算是动态图谱的一种特殊形式,即根据“事件”发生的时间线,采用划分的时间间隔进行实时指数计算

等场景~统计每人每日实时交易总额,统计每周实时新患者(统计区间)< br>

new crown肺炎数据建模

在了解了图形的各种存储形式后,接下来我们用模拟数据依次建模,并详细介绍了各实体之间的数据映射关系和关系

全国新冠疫情实时动态

当突发公共事件发生时,我们在“正常时期”的数据图上进行多维扩展,以支持更多的业务,灵活应对疫情

全国新冠疫情实时动态

1)节点“人类”数据建模

正常人类数据(二维):

1。基本信息:性别、生日、籍贯等。(数据来自身份证收集和其他渠道)

2。以前的疾病信息:疾病名称、发病时间、医院等。(来自医院网络数据和其他渠道的数据)

全国新冠疫情实时动态

患者数据(三维):< br>

1。基本信息:性别、生日、籍贯等。< br>

2。以前的疾病信息:疾病名称、发病时间、医院就诊等。+

3。新诊断肺炎:感染程度、诊断时间、感染原因、症状等。(当地医院实时报告的数据等。)

全国新冠疫情实时动态

2)"人"--(承认)->;“医院”

实体“医院”数据(二维):

1。基本信息:床位数、医生和护士数、病人数等。(医院资源管理系统等渠道的实时动态数据)

2。病例信息:住院人数、确诊人数、疑似病例数、死亡人数、治愈人数等。(医院网络实时报告等渠道的实时动态数据)

关系“接纳”数据(一维):

1。承认的信息:承认的时间、承认的原因等。(来自实时医院报告和其他渠道的数据)

全国新冠疫情实时动态

3)“人”(居住、出现、感染)-<“地址”

关系数据(三维边缘):

1。入住时间:入住日期(社区物业管理系统及其他渠道的历史数据)

2。出现在:发生日期(社区街道管理系统和其他渠道的历史数据)

3。感染人:感染日期(来自医院网络实时报告和其他渠道的实时数据)

实体“地址”数据(一维):

1。地址:(无属性信息)

全国新冠疫情实时动态

4)"人"-乘坐->;“车辆”

关系数据(一维):

1。乘坐:登机时间、登机地点、下车时间、下车地点、座位号等。(数据来自交通管理部门管理系统等渠道)

实体"车辆"数据(多维):

1。车辆基本信息:号码、座位号、交通管理部门、输入时间、维护信息、描述信息(来自交通管理部门管理系统的数据等。)

2。高速铁路:司机、乘客数量、出发时间、出发站、终点站、路线站等。(数据来自交通管理部门管理系统等。)

3。飞机:驾驶员、乘客数量、出发城市、到达城市、出发时间等。(数据来自航空公司管理系统等。)

4。地铁:司机、车辆类型、出发时间、出发站、终点站、路线站等。(数据来自城市轨道管理系统等。)

Ps:交通数据类型丰富,包括静态数据,如公交车站和地铁站,以及基于事件流的动态数据,如公交进出站、地铁刷卡、出租车到达某个地理点等。

全国新冠疫情实时动态

5)"人"--(接触、感染)->人;“人类”

关系数据(1-2维):

1。联系人:联系时间等。(来自临时回铃音等的数据。)

2。感染:无属性

实体“人”维(多维变量):

健康人(非患病)1维:“基本信息”维

亚健康(患病)2维:“基本信息”、“既往疾病信息”

患者(患新肺炎)3维:“基本信息”、“既往疾病信息”、“患新冠状肺炎”

(各维属性信息在前一章给出)《》(健康)< br>

2020-02-10:《》(发病),确诊为新皇冠肺炎

2020-02-11:《(》(未发病),但对经密切接触者确诊的病例《刘钊》,再经查出感染了

《》,其密切接触者《张女士》应进入医学观察期

年第6期《医院》-(属于并上报医院)-》“城市”

关系数据(二维):

1。医院报告:患者姓名、年龄、病情(严重/严重/轻微)、诊断(确诊/疑似)、报告时间、报告人员等。(数据来自医院患者数据收集等。)

2。归因于:(无属性信息)

实体“城市”数据(二维):

1。市级患者实时统计:确诊病例总数、疑似病例总数、重症病例总数、轻度病例总数、时间间隔天数等。(数据来自市立医院等的实时报告。)

2。市级患者日增长趋势统计(时间序列):总确诊病例数、疑似病例数、重症病例数、轻症病例数,统计起始时间和结束时间

全国新冠疫情实时动态

7)"城市"(隶属,按城市上报)->;“省”

关系数据(二维):

1。城市报告(按天):总确诊病例、疑似病例、重症病例、轻度病例等。(从市政数据中实时自动获得的数据)

2。属于(无属性信息)

实体“省”数据(二维):

1。省级患者总数统计(动态):确诊病例总数、疑似患者总数、重症患者总数、轻症患者总数等。(数据来自市级医院医疗保健的实时报告等。)

2。省级每日新患者统计(时间序列):确诊病例总数、疑似患者总数、重症患者总数、轻度患者总数、统计开始时间、结束时间等。

。到目前为止,数据建模的引入已经完成如上所述,数据统计部分已经自动化,即准备使用接下来,基于这组数据集,将演示一些更高级别的分析场景。

场景分析演示

PS:拆分图的查询方法偏向API,GSQL尚未实现。为了便于理解,使用相应查询逻辑的伪代码方法来演示查询语句< br>

场景1,城市病例每日新趋势查询(每日摘要)

查询:

顶点

场景7,查找患者传播链

Ps:假设有4个以上的感染者是超级传播者

查询:

//& lt;<。-根据患者感染的路径逐步遍历,直到终端实体没有"新冠状肺炎"维度

使用摘要

绝对图是一个年轻的图形数据库系统,它可以满足实时指标计算任务和历史数据分析,永远不会掉线。除了本文中描述的场景,我们还可以动态地存储实体关系的属性,反之亦然。例如,在实体“张三”的维度中,我们可以实时计算它最近联系的10个朋友的名字,并不断更新和保存它们

(*本文由人工智能技术大本营转载,请联系原作者)

大家都在看

相关专题