王腾飞?李宏
摘要:在大数据时代,建立用 Python 预测公共安全事件发展研究,可实现对公共安全事件防控全面、客观的感知和认识,为做出符合实际的科学决策提供实证支撑。另一方面,大数据不仅是一项具有革命性的信息技术,也是一种思维、资源和能力。在新冠肺炎公共安全事件防控的大背景下,面对突发性公共卫生事件,如何运用大数据提升政府治理能力,增强治理效能,进行科学决策、思想引导和精准施策,需要相关人员深入研究并提出相关措施。
关键词:Python 预测;公共安全事件;发展研究
基金项目:本文系“可視化计算与虚拟现实四川省重点实验室”单位项目《大数据在重大疫情防控中的应用研究》 (课题编号:SCVCVR2021.04VS);课题所取得的研究成果受“可视化计算与虚拟现实四川省重点实验室”资助。
王腾飞(1986.11-),男,汉族,重庆开州,硕士学位,助教,研究方向:大数据技术与应用;
李宏(1964.04-),男,汉族,重庆开州,学士学位,教授,研究方向:计算机应用技术。
一、背景
突发性公共事件,是现代社会风险治理的重要课题。其中重点包括了“防范化解重大风险体制机制不断健全,突发公共事件应急能力显著增强”。
在大数据时代,建立用 Python 预测公共安全事件发展研究,可实现对公共安全事件防控全面、客观的感知和认识,为做出符合实际的科学决策提供实证支撑。另一方面,大数据不仅是一项具有革命性的信息技术,也是一种思维、资源和能力。
二、原则及方法
①运用大数据实时数据治理,促进公共安全事件防控治理网络化、制度化和规范。在大数据时代,社会结构和治理模式正在发生变革,如社会构成复杂化、权力机制扁平化、社会治理多元化等。
②运用大数据实施整体性治理,提升公共安全事件防控把控能力和科学决策力。需要建立公共安全事件防控中利用大数据“采集——分析——反馈”的制度规范,确保和提高行政运行效率。
③运用大数据实施精准治理,提升应对公共安全事件防控的态势感知力、资源匹配供给力和差异化服务能力。
既能体现以人民为中心的根本立场,又能在应急处置中激发人们主动参与,减少治理成本,增强治理效能,提升广大民众对党和政府的信任感和信赖度[3]。
三、案例
(一)Python 预测案例
作为TF-IDF结果的一个例子,来看看这些句子。"Im traveling to Paris this week","There will be so many journeys to Paris next week","Paris is supposed to receive a lot of tourists"。实际案例简单的案例,使用TF-IDF来识别。数据集从2009年至2020年的英文文本中抽取了一组新闻和观点 [1]。数据集包含了日期、标题、新闻正文和被提及的关键词。
将该词还原为词根同义词。由于De输入 "POS",词根是来自形容词、动词还是名词。删除常见的词,如Wall street、 Market、Stock、Share等。
模型是创建符合目的的模型。因此,使用Python中的Sklearn库。由于想知道每个日期的关键信息,使用 TfidfVectorizer模型,可以帮助识别每个日期的关键信息。可以设置关键特征的数量来控制输出结果的数量,设置为8个特征。
from sklearn.feature_extraction.text importTfidfVectorizer
tf_idf_model = TfidfVectorizer(max_features=8)
processed_text_tf = tf_idf_model.fit_transform(preprocessed_texts)
tf_idf_values = tf_idf_model.idf_
tf_idf_names = tf_idf_model.get_feature_names()
接下来,用当天数据集中的新闻片段来应用这个模型。通过这种方式,得到一组8个代表当天关键信息的词,每个词都有一个TF-IDF值,表示在当天的重要性。
(二)用Python预测公共安全事件发展
首先对SIR模型做一个简单的介绍,SIR全称就是Susceptible—Infected—Recovered,易感—感染—康复,即易感人群Susceptible有α概率被某种疾病感染,成为感染人群Infected,而感染人群Infected又有β概率康复,成为康复人群Recovered。这次用到的图论方面的库是networkx,这是Python中最常用的图论分析的库。下面还是直接用代码来具体说明一下。先导入各种包。
import matplotlib.pyplot as plt
import numpy.random as rdm
import networkx as nx
接下来定义两个变量n和g。n是总人数,nx.erdos_renyi_graph则是一种随机网络图,著名的E-R随机图理论(Random graph theory),复杂网络拓扑结构的系统性分析。而这个E-R图也是本文应用的基础[2]。而nx.erdos_renyi_graph(n, 0.01)的意思就是以概率0.01来连接100个节点。然后是三个string类型的变量susceptible、infected和recovered,分别代表“易感”“感染”和“康复”人群。
第一个函数Onset,在这里把每个节点的状态都设置为“S”,也就是易感状态,感染函数是Infect_prop,Prop是Proportion,这个函数是感染比例,这里用到了Numpy.Random.Random方法,也就是返回一个均匀分布,数值大小在0-1之间,不包含1,当Rdm.random()<= Proportion时,就让这样的人群变为感染人群,这样让感染人群更加均匀一些。第三个函数是Build_model,是一个嵌套函数,有两个参数,PInfect和PRecover,分别代表感染概率和康复概率,而这里的G.Neighbors(I)的意思是节点I的相邻的节点,而G是生成的图(Graph),是Class。在这些感染人群中,相邻节点的状态是 “Susceptible”时,让这些节点(人群)以概率PInfect来进行感染;感染人群中,以PRecover的概率进行康复。这就是感染—康复过程。而后面的两个函数Model_Run和Model_Iter则是将这个模型运行多次,分别用来模拟一个循环和多个循环。
fig, ax= plt.subplots(figsize=(12, 10))
ax.set_xticks([])
ax.set_yticks([])
pos = nx.spring_layout(g, k=0.2)
nx.draw_networkx_edges(g, pos, alpha=0.5, width = 1)
nx.draw_networkx_nodes(g, pos, node_size=80)
plt.show()
首先设置图片的大小,并去掉坐标轴,然后设置网络图的位置,Nx.Spring_layout设置网络图的位置的方法,其中参数K是节点间的最佳距离,这个可以随意设置,值越大节点越分散,接下来绘制节点和连线,Nx.draw_Networkx_Nodes(G, POS,Node_Size=80)用来绘制节点,POS就是刚才设置的位置参数,再设置一下节点的大小,而Nx.Draw_Networkx_Edges(G, POS,Alpha=0.5,Width = 1)用来绘制连线,同样要传入位置参数,再设置透明度和线宽。
Networkx使用的绘图算法是随机的,同时使用的参数也是随机的,所以这个图每次生成的结果都不同,可以看到这里面已经有部分节点相连,疾病也就是通过他们开始传播,最后就是计算感染率。
n = 100onset(g)
infect_prop(g, 0.05)
model = build_model(0.2, 0.8)
model_iter(g, model, 10)
infected = [ v for (v, attr) in g.nodes(data = True)
if attr['state'] == recovered ]
infection_rate = len(infected)/n
print(infection_rate)
这当中Onset(g)中的G就是前面用G = Nx.erdos_renyi_graph(n, 0.01)生成的图,这是一个类的实例,Infect_prop(g, 0.05)中的0.05就是设置人群初始感染率为0.05,Model = Build_model(0.2, 0.8)中的感染概率和康复概率分别设置为0.2和0.8,而Model_iter(g, model, 10)中让这个模拟过程重复10次,最后计算出感染人数,并得出最终稳定的感染率Infection_rate。
新冠肺炎公共安全事件是对国家治理体系和治理能力的一次大考,既考察着国家政治、经济等各方面工作的应急能力和处置水平,也检验着国家大数据、人工智能、云计算等新技术的应用程度和社会成效。
四、结束语
公共安全事件防控既需要大数据技术支持,也需要新时代公民的大局意识和担当意识。自觉服从党和国家实施的管理规定与制度,服从大局、团结一心,战胜公共安全事件。
作者单位:王腾飞 四川化工职业技术学院数字经济学院
李宏 可视化计算与虚拟现实四川省重点实验室
参 考 文 献
[1]王晓飞.新冠疫情下消费券政策效应测度研究——基于Python软件获取新浪微博发博量与关注度数据的分析[J].价格理论与实践,2020(11):61-63.
[2]王思远,谭瀚霖,李东杰.基于改进传染病动力学易感-暴露-感染-恢复(SEIR)模型预测新型冠状病毒肺炎疫情[J].第二军医大学学报,2020,41(06):637-641.
[3]耿辉,徐安定,王晓艳等.基于SEIR模型分析相关干预措施在新型冠状病毒肺炎疫情中的作用[J].暨南大学学报(自然科学与医学版),2020,41(02):175-180.
[4]赵明静. 基于公共安全视角的城市物流风险分析及预测研究[D].北京交通大学,2021.
[5]邱凌峰,胡啸峰, 周睿,等. 基于机器学习的典型社会安全事件发生规律研究及对雄安新区的启示[J].中国安全生产科学技术,2018,14(10):11-17.
[6]丁晴.基于Python的人脸识别技术应用研究[J].数字技术与应用, 2021,39(5):75-78.
[7]范维澄,刘奕,翁文国.公共安全科技的几点思考[C]// 中国突发公共事件防范与快速处置2008优秀成果选编.2008:54.
[8]夏冰冰.基于Python的安全检测的研究与实现[J].现代信息科技,2019,3(10):155-157.
[9]孫宗缘,马秀峰,李奇.突发公共安全事件网络舆情演化分析——基于文本挖掘与情感分析两个视角[J].河北科技图苑,2021,34(05):65-75.
[10]于路遥,宋瑾钰.基于Python的天气信息可视化分析系统的设计与实现[J].软件工程与应用,2022,11(6):1394-1403.