冯先成 ,李 寒 ,周 密 ,郭耀飞
1.智能机器人湖北省重点实验室(武汉工程大学),湖北 武汉 430205 2.北京汉通达科技有限公司,北京 100081
至2012年底,我国60岁及以上老年人口已达1.94 亿,占总人口的 14.3%,在 2014 年已突破 2亿,并以每年3.2%的速度增加.根据国际标准,我国已经进入老年型社会.随着社会老龄化程度的不断加深,孤单老人数呈上升趋势,现如今成为一个不可忽视的社会问题.目前,我国中西部地区的城乡空巢家庭超过50%,社会老龄化直接导致社会养老等难题,特别是空巢老人、家庭的健康和安全生活,是智慧城市评价指标体系建设的一个重要指标,需要整个社会、家庭、社区、政府及个人的共同努力,因此,建设智慧城市的体系架构,有利于社会和谐.
建立空巢老人识别模型,需要包含空巢老人的用户信息数据,主要有:
用户信息:记录本地区用户(通信运营网对应的手机个人)基本情况、终端信息、计费等数据;
通话清单:记录本城市用户(手机号码)在某月每天的通话(主/叫、市/话)情况;
短信清单:记录了上述用户在某月每天的短信发送/接收情况.
根据空巢老人的用户信息数据,建立空巢老人的数据模型,识别本地区的空巢老人手机号码、所在区域、子女手机号码等信息[1-2].
对于大量的多特征的数据的识别问题,构造识别函数,运用神经网络进行识别.对于信息充分且正常的用户,构造识别函数具有识别准确,原理简单易行的优点.识别模型符号说明如表1所示.
表1 符号说明Table 1 Symbol description
通过分析其区号差别,年龄差距,通话的类型,通话的时间段等指标,实现了对空巢老人较为精准的识别,并通过区号将其所得空巢老人集合分为与子女同城的空巢老人与非同城的空巢老人两类.首先进行对通话信息的预处理,筛选出能进行识别的数据,在此基础上先判别主叫与被叫是否为父母与子女的关系,接着判别主叫与被叫是否在同一个城市,得出与子女同城的空巢老人与非同城的空巢老人集合.
在对用户信息进行合理分析后,构造了一个评判空巢老人用户的识别函数,该函数是一个多变量的函数,对各个变量进行分开评判,最后以乘积的形式得到结果[1-2].
选取主叫被叫年龄差距,通话时间,通话时长,通话次数为函数自变量,构造综合识别函数Gi(x),其函数关系如下:
其中用户特征矩阵 X=[Xa1,Xa2,T1,T2,N]
用户年龄识别函数
通话时间识别函数为:
年龄差距识别函数为:
通话起始时间识别函数为:
一周内的通话次数识别函数为:
考虑到对于一个用户,由于通话对象不同,识别函数的结果也不同,对于Gi(x)同时取1和0的用户,定义函数 G(x):
当 G(x)=0,表示该用户不是空巢老人,G(x)=1,表示该用户是空巢老人.这样,就识别出空巢老人的集合.部分结果如表2所示.
表2 空巢老人集合Table 2 Empty-nestelders collection
在所识别出的空巢老人集合中,以与子女是否同城为依据,进一步划分:
空巢老人识别流程如图1所示.在通话清单中被叫号码有异网非本运营商的用户,在用户资料中不能找出其个人信息,因此,在通话信息预处理过程中去除被叫为y和g开头的号码.
图1 空巢老人识别流程Fig.1 R ecognition process of empty-nestelders
通过合理分析空巢老人识别系统的数据,在对特征进行粗略的筛选后,选出手机价格,套餐档次等7个特征,如图2所示.
为了选择出对用户识别最有效的特征,利用识别函数识别的结果,将空巢老人集合与非空巢老人集合在不同的特征组合下进行线性可分性判断(其中圆圈表示非空巢老人用户,正方形表示空巢老人集合).
给出两类集合样本各50个,7个特征两两组合共有21种组合,几种特征组合的线性可分性如图3所示.
图2 识别系统的数据分析Fig.2 Data analysis of identification system
图3 特征组合的线性可分性Fig.3 Linear separability of feature combination
前馈网络主要实现函数逼近、模式识别、分类、数据压缩.前馈神经网络模型如图4所示.本模型中运用前馈神经网络的模式识别功能,搭建2层前馈神经网络,隐层激活函数为sigmoid函数,softmax 为输出层函数,训练算法为共轭梯度法[3-5].
图4 前馈神经网络模型Fig.4 Networksmodel of feed forward neural
采用前馈神经网络,采集足够多的典型性好和精度高的样本数据,必须将收集到的样本数据随机分成训练样本、检验样本(10%以上)和测试样本(10%以上)三部分[3-5].因此,在前馈神经网络模型的输出结果样本中,随机选取100个空巢老人与100个非空巢老人样本,选取其中75%的训练样本,15%用于检验,15%用于测试.
为了选择出对用户识别最有效的特征,将这些特征进行组合,7种特征总组合数为个,只选取2个特征的组合与3个特征的组合作为输入,运用MATLAB神经网络模式识别工具箱对样本进行识别,神经网络的结构如图5所示.
图5 神经网络结构Fig.5 Neural network structure
两个特征的组合:(长途费,市话费),(市话费,流量费),(短信费,长途费),(市话费,短信费),(短信费,流量费),(流量费,长途费),(套餐档次,消费金额).三个特征的组合:(短信费,市话费,长途费),(市话费,长途费,流量费),(手机价格,套餐档次,消费金额).
识别效果图的各字段含义:
Training confusionmatrix (训练样本效果图)
Validation confusionmatrix(检验样本效果图)
test confusionmatrix (测试样本效果图)
all confusionmatrix (总效果图)
Training ROC (训练样本ROC曲线)
Validation ROC (检验样本ROC曲线)
Test ROC (测试样本ROC曲线)
ROC (receiver operator characteristic curve)曲线:接收特性曲线,曲线下面积越大,识别准确性越高.在每个效果图中,位于第三行第三列的数值为网络对该样本的识别准确率,该项指标数值越接近于1,表示网络识别效果越好.几种组合的识别效果如图6所示.
图6 各组合的识别效果Fig.6 Recognition effects of each combination
通过对比,发现选取(手机价格,套餐档次,消费金额)这一组特征作为网络的输入时,能得到最好的识别效果,无论从识别的准确率(训练样本68.6%,检验样本 73.3%,测试样本 73.3%),还是从ROC曲线显示的诊断准确性来看,以该组特征为判据识别空巢老人都具有良好的效果.
神经网络算法以其强大的非线性处理能力,自组织和自适应的学习性能等特点,广泛应用于模式识别、优化组合、机器人控制、信号处理等领域.神经网络中使用最为广泛的就是前馈神经网络算法[6-7].
上述模型通过对用户资料信息、通话与短信信息的多级判别,能筛选出比较符合条件的空巢老人,原理简单,易于实现.
但是模型的筛选条件不够完善,对短信表没有进行充分的利用,对于子女在外地,家庭条件不富裕的用户来说,发短信往往比打电话流行.因此,对于经常发短信而打电话较少的用户,仅仅通过用户资料表和通话清单难以将其识别出来[8].
通过前馈神经网络算法建立的数学模型,在所给的通话清单数据中,识别出空巢老人及其子女的电话号码,给老年人送去别样的关怀.比如,在节假日给老人发送祝福的短信,并且通过短信方式提醒他们的子女给老人送去祝福.根据空巢老人的通话特点,给空巢老人以最低的通信话费来与自己的子女联系.通信运营商也可以在平时向空巢老人发送有利心理健康、温暖的短信,让他们感受到社会对他们的关爱.
通过上述模型,将所确定的空巢老人名单及信息交给社会福利组织、志愿者组织以及社区养老机构,便于他们举办一些例如登门探望等送爱心活动,为老年人提供集体生活照料、医疗保健、精神慰藉等综合服务.还可以每年更新空巢老人的数据,为统计局等统计机构提供了简单有效的途径来更新数据,构建和谐社会.
[1]沈斌,漆奋平,江维,等.基于BP网络的超滤膜分离中药成分的分析与实现[J].武汉工程大学学报,2009,31(9):55-58.SHEN Bin,QI Fen-ping,JIANG Wei.Analysis and implement of separatte chinese medicine based on BP network[J].Journal of Wuhan Institute of Technology,2009,36 (9):55-58.(in C hinese)
[2]黄登斌,夏学知.基于用户分类信息的空巢老人挖掘模型[J].计算机与数字工程,2013(3):440-441.HUANG Deng-bin,XIA Xue-zhi.Mining model of empty nester based on the classification of the users information [J].Computer& Digital Engineering, 2013(3):440-441.(in C hinese)
[3]李翔,苏成,王韶君,等.基于模糊神经网络的综合评判方法[J].计算机工程,2009,35(6):200-203.LI Xiang,SU Cheng,W ANG Shao-jun.Comprehensive evaluation method based on fuzzy neural network [J].ComputerEngineering,2009,35(6):200-203.(in C hinese)
[4]王勇,付志红,张淮清.基于前馈神经网络的电网基波高精度检测[J].电网技术,2011(8):124-128.WANG Yong,FU Zhi-hong,ZHANG Huai-qing.High precision detection of fundamental of power grid based on back propagation neural network [J].Power System Technology,2011(8):124-128.(in C hinese)
[5]刘瑞叶,黄磊.基于动态神经网络的风电场输出功率预测[J].电力系统自动化,2012(11):19-22.LIU Rui-ye,HUANG Lei.Wind power forecasting based on dynamic neural networks [J].Automation of electric Power Systems,2012(11):19-22.(in C hinese)
[6]蔡信,李波,汪宏华.基于神经网络模型的动力电池SOC 估计研究[J].机电工程,2015(1):128-132.CAIXin,LIBo,WANG Hong-hua.Estimation of stateof-charge for electric vehicle power battery with neural network method [J].Journal of Mechanical& Electrical Engineering,2015(01):128-132.(in C hinese)
[7]杨帆,姜勇,杨元君.信息融合技术在矿井安全监测系统中的应用[J].武汉工程大学学报,2014,36(5):64-67.YANG Fan,JIANG Yong,YANG Yuan-jun.Information fusion technology in application of mine safety monitoring system [J].Journal of Wuhan Institute of Technology,2014,36(5):64-67.(in C hinese)
[8]刘扬,张振海.小波神经网络的无刷直流电机转子位置检测方法[J].武汉工程大学学报,2014(10):66-70.LIU Yang,ZHANG Zhen -hai.Rotor position detection method of brushless motor based on wavelet neural Network [J].Journal ofWuhan Institute of Technology,2014(10):66-70.(in C hinese)