家用血液检测服务系统中诊断与预测算法的研究

2018-06-06 10:59傅成杰闫维新赵言正
关键词:决策树心脑血管灰色

傅成杰,闫维新,赵言正

(上海交通大学 机械与动力工程学院 机器人研究所, 上海 200240)

近年来,心脑血管疾病的发病率呈逐年上升的趋势,严重影响了人们的健康质量[1],如何快速有效地治疗心脑血管疾病是当前医学界和整个社会关心的问题。随着心脑血管学的不断发展,研究者发现心脑血管疾病的产生与炎症的持续刺激有关,炎症对其形成过程起到了重要作用,而C反应蛋白(C-reactive protein,CRP)水平是临床上炎症的一种标志物[1-2],可作为炎症诊断中的重要检测指标[3]。

随着人们生活水平的提高,医疗检测设备及分析技术也在不断改善,其中C反应蛋白的定量检测技术受到了医学界的普遍认可,在病情检测、疾病诊断等方面得到了广泛的应用[4]。然而,CRP相关检测大多停留在检测阶段,无法提供病情诊断与预测等功能。另外,目前CRP检测设备大多体积较大、操作复杂,只适合在医院中使用。因此,研制出一种小型化、操作简单并能提供心脑血管疾病诊断与预测功能的家用血液检测服务系统具有重要的意义。本文首先介绍了系统的整体设计,然后在系统基础上详细介绍了病情诊断算法和病情预测算法,最后通过分析算法实验验证了算法的准确性。

1 系统设计

家用血液检测服务系统是比较复杂的生机光电一体化系统,主要包括家用血液检测设备和软件系统。家用血液检测设备主要由机械结构和光电检测模块组成,软件系统由下位机和上位机组成。下位机是嵌入式控制系统,上位机是人机交互平台,包括安卓APP和Web服务端,负责数据存储、数据分析处理等功能。系统整体设计如图1所示。

机械结构是检测设备实现定量检测的基础,由步进电机、导轨滑块、光电限位传感器、推送装置等组成。在下位机的控制驱动下,可完成推送免疫层析试纸条、动态扫描采样等动作。系统的整体机械结构是实现自动化检测的保障。

光电检测是检测设备的关键模块,对检测结果起着不可替代的作用。为保证设备体积小、结构紧凑,本文选用单光路结构。同时,本文选择较为成熟的光强与电流的双闭环反馈电路来保证激发光光强的稳定性,以外环光强反馈来调整激发光的光强,以内环电流反馈来调整驱动电流。光电检测模块扫描采样得到的荧光光强信号由光电二极管(PD)转换成电信号之后,经放大电路、A/D转换电路传递给上位机进行后续的数据分析处理。

图1 系统整体设计

下位机是家用血液检测设备的神经中枢。本文选择TI公司的CC2640作为设备的主控芯片。下位机点亮光电检测模块的LED光源,驱动机械结构执行相关动作,完成对免疫层析试纸条的扫描采样。下位机通过蓝牙将荧光光强信号数据传输给上位机。

人机交互平台即上位机,由安卓APP和Web服务端组成。安卓手机APP首先完成用户的登录功能,接着将从下位机通过蓝牙传输过来的荧光光强信号数据缓存于对应的用户信息中。安卓手机缓存的数据可以通过网络上传到Web服务端,根据相应算法完成对数据的处理得到C反应蛋白的浓度,同时把数据展示在浏览器上或者存储于本地的MySQL数据库中。诊断与预测算法位于上位机,能根据现有的医疗数据和病历对病情做出一定的诊断与预测。

2 病情诊断算法

病情诊断算法中,其中一个较有效的诊断方法是做一定的量化分析,进行区间分段得到分类标准。然后分析检测得到的数据,找到对应的分类,从而得到病情诊断结果。但是对于通过CRP浓度来诊断心脑血管疾病的方式,并不能简单地采用少量的数字作为分段区间进行分类诊断,因为这样获得的诊断结果未考虑环境和个人因素,是比较粗糙的,病情诊断的准确性较低。为解决这个问题,本文采用以决策树模型为基础的病情诊断算法。由于具体的CRP检测数据和病历数据较少,即模型训练集较少,无法完成模型构造,因此本文放弃重新构造模型,寻找现有的决策树模型参数进行构造,把查找到的CRP数据作为测试集对该模型进行分类准确性评估[5]。图2所示为病情诊断算法总体流程。

图2 病情诊断算法总体流程

算法首先充分考虑环境因素和个人因素,得到C反应蛋白诊断相关的有效判断因子作为决策树模型参数,即决策树的节点。Shemesh等[6]对70余名心脑血管疾病患者进行了2年多的跟踪调查之后发现,在没有任何干预措施的前提下,患者体内的CRP浓度是相对恒定的,相比其他危险因子如高血压、胆固醇等更稳定,可作为心脑血管疾病的独立危险因子。Chiriboga等[7]对583位健康的成年男女进行了长达4年的研究工作,按季节周期性地检测他们的CRP浓度。其研究结果表明:不同性别的成年人的CRP平均浓度不同, 且CRP浓度会随季节产生波动,高峰期在11月,低谷期在5月。Rückerl等[8]对1 003名MI病人进行每月CRP浓度检测,通过分析发现采血之前患者是否有吸烟、喝酒和应激等行为对其自身每月的CRP浓度没有影响。孙亚超等[9]对120例心脑血管疾病患者及60名健康体检者进行研究,发现预后好转健康组的平均CRP浓度高于普通健康组。

综合各种资料可得决策树的有效判断因子,即决策树节点(包括性别、季节、是否预后),以及具体的分类规则。图3所示为CRP浓度相关的决策树模型。

图3 CRP浓度决策树

3 病情预测算法

任何一个系统都有其自身已知和未知的信息[10]。信息完全可知的系统称为白色系统;信息完全未知的系统称为黑色系统;介于两者之间的系统则称为灰色系统。对于医学科学来说人体是一个复杂的系统,人体感染疾病是由多个已知和未知的子系统综合作用产生的结果,因此人体是一个灰色系统。对心脑血管疾病进行预测即对人体这个灰色系统进行预测,这就需要预测算法运用一定数学方法使信息不完全可知的系统经处理后成为信息较明确的系统。以灰色预测模型为基础的预测算法就是一种能实现该功能的算法[11]。灰色预测在流行病和疾病发病率等领域的预测方面得到了广泛应用[12],本文将其应用在心脑血管疾病的预测方面,即对CRP浓度的预测。

建立灰色预测模型的主要过程是首先得到原始数据,进行初步处理后将其从无规律状态变成较有规律状态,之后对其进行建模。灰色预测模型相比一般的统计预测模型的优点是灰色预测不要求有大量的数据样本,也不需要样本有典型的概率分布,其计算简单、适用性较强。另外,灰色预测在短期范围内的预测效果佳[13],这些都与CRP浓度预测性质相符,满足对心脑血管疾病预测的要求。灰色预测模型中最常用的是一个变量的一阶微分方程G(1,1)模型,如图4所示为以灰色预测模型为基础的病情预测算法流程。

3.1 累加生成与均值生成

假设原始数据X(t)={x(1),x(2),…,x(n)}为弱化随机性强化规律性,则需要对X(t)进行一次累加,生成Y(t)。对Y(t)进行均值处理,均值生成W(t),具体见式(1)~(2)。

(1)

(2)

图4 病情预测算法总体流程

3.2 建立G(1,1)模型

首先对Y(t)建立1阶线性微分方程,即G(1,1)模型:

(3)

其中:a和u均为待定系数,a是发展灰数,u是灰色控制量。求解式(3),其特解为

(4)

根据最小二乘法,估计参数向量为

(5)

(6)

(7)

3.3 求估计值并检验模型拟合效果

将式(6)和(7)代入式(4)中,可得累加估计值为

(8)

(9)

(10)

3.4 外推预测

如果检验模型的拟合效果不佳,则需要调整模型参数a和u进行残差修正,重新建立G(1,1)模型。如果两者拟合效果较好,则该预测模型可进行外推病情预测,外推公式为

(11)

4 实验分析

4.1 诊断算法实验分析

决策树可以表达成IF-THEN的规则形式,从根节点到每一个叶节点的路径都可以生成一条分类规则。路径上的各个属性值由AND相连构成IF部分,表示判断条件;每个叶子节点构成THEN部分,表示所属的具体分类。IF-THEN规则形成的分类比较简单、易于理解。根据如图3所示的决策树模型,式(12)即表示其中一个具体规则。

IF 性别=男 AND 季节=春季 AND 是否预后=

是 AND 浓度<1.6 mg/L

THEN 结果=CRP浓度正常

(12)

将查找到的焦作市人民医院2013年8月—2014年12月的CRP检测数据作为测试集,对该决策树模型进行评估,由评估结果发现测试集的准确率为88.45%,符合诊断要求,因此可利用该决策树模型进行病情诊断。

4.2 预测算法实验分析

选取焦作市人民医院2014年某段时间连续7天的CRP浓度数据建立灰色预测模型,并校验模型的拟合效果。若拟合效果符合要求,则利用该模型外推预测之后2天的CRP浓度,并与这2天的实际检测值作比较。表1为2014年某连续9天的CRP浓度值。

表1 2014年某连续9天的CRP浓度值

根据前文的病情预测算法,设置实验步骤如下:

1) 根据前7天的数据建立灰色预测模型G(1,1)模型,求得模型参数a=-0.012,u=1.840 6,代入式(8)求得G(1,1)模型为

(13)

表2 CRP浓度实际值与预测值

表3 预测精度检验等级划分

4) 根据式(11)做外推预测,得到后面2天的预测值,并与实际值进行比较。作卡方检验,求得对应的显著性差异水平P,如表4所示为预测检验结果。

表4 CRP浓度实际值与预测值检验结果

由表(4)中第8天和第9天的检验结果P值可知,CRP浓度的实际值与预测值无显著性差异,表明预测模型的结果是准确的。

5 结束语

家用血液检测服务系统包括家用血液检测设备和软件系统,其中软件系统的上位机部分包含诊断与预测算法。本文在充分考虑C反应蛋白浓度各个影响因素的前提下,设计了以决策树模型为基础的病情诊断算法和以灰色预测模型为基础的病情预测算法。对两种算法的实验结果表明,病情诊断算法的准确度达到了系统的设计标准,同时病情预测算法的拟合效果佳,两种算法均符合系统要求,表明家用血液检测服务系统的诊断与预测算法具有一定的实用意义,可为有效辅助心脑血管疾病的医学治疗提供参考。

[1] 李小毓.超敏C反应蛋白检测对心脑血管病诊断的临床意义[J].国际检验医学杂志,2014,35(15):2092-2093.

[2] 丁娇.CRP、尿微量白蛋白与血脂联合检测对心血管疾病早期诊断的临床价值分析[J].中西医结合心血管病电子杂志,2017,5(13):49,52.

[3] 白彩娟,吉尚戎.C-反应蛋白研究进展及热点争议[J].兰州大学学报(自然科学版),2013,49(3):361-369,376.

[4] ZHYDKOV A,CHRIST-CRAIN M,THOMANN R,et al.Utility of procalcitonin,C-reactive protein and white blood cells alone and in combination for the prediction of clinical outcomes in community-acquired pneumonia[J].Clinical Chemistry & Laboratory Medicine,2015,53(4):559-66.

[5] 赵紫奉,李韶斌,孔抗美.基于决策树算法的疾病诊断分析[J].中国卫生信息管理杂志,2011,8(5):67-69.

[6] SHEMESH T,ROWLEY K G,JENKINS A J,et al.C-reactive protein concentrations are very high and more stable over time than the traditional vascular risk factors total cholesterol and systolic blood pressure in an Australian aboriginal cohort.[J].Clinical Chemistry,2009,55(2):336.

[7] CHIRIBOGA D E,MA Y,LI W,et al.Seasonal and sex variation of high-sensitivity C-reactive protein in healthy adults:a longitudinal study[J].Clinical Chemistry,2009,55(2):313-21.

[8] RÜCKERL R,PETERS A,KHUSEYINOVA N,et al.Determinants of the acute-phase protein C-reactive protein in myocardial infarction survivors:the role of comorbidities and environmental factors[J].Clinical Chemistry,2009,55(2):322.

[9] 孙亚超,郑海军.C-反应蛋白检测在心血管疾病检测中的作用[J].中西医结合心血管病电子杂志,2015,3(6):92-93.

[10] 周霞,邱宏,王鹏.灰色预测建模方法及在医学中的应用[J].数理医药学杂志,2007(1):73-75.

[11] 虞亚平.灰色关联、聚类、预测的研究及其在医学方面的应用[D].南通:南通大学,2009.

[12] 李论.基于灰色预测模型的我国心脑血管疾病死亡率预测[J].现代电子技术,2015,38(11):107-111.

[13] 周脉耕,杨功焕.灰色数列GM(1,1)模型在心脑血管疾病死亡预测中的应用[J].中国公共卫生,2002(5):117-119.

猜你喜欢
决策树心脑血管灰色
不是所有药物都能掰开吃——心脑血管篇
冬季谨防心脑血管疾病侵袭
浅灰色的小猪
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
防治心脑血管疾病,注意五大误区
心脑血管疾病用药与药物不良反应的相关性
灰色时代
她、它的灰色时髦观
基于决策树的出租车乘客出行目的识别