李书五,刘佳丽,李凯
(浙江中医药大学,浙江 杭州 310053)
失眠病是最常见的睡眠障碍之一,其特征是无法入睡或保持睡眠状态,导致睡眠时间及质量不能满足的一种主观体验。随着现代社会生活节奏加快和生活方式的改变,睡眠障碍日益成为社会公共卫生问题。根据世界卫生组织统计,全球约有1/3 的人患有失眠病,并伴有日间功能障碍,其中约50%的患者为慢性病程[1],中国睡眠研究会的睡眠调查结果显示,中国中老年人失眠病发生率高达38.2%,超过3 亿中国人有睡眠障碍,且失眠人数仍在逐年增长中。长期失眠不仅会影响生活质量和社会功能,还会导致一系列生理和精神疾病,如疲劳、心脑血管疾病及抑郁、焦虑等[2]。
失眠病中医证型智能辨识属于中医诊断与信息科学领域的交叉研究。在居家无中医师的场景下,中医证候可为失眠病患者辨证提供客观化的稳定循证依据[3-4]。目前失眠病的居家中医证候辨识传统方法主要集中在基于人舌、面的特殊证候表现以及主诉情况的问卷辨识,其客观化水平较低,近年来,图像处理、机器学习等方法在中医舌诊方面的应用不断扩展[5-6]。这些智能技术使居家中医证型智能辨识技术向客观化、智能化新的阶段迈进;此外,基于大样本深度学习虽然可以构建比较理想的中医证型智能辨识模型,但常因无法获取大量的舌象、面象证候特征辨识标记数据而使研究中断,探索一种基于小样本的中医证型智能辨识方法亦有必要。基于以上中医证候智能辨证领域的瓶颈问题,本文提出一种更适合小样本证候特征提取及智能辨识的方法,同时结合问诊客观化信息分析,设计一种基于多维数据融合辨识的失眠病中医证型智能辨识系统,以实现居家无中医条件下的失眠病中医证型辨识。
辨证施治是中医临床诊疗的特征性法则,可以更好地揭示疾病本质,提高疗效。中医理论认为人体舌面特征变化与人体脏腑气血功能密切相关,因此在临床上前人提出察舌因首辨虚实,次辨热证[7],意为观察舌质、舌苔可客观分析病机特性[8],以判断失眠病的寒热虚实及胃气有无,进而判断病程变化。失眠病患者面部色泽亦可诊察脏腑精气的盛衰,作为判断疾病变化的依据[9]。本文通过文献回顾总结出了中医望诊,面诊(A 区-H 区)及舌诊(I 区-M区中)的常用“辨证”区域[10],进而通过临床专家经验半结构化访谈从以上区域筛选特异性辨识区域,实现失眠病的中医“辨证”。舌、面部证候特征区域划分见图1。
图1 舌、面部证候特征区域划分
为了更好的从临床专家经验视域优化选择文献回顾中面部(A 区-H 区)及舌部(I 区-M 区)失眠病中医证型辨识特异区域,本文采用半结构式访谈法对浙江省2 所三甲医院的22 名资深失眠病中医临床专家进行了临床失眠病中医证型辨识特异区域访谈,访谈结果为:
(1)面诊(A 区-H 区)、舌诊(I 区-M 区)可以作为失眠病中医证型辨识的重要依据。但是各个专家依据自己的临床辨识经验对A 区-M 区在智能辨识中的重要性看法不一。
(2)在失眠病常见四种证型(肝郁化火、痰火扰心、心脾两虚、阴虚火旺)中,肝郁化火证型比较常见,且通过望诊面部、舌部辨识准确率较高,比较适合研究中医失眠病的证型智能辨识。
(3)为了遴选最优肝郁化火证失眠病辨识特异区域,本项目组组织了专家打分,打分结果从高到低排序为:K>L,M>B>H>G>I>J>A>D>E>F。
(4)本文根据专家经验辨识选取了排序前6 的证候特征区域作为本文失眠病中医证候智能辨识区域分别为K(舌尖)、L(舌体左侧)、M(舌体右侧)、B(鼻部)、H(左脸颊)、G(右脸颊),见图2。
图2 失眠病证候特征区域
(5)肝郁化火证失眠病患者舌部证候特征为舌苔黄、舌尖红、舌苔腻以及舌边红等;面部证候特征为鼻部红、两颊泛红等。其知识图谱见图3。
图3 肝郁化火证失眠病舌、面部证候特征图谱
在前文医理设计基础上,本部分是基于中医望诊舌、面部证候特征提取,设计了一种基于色谱分解技术的肝郁化火证失眠病智能诊断模型。首先,通过色谱分解技术提取输入到系统中的舌、面部图像证候特征,再将其与失眠病中医证型辨识问卷进行多维度综合分析并计算出各维度特征值。其后,与失眠病中医证型证候特征知识库中固化知识进行知识密切度计算,最终智能辨识出患者的失眠病中医证型。模型见图4。
图4 智能辨识模型
2.2.1 基于色谱分解技术的舌、面部证候特异区域提取
本文舌、面智能分析其方法是将色谱分解技术(CSD)[11],将色彩指数[r,g,b]转换为HSV 颜色空间;[h,s,v] (h,s,v 分别表示色相,饱和度,亮度;s、v 的取值范围为[0,1],h 的取值范围为[0,2π];选择N 个色相差等间距的纯色作为定位点,记为(p0,p△,p2△,…p2π-△),其中△=。投影到(p0,p△,p2△,…p2π-△)的p 的强度分别计算。最终通过
式Ⅰ:距离推导;式Ⅱ:p投影到pk△的强度;式Ⅲ:光谱向量平均计算,进行舌、面部特异区域提取。
舌、面部分割、证候特异区域的提取是分析舌、面部证候特征的前提。为实现舌、面部证候特异区域的全自动准确分割,本文获取标准失眠病患者舌面象数据其中肝郁化火证失眠病438 例,按5:3:2 的比例随机分为训练集、验证集、测试集。指导专业医师使用labelme 工具将样本数据的面部划分为A、B、C、D、E、F、G、H 八个区域,舌部划分为I、J、K、L、M 五个区域,并对上文基于专家经验选取的面部B、G、H 三个证候特异区域、舌部K、L、M 三个证候特异区域进行标记。将其作为训练样本进行大量机器学习训练使其可以自动获取相应失眠病中医证型的舌、面部证候特征。最后针对于失眠病的不同中医证型,创建不同的舌、面部证候特征知识库。舌、面部证候特征提取结果见图5、6。
图5 面部证候特征提取
图6 舌部证候特征提取
2.2.2 基于特征矩阵的舌、面部证候信息分析
本文基于专家经验和无监督聚类相结合的方法在标记患者的数据样本库中建立面色红、鼻红、舌质红、舌苔黄等肝郁化火证失眠病舌、面部证候特征。并分别记录每种证候特征中每个区域中颜色块的LAB颜色特征值,用以表示该区域。一个区域内LAB 色彩空间中N 个颜色块可表示为:
给定属于舌、面部的某像素点p,记其LAB 颜色空间中色度值为[Lp Ap Bp],则该像素点同第i个颜色块的相似度Spi记为:
遍历计算所有颜色块同p的颜色相似度,取颜色相似度最大时所对应块为点p的特征颜色。
舌、面部证候特征分析模块首先对输入的患者舌、面部图像利用颜色相似度计算方法统计面部整体及各区域各像素点的特征颜色分布情况,将颜色分布信息回归为舌、面部证候特征。
然后分别得到面颊、鼻部、舌尖、舌边等特异区域舌、面部证候特征图像。舌、面部证候特征为实值列向量,各元素分别表示特异舌、面色证候特征,如舌边红、舌苔黄、舌尖红、左颊红、右颊红、鼻红等,各维度上取值范围为[0,1],0 表示完全没有相关特征,1 表示该特征极为明显。
2.3.1 基于特征向量的智能辨识
本文基于浙江省2 所三甲医院肝郁化火证失眠病患者舌、面部证候特征与证型辨识问卷参考周海等人知识图谱构建方法,构建肝郁化火证失眠病证候特征知识库[12],根据该知识库可提取证候特征到失眠病证型的映射方法。
本文记肝郁化火证失眠病证候特征(列向量)为F,F中第i,j···k个元素分别表示肝郁化火证失眠病的舌边红、舌尖红、左颊红等证候特征,则患者为肝郁化火证失眠病的判断依据W肝郁化火可由
得出,式Ⅴ中d肝郁化火与F为维度相同的权重列向量,根据知识库中的先验约束条件,有d(i)肝郁化火>0,。当W肝郁化火大于某阈值时,可认为患者有较大概率为肝郁化火证。
2.3.2 智能辨识结果二次优化
为保证模型在可解释性前提下提升智能辨识的准确性,本文进一步引入特征矩阵K肝郁化火刻画肝郁化火证失眠病与各特征之间的对抗关系。一般地,考虑特征Fi对肝郁化火证失眠病有贡献作用,Fj对肝郁化火证失眠病无贡献作用,即d(i)肝郁化火>0,d(j)肝郁化火=0。但当患者特征Fi和Fj均较明显时,一般不会为肝郁化火证失眠病。此时可将W肝郁化火=FT d肝郁化火扩展为
令K(i,j)肝郁化火=K(j,i)肝郁化火=-1×d(i)肝郁化火,从而有效刻画不同特征间的对抗抑制关系。若肝郁化火证失眠病的各证候特征之间并无对抗关系,则K肝郁化火为单位矩阵。同时在满足先验知识的情况下,可利用大数据训练样本对K肝郁化火及d肝郁化火中的参数进行精调,从而优化辨识模型,提升辨识精度。
基于失眠病中医证型居家移动智能辨识模型,本文设计了失眠病中医证型居家移动智能辨识系统。该系统采用数据访问层、算法层、应用层三层架构设计。各层功能设计如下:
(1)数据访问层:对MySql 数据库进行增、删、改、查等操作;
(2)算法层:通过使用图像处理运算库获取用户的舌、面部特征,使用机器学习库实现对样本的深度挖掘,提高对失眠病的中医证型识别的精度;
(3)应用层:移动用户终端上传舌、面部图像,经过图像算法处理找出舌面部特征并进行信息数据可视化,进而根据固化的失眠病中医证型辨识知识进行证型辨识。
本文提出的失眠病中医证型居家移动智能辨识系统架构见图7,该系统具有服务分布式及负载均衡化的优势,该系统各模块可自由组合、接口易于扩展。
图7 系统架构
3.2.1 移动用户服务端设计与实现
失眠病中医证型居家移动智能辨识系统主要包含用户端与后台管理端,用户端主要基于微信服务号设置测评模块,测评模块主要包含面象采集、舌象采集、问卷回答、报告生成四个模块见图8。
图8 移动端测评模块
用户首次访问需要进行,填写个人健康档案信息,包括性别、年龄、身高、体重、过敏史、既往病史。界面见图9。
图9 个人健康档案信息界面
3.2.2 后台管理端设计与实现
后端采用php 语言进行逻辑编写,数据库选用Mysql 数据库,主要包含健康测评管理与系统用户管理两大功能。针对失眠病中医证型智能辨识添加失眠病种(病名-证型),见图10。并添加对应的失眠病中医证型辨识问卷,见图11。
图10 健康测评证型管理
图11 健康测评问卷管理
现代社会竞争激烈,生活压力大,失眠病的发病率越来越高。本文以肝郁化火证失眠病的辨识为例,验证失眠病中医证型居家移动智能辨识系统。
系统验证对象是50 位来自浙江省2 所三家医院失眠门诊的肝郁化火证失眠病患者。
4.1.1 现代医学诊断标准
参考《CCMD-3(中国精神障碍分类与诊断标准)》中“原发性失眠”的诊断标准:①主诉为失眠,睡眠障碍为主要表现,主要是入睡困难,睡眠浅,早起,醒来后感到不适和多梦等,睡眠时间和(或)对睡眠质量不满意,伴随着不同程度的功能障碍,表现为日间精神疲乏不振、记忆力下降等;引起不安、抑郁症和恐惧心理,降低精神活动的效率,妨碍社会功能。②过度关注失眠的结果。③每周至少3 次,至少过了一个月以上。④排除身体因素引起的继发性失眠。
4.1.2 中医证型诊断标准
参考国家中医药管理局颁布的《中医病证诊断疗效标准》中对“不寐”的诊断为:①入睡困难或睡后易醒,醒后难以入睡,重者彻夜难眠。②常伴梦多、心悸、健忘、头痛、疲劳等症。③在各系统和实验室的检查中没有发现异常。只有具备以上三点,才能诊断为不寐。本文评价分析中的证型参照《中医病证诊断疗效标准》进行分型。
4.2.1 纳入标准
(1)关键纳入指标:匹兹堡睡眠质量指数量表(PSQI)总分>7 分,本文样本匹兹堡睡眠指数情况,见表1。
表1 匹兹堡睡眠指数情况
(2)一般纳入指标:①年龄在18-60 岁;②符合原发性失眠和不寐的辨识标准;③符合《中医病证诊断疗效标准》中失眠病的辨证分型标准;④匹兹堡睡眠质量指数量表(PSQI)总分>7 分;⑤自愿签订知情同意书者。
4.2.2 排除标准
①不符合上述纳入标准者;②孕妇或哺乳期妇女;③合并有严重心、肺、肝、肾、造血系统等严重原发性疾病者;④同时参与其他研究试验者。
4.3.1 样本信息采集
①基本信息采集。失眠病患者个人一般信息、中医症状、生活方式等失眠病相关因素采用受试对象自填的方式,由研究人员辅助自填有困难的部分患者他填完成。②舌、面部图像信息采集。研究对象基本信息采集完成后,采用pad、手机等居家移动终端对舌、面部图像进行采集。采集舌、面部图像示例见图12。③采集方法。采集人像的时候,脸部要放松。采集舌象时,尽量张开嘴,舌头自然伸出口外,舌体放松,舌面扁平,舌尖略朝下,舌体充分露出来。注意不要勉强用力或揉成一团。拍照要在饭后2小时后进行,排除“染苔”、“化妆”等对舌面图像识别有影响的因素。
图12 舌面图像采集示例
4.3.2 样本信息观察指标
①个人健康档案信息;②望诊信息观察指标:证候指标(舌象、面象);③问诊信息观察指标:肝郁化火证失眠病辨识补充问卷。如二便等舌象、面象望诊信息以外无法采集的关键证候信息通过问诊问卷形式采集。
4.4.1 描述性统计
样本结构分布:本文对回收的调查问卷进行描述性统计分析,以了解样本结构分布情况。
根据2013年世界卫生组织规定的分段年龄方法,青年组年龄在45岁以下,中年组在45-59岁之间,老年组在60岁以上。年龄情况结构分布见表2。
表2 年龄分布情况
从年龄分布表可以看出肝郁化火证失眠病患者中老年人相对中年和青年人较少些。本文共采集50例肝郁化火证失眠病患者数据,其中男性19例,女性31例,肝郁化火证失眠病患者中女性偏多,这可能与女性更愿意就医有关。
4.4.2 智能辨识有效性评价
本文将实验结果与医师辨识结果进行比较,结果可知:智能辨识肝郁化火证失眠病的准确率为89%,表明该模型的证型辨识准确度较高,其辨识结果ROC曲线AUC值为0.890,见图13。
图13 ROC曲线
本文将中医原创思维与临床专家经验联结给出了肝郁化火证失眠病中医证候特征表达的关键区域;采用了一种更适合小样本量分析的色谱分解技术用于肝郁化火证失眠病智能辨识中的证候特征提取分析;设计了一种失眠病中医证型居家移动智能辨识系统,该系统为居家无中医条件下的失眠中医证型智能诊断干预提供便利;通过对肝郁化火证失眠病智能辨识有效性评价,证明本文所设计的系统具有较好的智能辨识效果。