朱会明 赵锐 高悦
摘要 立足于“目为肝之窍”的中医望诊理论,针对传统医学中肝病目诊缺少客观化及量化指标的问题,研发一种可穿戴的中医肝病智能目诊系统(设备)。本系统主要是由眼部图片自动采集、图谱智能生成设备及数字化诊断系统两部分构成。利用仿生模式识别理论的同源连续性算法构建眼部特征发现模块,利用仿生模式识别的高维目标识别算法实现眼部肝病图谱生成模块。通过这2个模块,根据中医目诊理论,对照片及识别结果进行分层次结构化的存储,建立有中医内涵的健康人及肝病患者人眼库,为提高中医数字化、可视化诊断水平提供方法与手段。
关键词 目诊;目诊设备;仿生模式识别;同源连续性算法
Abstract Based on the theory of “ liver opening into eye” and aiming at the lack of objectivity and quantitative indicators of eye inspection in traditional Chinese medicine, a wearable intelligent eye inspection system (equipment) for liver diseases in traditional Chinese medicine was developed. This system is mainly composed of two parts: automatic eye image acquisition, intelligent atlas generation equipment and digital diagnosis system. The bionic pattern recognition theory homology continuity algorithm was used to construct the eye feature discovery module, and the bionic pattern recognition high-dimensional target recognition algorithm was used to realize the ocular liver disease map generation module. Through these two modules, according to the eye inspection theory, the photos and recognition results were stored in a hierarchical structure, the health and liver disease patients eye banks were established to provide methods and means for improving the level of digitalization and visual diagnosis of TCM.
Keywords Eye inspection; Eye-inspection equipment; Bionic pattern recognition; Homology continuity algorithm
目诊是通过观察眼睛变化来诊断全身疾病的方法,是中医望诊中特色诊法之一。“目为肝之窍”“心之使”“为肾精之所藏”“为血之宗”“五脏六腑之精气皆上注于目”。在生理上,目与五脏六腑联系密切。在病理上,察目亦可反映脏腑精气的盛衰。《重订通俗伤寒论》:“凡病至危,必察两目,视其目色,以知病之存亡也,故观目为诊法之首要”[1]。瑶医目诊是具有民族特色诊法之一,其内容包括白睛诊法、黑睛诊法、眼球经区诊法以及天、人、地三部形色目诊等,其诊断符合率颇高,且一直应用于临床。近来随着计算机科学与医学的交互应用与发展,为目诊的现代化、客观化的研究提供了技术支撑。
眼部识别是最自然的一种识别方式,人们甚至可以依据文字描述来区别不同人的眼睛。人类诸多疾病亦可反应于眼,眼睑、巩膜、虹膜等部位上的每个特异性表现都可能是某种疾病生物特征在眼部反射。虽然人的眼睛会随着年龄增长发生变化,但眼表血管分布的几何关系与虹膜边沿纹理在人的一生中都非常稳定,因此可以反映躯体的不同状态。基于此,本项目以肝病为切入点,运用仿生模式识别及计算机图像处理技术,通过对患者眼睛各部位形态、色泽、纹理、斑点及位置结构的动态变化与分析,来判断躯体内在器官病变及功能紊乱。即设计可通过自动采集与分析眼睛的物理、生物和行为等特征来识别人体疾病的中医肝病智能目诊仪(全息仿生智能诊断设备),其前端眼睛图片采集设备见图1。
1 基于中医目诊理论的数据采集与分析
以中医目诊理论为指导,基于图像处理技术,研发目诊图像采集功能模块和图像采集设备,形成可穿戴中医肝病目诊仪图像采集样机。眼睑及眼前血管纹理等在可见光波长照明下即可采集,巩膜与虹膜图片也可采用大景深镜头高清晰采集。通过采集被试人员(健康人及肝病患者)眼部(眼睑及眼球)彩色及红外线照片,建立不同疾病眼部图片库,并基于图像处理技术进行眼部特征提取及关联分析,以获得不同年龄段的健康人及不同疾病的眼部特异性特征。
1.1 眼部图片采集
运用目诊仪采集被测试者眼部高清彩色照片,通过无线传输模块将图像传至计算机,人工标注年龄,性别,职业等一般资料,形成眼部多粒度信息采集。
1.1.1 采集人群 肝病患者主要来自于上海中医药大学附属曙光医院肝硬化科住院及门诊的肝硬化患者。健康志愿者来源于曙光医院体检中心,其中性别、年龄与患者相匹配。为了便于机器學习寻找特征,需采集尽量多的不同年龄段的眼睛图片,现阶段完成并用于分析的样本数为200例。
1.1.2 采集方法 运用目诊仪采集全部入组人员眼部照片,采集时瞩受试者尽量睁大眼睛,并保持1 s直视前方,软件自动采集眼部图片5张,并根据虹膜内径边沿纹理清晰程度,选取其中3张进行图片识别。见图2。同时以眼科裂隙灯拍摄照片做对照。
1.2 眼部特征分类 根据中医理论将眼部特征划分为神态及形色两部分,神态指眼球动态变化的特征,以神、态为主要元素进行人工标注,如眼睑,目珠、瞳孔等。形色指眼球中基本固定不变的特征,以色泽、形状为主要元素进行人工标注,如眼前血管,虹膜边沿锯齿分布,以及各部位的颜色等。基于图像处理技术对眼部图像进行七区定位,将眼部视觉信息转换为相应部位的数值化信息。
2 眼部图像特征(肝病)区域划分与生成
本研究选用针对眼睛眼表特征识别以进行疾病(以肝病为切入点)诊断的研究,目前,利用自制目诊仪既可在可见光也可以红外光下采集眼部照片,且所采集照片已达到虹膜识别的准确度。见图3。
2.1 眼部图片识别及匹配算法 巩膜位于眼球外围,是由不透明白色胶原和弹力纤维组成,虹膜是巩膜与瞳孔之间的环形区域。巩膜本身无血管组成,其上面的血管是球结膜血管覆盖巩膜的表面所致,虽然眼前血管结构具有个体差异性,但是病理反射区域相对固定,这使得基于眼前血管纹理、巩膜色彩、虹膜肌肉纹理及板块变化能够用于进行医学辅助诊断。本研究算法基于快速鲁棒特征的方法、微小侦测法以及直接关联注册与匹配的方法作为特征生成函数[2]。
2.2 眼部图片处理与匹配 基于眼部图像识别技术对采集图片进行处理。首先,基于中医“五轮学说”对所采集眼部图片进行截取,分别截取出眼睑、巩膜、虹膜、瞳仁、内眦5个部分;其次,利用特征增强算法滤除血管纹理之外的背景;再次,设定眼表血管纹理描述符,从已经滤除背景的图片中分别提取各图片的特征形成描述符集合,即眼部特征;最后,对眼部特征进行比对以实现生物识别。
以巩膜特征提取为例,首先截取眼部圖像的巩膜部分。因所截取图像存在自身比较度偏低的局限,难以直接提取眼前血管及肌肉纹理特征。因此,首先,需要采用多方向的Gabor滤波器来增强眼前血管纹理特征,即利用多尺度区域增长的方法过滤图片背景来增强眼前血管分布形态及血管颜色特征。其次,基于类似RANSAC算法进行眼部图片的注册,通过注册参数估算两巩膜模板之间最佳注册参数组以实现图片注册。最后,通过比较各测试模板中的曲线段与目标模板中的线段以完成匹配[2]。
3 眼部图像特征识别与提取
3.1 肝病图像特征识别
3.1.1 仿生模式识别理论 传统模式识别基本数学模型是从特征空间中不同类样本的划分出发,然而本研究需要划分的是2个“同源”(同类)而不完全相等的事物(如人类同年龄同性别群体,但存在不同疾病的眼睛特征)。自然界任何欲被认识的同源的2种事物间的差别若是可以渐变的(如眼部图像由正常到疾病状态),那它们之间必然存在一个渐变过程(连续性)。故本研究采用同源连续性原理(PHC,Principle of Homology-Continuity)的仿生模式识别方法寻找特征空间中同类样本全体的连续性规律。在仿生模式识别中,连续性规律也被用来作为样本点分布的“先验知识”,以此来提高对事物的认识能力[3]。
3.1.2 高维复杂几何形体覆盖方法识别 仿生模式识别的要点为特征空间中同类样本全体的连续性规律。如特征空间中任何一类事物A类(如肝病患者眼前血管纹理)全体在空间中连续映射的“像”所形成的点集都是一个封闭子空间,即集合A(肝病眼前血管纹理特征)。在仿生模式识别中,采用软件或硬件的方法来判断是否属于集合A。在特征空间中构筑一个能覆盖集合A的n维空间几何形体,根据连续性的维数推测原理,若把n维空间分成2部分,其界面必须是一个n-1维的超平面或超曲面。而人工神经网络的一个神经元正是在n维空间中作一个n-1维的超平面或超曲面,或者为复杂的封闭超曲面[3]。因而,人工神经网络是十分合适的实现仿生模式识别手段。而同族事物对应点分布的规律性,为研究用高维复杂几何形体对同族事物进行覆盖的最佳化点覆盖识别提供了基础。
建立高维仿生人眼特征坐标系:以一个标准人眼为原点,将采集到的健康及所要判识疾病患者图片表示到N维坐标系,建立疾病的M维超曲面。识别时导入N维个体眼部特征超曲面,当M维与N维超曲面平行时,表示被测试对象健康,反证为某种疾病,此时M维与N维相交的点即为病患的几何空间分布特性,映射到坐标轴即为具体的病患[4]。根据仿生模式识别同源连续性原理,人体病变是同源连续的过程,因此针对某种疾病应该存在一个由健康到病变的连续变化的N维曲面,该曲面表征了各种病变间的高维度连续变化关系或联系的集合。见图4、图5。
3.1.3 眼部模式空间的构造与识别 本研究采用文献[5]提出的构建封闭区域法。首先确定表征某一类样本的特征空间走向,然后确定在该走向上封闭区域向四外的伸延。利用已知样本构造出代表该类样本的高维空间的封闭区域的支撑“骨架”来描述该封闭区域的走向。最后,在该“骨架”的基础上按照一定策略向四外伸延,“生长”出高维空间封闭区域。
在满足同类样本全体的连续性原则的基础上,将已有样本看成是特征空间中分布的一个点集。将每个样本看成一个节点,两节点相连就认为在这两点之间有一个连接。根据同类样本全体连续性原则,每一个样本都和其他任何样本相连,由此可得到一个无向全连通图,即“骨架”,骨架的形状和走向对于要构造的封闭区域影响重大。为了最大程度降低“骨架”的不确定性,故常将生成骨架的问题转成在一个无向全连通图上找一个最小生成树的问题。在仿生模式识别理论中,封闭空间的构造通常以“骨架”上的每个点为中心做超球,求所有超球的并集就构成了高维空间封闭区域。该算法的关键是确定每个超球的半径,根据一个样本与其他类别样本的关联程度,自适应地确定其小球半径。见图6。
综上所述,骨架是由同类样本之间的关系确定的,而如何在骨架的基础上生长出封闭区域就是由不同样本之间的关联性确定的。基于此,我们利用已知的样本构造出代表该类样本的高维空间的封闭区域,以后每学习一种新的类型,就根据这个方法构造出代表该类样本的高维空间的封闭区域,然后调节原有各个类别封闭区域占据的空间。
基于上述方法,本研究根据现有样本所设计的仿生肝病图像特征识别分类器,智能地分类已采集50例肝硬化患者及200例健康人,实验结果显示:在训练集和测试集数据2∶1情况下,测试集上分类错误率为8.333%。
3.2 基于局部二值模式特征法提取眼部特征 局部二值模式(Local Binary Patterns)特征又称“LBP特征”。它主要用于提取图像局部的纹理特征描述算子。它的优点在于具有较强的分类能力、较高的计算效率及较好的灰度不变性。本研究首先将眼部彩色图像灰度化,其次将LBP图像划分为均匀子块图像,成为一个组合单元,接着在每个柄中定义像素3×3邻域内,将图像阈值化处理,即周围像素小于中心像素值,则该像素点的位置被标记为0,否则为1。可以形成一个二进制的LBP值[6]。见图7。将所采集的40例健康人及40例肝病(肝硬化)患者的图像资料进行LBP法分析,分别计算每个组合单元中矩阵(图7),按顺序串聯子块图像,最后形成相应的共生矩阵,从而实现眼部图像LBP特征提取。
本研究通过LBP特征将彩色图像灰度化以排出颜色因素干扰,最后生成眼部图像相应的共生矩阵。依据8位二进制数值范围在1~255之间,故每张图像LBP特征频数面积共255层。计算每层LBP频数面积百分比以量化眼部图像纹理特征,得到肝病患者与健康人LBP特征频数圆环图。经统计学分析,发现两者间差异有统计学意义。见图8。此外,通过计算图像LBP值频数面积百分比,并结合方差分析、秩和检验等统计学方法对相关指标进行筛选,可以找出二者间具体的差异性特征。
4 小结
生物识别是利用物理、生物和行为等特征来自动识别目标特征的技术。依据生物全息理论,人类的许多特征都可以用作疾病诊断,如脉诊,舌诊,面诊等。但各种诊法都各有其优势与不足。因此,生物信息学研究正在寻找新的识别技术以为人类诊断疾病提供更多的选择。
本研究基于中医目诊理论,探索并研发了一种适用于中医肝病临床诊断的可穿戴式目诊设备及其智能诊断系统。首先,通过镜头、芯片及相应电子元器件等图像采集功能模块设计制备移动终端设备,形成中医肝病目诊仪图像采集样机。其次,通过移动终端实现对眼表图像的自动采集,清楚、精确呈现眼前血管形态、色泽,虹膜纹理等解剖结构,并实现结构化存储,建立目标人群眼库。最终,利用仿生模式识别技术对所采集的大样本被试人员(健康人及患者)眼部(眼睑及眼球)彩色照片,进行眼部特征提取及关联分析,实现基于眼部特征的疾病诊断,同时,通过提取LBP特征法等图像处理技术,提取眼部特征并最后找出具体可描述的差异性特征。推动中医数字化、客观化、可视化诊断技术的进步与发展。
参考文献
[1]吴锐,谢建祥,赵凤达,等.望白睛赤络理论与临床[J].新中医,2007,39(2):3-5.
[2]蔺勇.基于GPU的并行巩膜识别与LDPC译码研究[D].西安:西安电子科技大学,2014.
[3]王守觉.仿生模式识别(拓扑模式识别)——一种模式识别新模型的理论与应用[J].电子学报,2002,30(10):1417-1420.
[4]王俊勇.ICA/PCA虹膜识别方法中预处理与分类的改进方法研究[D].长春:吉林大学,2011.
[5]肖潇.高维仿生信息几何学研究及其在模式识别中的应用[D].杭州:浙江工业大学,2012.
[6]王凯.基于图像纹理特征提取算法的研究及应用[D].成都:西南交通大学,2013.