彭良刚
(毕节医学高等专科学校,贵州毕节,551700)
SOM神经网络是一种有效的无导师监督的分类识别器,具有很大的应用前景[1-2],不同中药材表现的光谱特征差异较大,即使来自不同产地的同一药材,因其无机元素的化学成分、有机物等存在的差异性,在近红外、中红外光谱的照射下也会表现出不同的光谱特征,因此可以利用这些特征来鉴别中药材的种类及产地。中药材的种类鉴别相对比较容易,不同种类的中药材呈现的光谱的区别比较明显。本研究针对2021年全国大学生数学建模竞赛E题的中红外光谱的数据,分析研究中药材的特征,并以该特征研究不同中药材的分类识别研究。
基于SOM神经网络的中药材分类识别系统,设计流程如图1所示。
图1 SOM神经网络中药材分类识别系统流程
建立SOM神经网络中药材分类识别,有效的特征是识别的关键。首先要对不同中药材的波数的吸光度作对比分析,经过大量的实验,得到425种编号的中药材波数吸光度对比图,这里给出部分编号的波数吸光度对比图,如图2~图4所示。
图2 编号1-5;51-55;101-105;151-155波数吸光度分布
图3 编号201-205;251-255;301-305;351-355波数吸光度分布
图4 编号401-405;421-425波数吸光度分布
从图2~图4的不同中药材编号的波数吸光度分布特点,发现所有的中药材在中波数段的吸光度分布几乎是接近而无差异,而在低波数段和高波数段的吸光度具有明显的差异,因此可以用低波数段和高波数段的吸光度来区分中药材的特征。这里我们分别选取了低波数段:652-1653和高波数段:2652-3988来进行特征提取,以每一编号的中药材的吸光度平均数作为特征提取。
筛选低波数段的计算每一编号中药材的平均值。首先,把筛选的低波数段652-1653的425种编号的1002个波数的吸光度作为一个新的矩阵A。
式中Ai,1,Ai,1002分别表示编号为i(i= 1 , 2,… ,4 2 5)的波数为652和波数为1653的吸光度,其余表示一样。其次,计算每一个编号的低波数段的所有吸光度的平均值,计算公式为:
表1 编号1-10的低波数段的吸光度平均值
表2 编号101-110的低波数段的吸光度平均值
把筛选的高波数段:2652-3988的425种编号的1347个波数的吸光度作为矩阵B,表达式为:
公式中Bi,1,Bi,1347分别表示编号为i(i= 1 , 2,… ,4 2 5) 的波数为2652和波数为3988的吸光度,其余表示类似。计算每一个编号的高波数段的吸光度的平均值,公式为:
表3 编号1-10的高波数段的吸光度平均值
表4 编号101-110的高波数段的吸光度平均值
表5 编号401-410的高波数段的吸光度平均值
图5 低波数段分类器
图6 高波数段分类器
结果显示425种编号的中药材可以分为两种药材,对应的权值矩阵为:
通过对比低波数段和高波数段的分类器,低波数段的分类器能够有效地把425种编号的中药材分成两类药材,而高波数段的分类器的分类识别结果不明显。