不同地区癌症发病分布特征及聚类分析

2016-07-28 00:26孙盼盼平智广戚敏杰陈燕子付晓丽郑州大学公共卫生学院流行病与卫生统计学教研室河南郑州45000郑州大学基础医学院组织学与胚胎学系河南郑州45000焦作市人民医院护理部河南焦作45450
中国癌症杂志 2016年6期
关键词:聚类分析癌症

孙盼盼,刘 莉,平智广,戚敏杰,陈燕子,卢 明,付晓丽.郑州大学公共卫生学院流行病与卫生统计学教研室,河南 郑州 45000;.郑州大学基础医学院组织学与胚胎学系,河南 郑州 45000;.焦作市人民医院护理部,河南 焦作 45450



不同地区癌症发病分布特征及聚类分析

孙盼盼1,刘莉2,平智广1,戚敏杰1,陈燕子1,卢明3,付晓丽1
1.郑州大学公共卫生学院流行病与卫生统计学教研室,河南 郑州 450001;2.郑州大学基础医学院组织学与胚胎学系,河南 郑州 450001;3.焦作市人民医院护理部,河南 焦作 454150

[摘要]背景与目的:癌症严重威胁人类健康和社会经济发展,是我国及全球主要的公共健康问题。该研究旨在探讨多种癌症在我国不同地区的分布特征及与癌症患病率之间的关系,为癌症预防和管理提供科学依据。方法:数据来源为2012年军事医学科学院出版的《中国癌症发病与死亡2003—2007》,收集全国32个地区的2003—2007年不同性别人群的23种癌症发病率资料,采用对应分析获得不同地区的癌症分布特征,采用聚类分析将相同特征的癌症与地区聚为一类,可获得多个有特殊意义的分类。结果:食管癌、胃癌、肝癌、肺癌和结直肠与肛门癌均是男、女性高发病种。所有分组资料的食管癌和胃癌高发区涉县、阳城县、林州市、盐亭县、扬中市和建湖县等地区常聚为一类;扶绥县属于多种癌症发病率低于全国平均水平而肝癌高发区,在男性和合计发病率资料中单独聚为一类;广州市、四会市和中山市属于男、女性鼻咽癌高发区;启东市和海门市等农村地区属于肝癌高发区,在合计和男性发病率资料中聚为一类;结直肠与肛门癌和女性乳腺癌聚为一类,属于城市地区高发病种;女性子宫颈癌属于发病率仅次于消化系统癌症、肺癌和乳腺癌的高发病种。结论:聚为同一类的食管癌高发区涉县、磁县和阳城县等地区和聚为同一类的其他地区或癌症可能存在共同的致癌因素。

[关键词]癌症;发病;对应分析;聚类分析

癌症是目前危害人类健康较严重的一类疾病,其病死率极高,会对家庭和社会造成较大的经济负担[1-3]。世界卫生组织指出全球癌症负担增加,2012年约有1 400万例新发病例,其中中国的发病数居世界第1位。预测未来20年全球每年新增癌症病例会上升到2 200万例,同期癌症死亡病例将从每年820万例上升到每年1 300万例,其中中国状况将最令人堪忧[4]。因此,了解恶性肿瘤的发病、死亡规律,探索恶性肿瘤的危险因素,对于我国恶性肿瘤的预防与控制具有重要意义。目前,有关肿瘤学研究的报道已有很多,肿瘤学研究上的数据常用的统计方法包括方差分析、判别分析、成分分析及聚类分析等,但却没有涉及对应分析和聚类分析相结合的分析方法。

本研究拟分析地区与肿瘤类型的关系,对应分析能处理2个或多个分类变量之间的关系,能直观展现不同地区间肿瘤发病的关系。聚类分析可明确将不同地区或不同肿瘤进行聚类,从而发现肿瘤类型及地区发病的特点。本研究通过分析不同地区癌症的资料,了解不同地区、不同癌症的分布特点、聚类特征,进而为肿瘤研究提供行之有效的方法。

1  资料和方法

1.1资料来源

2011年全国肿瘤登记中心对全国肿瘤登记处2003—2007年资料进行再次的收集和审核,经过对登记数据的一系列整理和审核,其中32个登记处的资料符合标准,并由军事医学科学院出版《中国癌症发病与死亡2003—2007》。其中32个登记地区的所有癌症病种资料作为本研究数据来源。将北京市(bj)、涉县(sx)、磁县(cx)、阳城县(yc)、沈阳市(sy)、大连市(dl)、鞍山市(as)、本溪市(bx)、哈尔滨市南岗区(hb)、上海市(sh)、金坛市(jt)、启东市(qd)、海门市(hm)、淮安市楚州区(ha)、建湖县(jh)、大丰市(df)、扬中市(yz)、杭州市(hz)、嘉兴市(jx)、嘉善县(js)、海宁市(hn)、马鞍山市(ma)、长乐市(cl)、临朐县(lq)、肥城市(fc)、林州市(lz)、武汉市(wh)、广州市(gz)、四会市(su)、中山市(zs)、扶绥县(fs)和盐亭县(yt)共32个地区的人群的喉癌(ha)、口腔与咽喉癌(ky)、胆道肿瘤(dd)、甲状腺癌(jz)、皮肤黑素瘤(ph)、骨肿瘤(gz)、膀胱癌(pg)、胰腺癌(yx)、白血病(bx)、脑瘤(nl)、淋巴瘤(lb)、前列腺癌(ql)、肾肿瘤(sz)、鼻咽癌(ba)、结直肠与肛门癌(jg)、肺癌(fa)、肝癌(ga)、食管癌(sg)、胃癌(wa)、卵巢癌(lc)、乳腺癌(rx)、子宫颈癌(zj)和子宫体癌(zt)共23种癌症中的两性均发的18种癌症合计标化发病率、男性19种癌症标化发病率和女性22种癌症标化发病率资料为原始数据输入IBM SPSS Statistics21.0,经核对无误后进行统计分析。

1.2分析方法

一般情况下,当我们研究两个分类变量之间的关系时可以用Pearson χ2检验进行关联性分析,但无法解释行、列因素之间的相互关系。而对应分析可以对二维数据阵进行适当的变换(即对应变换),变换后的数据对行和列是相对应的,由高维空间向量向低维空间投影,从而揭示多水平行因素和列因素之间的相关关系和关联程度。对应分析因子负荷图中原点代表平均水平,落在从图形原点出发相同方位大致相同区域内的行因素和列因素的分类点彼此有联系。散点间距离越近,说明关联倾向越明显;散点离原点越远,也说明关联倾向越明显。本研究探讨各登记地区在各种癌症发病率水平上有何差异,这正好符合对应分析反应类别间差异的特点,且资料属于分类汇总数据来反应不同癌症和地区分布特征信息,考察哪些地区(行因素)的哪种癌症(列因素)发病率水平的高低,不是一般频数资料,故本研究使用欧式距离标准化法为列总和相等删除均值的基于均数的对应分析法。

一般事物分类面貌尚不清楚,类别数目也不确定的情况下讨论事物的分类问题时采用聚类分析,它是将一个数聚集化为若干组或类的过程,并使得一个组内的数据对象具有较高的相似度,而不同组内的数据对象不相似。聚类分析有快速聚类和系统聚类法,系统聚类法是应用最多的一种聚类方法,即可以对样品分类,又可以对变量分类,适用于样本量小的数据,当计算样本量非常大,做出的树状图也十分复杂,不便于分析时,可采用快速聚类法。本研究要探讨多种癌症及不同地区的分类特点,样本量适中,故采用系统聚类法。距离测量指标为平方欧式距离,类间距以最常用、最稳健的组间平均联接法来计算;输出的分类结果数量的选择依据专业背景和实际情况而定。

2 结 果

2.1不同地区癌症合计发病率分析

对应分析不同地区和癌症的相应关系见表1。因子载荷结果显示,维数1中绝对值最大的变量是食管癌(1.158)和肾肿瘤(-1.146),从图上看横轴右端表示食管癌高发、肾肿瘤低发,代表性样点为阳城县(0.972)和林州市(0.915)等。横轴左端表示肾肿瘤高发、食管癌低发,代表性样点为上海市(-1.463)和大连市(-1.424)。维数2中绝对值最大的变量是肾肿瘤(0.619)和鼻咽癌(-2.188),从图纵轴上端看表示肾肿瘤高发、鼻咽癌低发,代表性样点为大连市(0.780)和上海市(0.604)等。纵轴下端表示鼻咽癌高发、肾肿瘤低发,代表性样点为四会市(-1.984)和中山市(-1.663)。

特征根及贡献率见表2。维数1和2的特征根分别为λ1=0.255和λ2=0.115,贡献率分别为49.3% 和22.3%,累计贡献率达71.6%,即λ1和λ2可代表原始资料的大部分信息,因此两个维度表示的因子载荷图可以基本表达合计发病率资料地区与癌症之间的相互关系。

合计发病率资料的因子负荷平面图见图1。在对应分析因子负荷平面图上,根据肿瘤变量坐标及样品点坐标对各地癌谱进行归类,涉县、磁县、阳城县、林州市、盐亭县、淮安市楚州区、扬中市、肥城市和建湖县(在第一象限)属于食管癌高发区;涉县、阳城县、扬中市、盐亭县、建湖县、金坛市和林州市(在第一象限)属于胃癌高发区;北京市、大连市和上海市(在第二象限)属于肾肿瘤高发区,于第二象限可见多个地区与多种癌症相关;四会市、中山市和广州市(在第三象限)属于鼻咽癌高发区;海门市、长乐市和扶绥县(在第三、四象限)属于癌症平均发病率低于全国平均水平而肝癌高发区。

图1 32个登记处合计发病率资料的因子负荷平面图Fig.1 Scatter plots of row and column points of total incidence data of 32 registration districts

不同地区聚类结果见图2。根据地区聚类树图以6为标尺,可以将32个地区分为6类:扶绥县单独聚为一类,和其他地区间距很大,特点非常明显,属于多种癌症发病率低于全国平均水平而肝癌第二高发区。启东市和海门市聚为一类,两者间距较小,但和其他地区间距较大,属于肝癌和肺癌高发区。长乐市、大丰市、金坛市和临朐县聚为一类,间距为4,属于胃癌发病率第二高发区与鼻咽癌和肾肿瘤低发区;沈阳市、鞍山市、本溪市、哈尔滨市南岗区、武汉市、海宁市、杭州市、北京市、嘉兴市、嘉善县、大连市、上海市、广州市、马鞍山市、四会市和中山市共16个地区聚为一类,间距也为4,都属于食管癌和胃癌低发区,间距同样为4,但这两类地区之间间距较大,表明地区间差异较大。建湖县、林州市、淮安市楚州区、肥城市和磁县聚为一类,间距为5,属于食管癌第二高发区与鼻咽癌和肾肿瘤低发区;涉县、盐亭县、阳城县和扬中市聚为一类,间距也为5,属于食管癌和胃癌首要高发区与鼻咽癌和肾肿瘤低发区,这两类间距较大,表明地区间差异较大。以上结果和对应分析因子载荷图显示结果基本一致。

表1 因子负荷及“量”值Tab.1 Factor loading and mass

表2 特征根及贡献率Tab.2 Eigenvalue and cumulative contribution

图2 合计发病率资料32个登记处聚类树图Fig.2 Dendrogram of 32 registration districts of total incidence data

不同癌症聚类结果见图3。由病症聚类树图以3为标尺,可以将两性均发的18种癌症聚为6类:结直肠、肛门癌、肺癌、肝癌、食管癌和胃癌各聚为一类,属于全国癌症发病率排名前5的病种,其相互之间的距离均大于3,说明病种之间差异较大。其他病种间距为1,最先聚为一类,说明这些病种之间差异最小,但是这些病种与另外5种病种之间距离较大,表明这些病种与另外5种病种之间的差异较大。

2.2不同地区两性癌症发病率资料分析结果

对应分析特征根及贡献率显示,男性发病率资料维数1和2的特征根分别为λ1=0.279和λ2=0.111,贡献率分别为51.8%和20.6%;女性发病率资料维数1和2的特征根分别为λ1=0.265和λ2=0.103,贡献率分别为43.3%和16.9%。男性因子载荷结果显示,维数1中绝对值最大的变量是食管癌(0.964)和前列腺癌(-1.275),从图上看,横轴右端表示食管癌高发、前列腺癌低发,横轴左端表示前列腺癌高发、食管癌低发。维数2中绝对值最大的变量是鼻咽癌(-2.241)和肾肿瘤(0.564),从图上看,纵轴上端表示肾肿瘤高发、鼻咽癌低发,纵轴下端表示鼻咽癌高发、肾肿瘤低发。女性因子载荷结果显示,维数1中绝对值最大的变量是食管癌(1.342)和肾肿瘤(-1.135),从图上看,横轴右端表示食管癌高发、肾肿瘤低发,横轴左端表示肾肿瘤高发、食管癌低发。维数2中绝对值最大的变量是子宫颈癌(-1.056)和鼻咽癌(1.939),从图上看,纵轴上端表示鼻咽癌高发、子宫颈癌低发,纵轴下端表示子宫颈癌高发、鼻咽癌低发。

图3 合计发病率资料病种聚类树图Fig.3 Dendrogram of disease category of total incidence data

因子负荷平面图结果显示,涉县、磁县、盐亭县、扬中市和阳城县(在第一象限)属于男性食管癌和胃癌高发区与女性(在第四象限)食管癌、胃癌和子宫颈癌高发区;淮安市楚州区、临朐县、林州市、盐亭县、肥城市、建湖县、金坛市和大丰市(在第一象限)属于男性食管癌和胃癌高发区;启东市和海门市(在第一、三象限)属于女性肝癌高发区;北京市、大连市和上海市(在第二象限)属于男性肾肿瘤和前列腺癌高发区与女性(在第三象限)卵巢癌和乳腺癌高发区;中山市、四会市和广州市(在第三象限)属于男性与女性(在第二象限)鼻咽癌高发区;长乐市和扶绥县(在第四象限)属于男性癌症平均发病率低于全国平均水平而肝癌高发区。

根据地区聚类树图以10为标尺,可以将男性资料32个地区分为6类,扶绥县单独聚为一类,属于男性多种癌症发病率低于全国平均水平而肝癌高发区。启东市和海门市聚为一类,间距为2,属于男性肝癌高发区。磁县、肥城市和淮安市楚州区聚为一类,间距为3,属于男性食管癌高发区与前列腺癌和鼻咽癌低发区。涉县、盐亭县、阳城县、扬中市和建湖县聚为一类,间距为5,属于男性食管癌和胃癌高发区与前列腺癌和鼻咽癌低发区;沈阳市、鞍山市、本溪市、哈尔滨市南岗区、武汉市、海宁市、杭州市、北京市、嘉兴市、嘉善县、大连市、上海市、广州市、马鞍山市、四会市和中山市共16个地区聚为一类,间距也为5,属于男性多种癌症发病率水平不低于全国平均水平区,两类地区间距较大,地区病种分布特征差异较大。金坛市、林州市、大丰市、临朐县和长乐市聚为一类,间距为7,属于男性胃癌高发区与前列腺癌和鼻咽癌低发区。该结果与对应分析因子载荷图显示结果基本一致。

根据地区聚类树图以6为标尺,可以将女性资料32个地区分为6类比较合适,阳城县单独聚为一类,属于女性多种癌症发病率低于全国平均水平而子宫颈癌全国第一高发区,同时又是胃癌和食管癌高发区。扬中市也单独聚为一类,属于女性食管癌和胃癌第一高发区同时又是子宫颈癌高发区。磁县、肥城市、建湖县、林州市和淮安市楚州区聚为一类,间距为4,属于女性多种癌症发病率处于全国平均水平而食管癌、胃癌高发区;扶绥县、中山市和四会市聚为一类,间距也为4,属于女性特有病种高发且癌症总发病率高于全国平均水平区。涉县和盐亭县聚为一类,间距为5,属于女性多种癌症发病率低于全国平均水平而胃癌、食管癌和子宫颈癌高发区;其他地区聚为一类,间距也为5,属于女性癌症总发病率水平低于全国平均水平区。该结果与对应分析因子载荷图显示结果基本一致。

由病症聚类树图以2为标尺,可以将男性19种癌症分为5类,胃癌、食管癌、肝癌、肺癌和结直肠与肛门癌各聚为一类,相互之间的间距大于2,属于全国男性癌症发病率排名前5的病种,相互之间发病分布特征差异较大;其余病种聚为一类,间距为1,属于全国男性相对低发病率病种,与另外5种病种差异较大。

由病症聚类树图以2为标尺,可以将女性22种癌症分为7类比较合适,胃癌、食管癌、结直肠与肛门癌、乳腺癌、肺癌、子宫颈癌和肝癌各聚为一类,相互之间的间距大于2,病种分布特征差异较大,属于全国女性癌症发病率排名前7位的病种;其余病种聚为一类,其间距为1,属于全国女性相对低发性病种,与另外7类病种差异较大。

3 讨 论

根据发病率资料的对应分析和聚类分析的结果可知,食管癌、胃癌、肝癌、肺癌和结直肠与肛门癌等两性合计发病率分别为34.60/10万、46.00/10万、29.62/10万、41.12/10万和20.23/10万,是人群发病率位居前列的病种,与相关研究一致[5-6]。食管癌与胃癌常聚为一类,高发地区涉县、磁县、阳城县、林州市、盐亭县、淮安市楚州区、扬中市、肥城市、建湖县和金坛市等农村地区也常聚为一类;扶绥县常单独聚为一类,启东市和海门市常聚为一类,它们都属于肝癌高发区。这些农村地区消化系统癌症的持续高发病率,提示我们同一类别的农村地区可能有共同的致病因素。而涉县、磁县、阳城县、林州市和盐亭县等农村地区与扶绥县、启东市和海门市等农村地区可能存在不同的卫生环境、饮食习惯等致病因素才导致消化系统不同部位的癌症高发。如林州市食管癌高发与饮用水污染、食用含有亚硝胺及其前体物的物质等因素有关[7]、启东市肝癌高发与HBV感染、食用黄曲霉毒素污染的玉米等因素有关[8]。盐亭县、涉县、阳城县和扬中市在食管癌和胃癌高发的同时,又属于女性子宫颈癌高发区,平均发病率为33.68/10万,可能与这些农村地区人乳头瘤病毒感染率较高等一系列因素有关,使子宫颈癌发病率增加[9]。肺癌合计发病率为41.12/10万,居于首位,高发地区大连市、上海市和广州市等发达城市地区常聚为一类,可能因为中国烟草消费水平普遍较高,吸烟人群数量庞大,而且城市地区空气污染严重等因素是导致肺癌高发的重要原因[10]。鼻咽癌高发区是广州市、四会市和中山市等华南地区,可能与该地区人群EB病毒感染率较高有关[11]。

在184个国家和地区中,中国癌症世标率居60位,其中男性居57位,女性居68位[9]。多种癌症青睐男性,肺癌、肝癌、胃癌、结直肠与肛门癌和食管癌等男性发病率分别为55.96/10万、43.84/10万、62.83/10万、22.19/10万和43.99/10万,均高于女性,如胃癌发病率约是女性发病率的2~4倍,与相关研究一致[12-13]。而女性乳腺癌发病率27.56/10万位于女性癌症高发性病种的首位,聚类分析中单独聚为一类,上海市、北京市和大连市等较发达城市是高发地区。可能是随着经济快速发展,城市居民膳食结构发生了明显的“西方化”趋势,高脂肪和高热量类食物摄入量增加,体重过重、生育推迟、体内雌激素较多和运动量少等因素导致乳腺癌发病率升高[14-15]。

因子分析可以用来研究地区(行因素)或癌症(列因素)之间的相互关系,但是不能像对应分析一样同时揭示地区和癌症的双重关系[16];传统的χ2检验可以提示两分类变量间是否有关联,但是无法像对应分析一样直观、简单的解释癌症和地区之间的相互关系[17];传统描述性统计方法可以根据总发病率数值进行排序,在数据相近时很难判断该指标的差异是否有统计学意义,但是聚类分析方法却可以综合考量,能够判断出所有归为同一大类的地区或癌症性质是相同的,因此聚类分析法相比于传统的统计学方法可以提高分类的精准性。因此对应分析和聚类分析方法结合既可以观察直观图示结果,又可以具体分类,两者相互佐证和补充,获得科学、完善的信息[18]。

如果国家卫生部门先采用对应分析,其因子载荷图可以直观地观察地区和癌症之间的相互关系是否密切,判断某些地区的高发性或者低发性癌症,然后由聚类分析对全国各地区癌症分布特征进行综合分析,找出各地区癌症分布类型特异性,有针对性地进行宣传教育和防治管理,相比于传统的全面出击的防治管理方式节省人力、物力和财力,并能提高防治效率。

[参考文献]

[1] 贾士杰, 范慧敏, 刘 伟, 等. 2002—2011年中国恶性肿瘤死亡率水平及变化趋势 [J]. 中国肿瘤, 2014, 23(12): 999-1004.

[2] WANG J B, JIANG Y, WEI W Q, et al. Estimation of cancer incidence and mortality attributable to smoking in China [J]. Cancer Causes Control, 2010, 21(6): 959-965.

[3] JEMAL A, CENTER M M, DESANTIS C. Global patterns of cancer incidence and mortality rates and trends [J]. Cancer Epidemiol Biomarkers Prev, 2010, 19(8): 1893-1907.

[4] 世界卫生组织发布《2014年世界癌症报告》 [J]. 中国卫生政策研究, 2014, 7(2): 16.

[5] 陈万青, 张思维, 郑荣寿, 等. 中国2009年恶性肿瘤发病和死亡分析 [J]. 中国肿瘤, 2013, 22(1): 2-12.

[6] 陈万青, 张思维, 曾红梅, 等. 中国2010年恶性肿瘤发病与死亡 [J]. 中国肿瘤, 2014, 23(1): 1-10.

[7] 杨文献, 陆士新, 刘桂亭, 等. 中国林州市食管癌高发区人群病因学预防效果观察 [J]. 中国肿瘤, 2008, 17(7):548-552.

[8] 陈建国, 陈陶阳, 朱源荣, 等. 启东肝癌防控策略的研究及现场干预的效果 [J]. 肿瘤, 2014, 34(11): 1052-1057.

[9] 陈万青, 郑荣寿, 张思维, 等. 2003—2007年中国癌症发病分析 [J]. 中国肿瘤, 2012, 21(4): 161-170.

[10] LI H, LI Q D, WANG M S, et al. Smoking and air pollution exposure and lung cancer mortality in Zhaoyuan County [J]. Int J Hyg Environ Health, 2013, 216(1): 63-70.

[11] LUN W M, CHEUNG S T, LO K W. Cancer stem-like cells in Epstein-Barr virus-associated nasopharyngeal carcinoma [J]. Chin J Cancer, 2014, 11(11): 529-538.

[12] 董 颖, 杨文君. 消化道恶性肿瘤流行病学特征与发病现状分析 [J]. 肿瘤医学, 2014, 20(3): 429-431.

[13] LIN Y, UEDA J, KIKUCHI S, et al. Comparative epidemiology of gastric cancer between Japan and China [J]. World J Gastroenterol, 2011(39): 4421-4428.

[14] YOULDEN D R, CRAMB S M, YIP C H, et al. Incidence and mortality of female breast cancer in the Asia-Pacific region [J]. Cancer Biol Med, 2014, 11(2): 101-115.

[15] BALASUBRAMANIAM S M, ROTTI S B, VIVEKANANDAM S. Risk factors of female breast carcinoma: a case control study at Puducherry [J]. Indian J Cancer, 2013, 50(1): 65-70.

[16] 陈 明, 陈景武. 对应分析方法及其在临床上的应用[J]. 数理医药学杂志, 2007, 20(2): 132-134.

[17] BEH E J, LOMBARDO R. A genealogy of correspondence analysis[J]. Aust N Z J Stat, 2012, 54(2): 137-168.

[18] 李 超, 徐锡武, 魏亮瑜, 等. 聚类分析方法在北京市某医院病案质量综合评价与分析中的运用 [J]. 医学与社会,2015, 28(1): 23-26.

DOI:10.19401/j.cnki.1007-3639.2016.06.004

中图分类号:R73-31

文献标志码:A

文章编号:1007-3639(2016)06-0499-09

收稿日期:(2015-10-26 修回日期:2015-12-10)

基金项目:国家自然科学基金(81001280,81202277,81373096)。通信作者:平智广 E-mail: ping_zhg@163.com

The exploration of characteristics of cancer incidence in cancer surveillance areas by correspondence analysis and cluster analysis


SUN Panpan1, LIU Li2, PING Zhiguang1, QI Minjie1, CHEN Yanzi1, LU Ming3, FU Xiaoli1
(1.Department of Biostatistics and Epidemiology, College of Public Health of Zhengzhou University, Zhengzhou 450001, Henan Province, China; 2.Department of Histology and Embryology,Basic Medical College, Zhengzhou University, Zhengzhou 450001, Henan Province, China; 3.Nursing Department of Jiaozuo People's Hospital, Jiaozuo 454150, Henan Province, China)
Correspondence to: PING Zhiguang E-mail: ping_zhg@163.com

[Abstract]Background and purpose: Cancer is a major public health issue in China and worldwide, which seriously threatens human beings as well as social and economic development. This study explored the relationships between the cancer distribution characteristics and cancer prevalences in Chinese cancer surveillance regions to provide scientific evidence for cancer prevention and management. Methods: The data were obtained from the book named “Prevalence and Mortality of Cancer in China from 2003-2007” including incidence of 23 cancer types in 32 regions of China published by the Academy of Military Medical Sciences of the Chinese PLA in 2012. Correspondence analysis was used to gain the relation between the prevalence and area distribution. Cluster analysis was used to obtain the classifications with special significance by putting the cancers or regions with similar characteristics into a cluster. Results: Esophageal cancer,gastric cancer, liver cancer, lung cancer, colorectal and anal cancer have high incidence and mortality in both genders. The districts with high incidence of esophageal cancer and gastric cancer were grouped together. The counties or cities (Shexian,Yangcheng, Linzhou, Yanting, Yangzhong and Jianhu) with high incidence of esophageal cancer and gastric cancer were classified into same cluster frequently. Fusui was grouped along because of the lower incidence of various cancers than the national average except for liver cancer. Guangzhou, Sihui and Zhongshan were the districts with high incidence ofnasopharyngeal carcinoma in both genders. Rural areas in Qidong and Haimen were classified into a cluster in male and total data for the high incidence of liver cancer. Colorectal cancer, anal cancer and breast cancer in women also had high incidence in urban areas. Cervical cancer had the second level high incidence in women following diseases of digestive system, breast cancer and lung cancer. Conclusion: Similar pathogenic factors may exist in counties or cities of Shexian,Cixian, Yangcheng, etc, because of the high prevalence of esophageal cancer. Similar pathogenic factors may also exist in other districts or cancers that were classified into the same cluster.

[Key words]Cancer; Morbidity; Correspondence analysis; Cluster analysis

猜你喜欢
聚类分析癌症
BCAA代谢异常与癌症的相关性研究进展
FBP1在癌症中的研究进展
癌症“偏爱”那些人?
对癌症要恩威并施
不如拥抱癌症
农村居民家庭人均生活消费支出分析
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究
“县级供电企业生产经营统计一套”表辅助决策模式研究
邓大君:矢志不渝 为癌症破晓