宋 玲,杨东智,曹 慜,赵立华,李海军
HIV分子传播网络分析是分子流行病学技术向公共卫生精准干预转化的应用,通过回顾性或实时构建HIV分子传播网络,揭示HIV传播规律、分析HIV感染者的社会网络关联,指导精准干预及评估干预效果[1],对遏制HIV传播和降低新发感染率具有良好的应用前景[2]。本文通过对获得的宁夏2012—2020年报告的HIV-1感染者的pol区基因序列进行分析,探讨HIV-1感染者分子传播网络特点及相关影响因素,为指导精准干预提供科学参考。
1.1 一般资料:采用方便抽样的方法,抽取442例2012—2020年6月新报告的HIV-1感染者。
1.2 研究方法
1.2.1 信息收集:收集研究对象的性别、年龄、婚姻状况、文化程度、职业等基本信息,以及CD4+T淋巴细胞计数、接触史、是否抗病毒治疗等流行病学信息。
1.2.2 RNA提取和PCR扩增:收集2012—2020年报告HIV-1感染者外周静脉血约8 mL,乙二胺四乙酸三钾盐抗凝,轻轻颠倒混匀6~8次,在6 h内,室温3 000 r/min离心10 min,及时分离血浆,样本置于-80 ℃保存备用。使用硕世病毒RNA/DNA提取试剂盒对采集到的血液样本提取RNA,进行RT-PCR和巢式PCR扩增HIV部分pol基因,包括蛋白酶全长和反转录酶前300个氨基酸位点,扩增产物长度约为1200 bP。扩增程序为:45 min,94 ℃ 2 min;94 ℃ 15 sec,50 ℃ 20 sec,72 ℃ 2 min(35 cycles);72 ℃ 10 min;4 ℃(forever)。扩增引物序列为,F1a:5’-TGAARGAITGYACTGARAGRCAGGCTAAT-3’;F1b:5’-ACTGARAGRCAGGCTAATTTTTTAG-3’;RT-R1:5’-ATCCCTGCATAAATCTGACTTGC-3’;PRT-F2:5’-CTTTARCTTCCCTCARATCACTCT-3’;RT-R2:5’-CTTCTGTATGTCATTGACAGTCC-3’。扩增产物用1%的琼脂糖凝胶电泳分析,将含目的片段的产物送往北京紫熙生物技术有限公司进行纯化和测序。
1.2.3 基因序列处理及亚型判定:对测得的pol基因区序列使用Seqman软件进行编辑和拼接,使用BioEdit软件进行序列比对,样本亚型结果使用HIV databases在线工具Blast初步确定基因亚型,用Mega 6.0软件构建neighbor-joining系统进化树确定亚型。
1.2.4 构建分子网络:选择适宜的基因距离即两两间遗传距离<0.015[2],利用CytoscaPe 3.6.0软件构建HIV分子网络。
1.2.5 耐药分析:应用斯坦福大学HIV耐药数据库进行耐药分析。
1.3 统计学方法:采用SPSS 21.0统计软件,定性资料用率或构成比描述,计数资料组间比较采用χ2检验,用单因素和多因素Logistic回归分析性别、传播途径等对入网率的影响,以P<0.05为差异有统计学意义。
2.1 基本情况:共获得2012—2020年6月新报告的398例HIV-1感染者的pol区基因序列。398例HIV-1感染者,年龄最小16岁,最大79岁,平均年龄(38.05±13.75)岁;男性较多,占86.18%(343/398);户籍以本省为主,占85.18%(339/398);现住地以银川市最多,占48.74%(194/398);婚姻以已婚有配偶者居多,占41.21%(164/398);文化程度以初中及以下为主,占55.02%(219/398);职业以农民和工人为主,占37.94%(151/398),其次是家务及待业占30.65%(122/398);传播途径以异性性行为为主,占54.27%(216/398),其次是同性性行为占38.94%(155/398)。
2.2 基因亚型:获得的398条pol区基因序列中共发现6种基因型,分别是B、C、CRF01_AE、CRF07_BC、CRF08_BC、CRF55_01B,其中以CRF07_BC为主,60.05%(239/398);其次是CRF01_AE占25.88%(103/398),B亚型占7.54%(30/398),08_BC和55_01B分别占2.76%(11/398),C亚型占1.01%(4/398)。CRF07_BC、CRF01_AE和CRF55_01B逐年发现数量呈上升趋势(R2=0.639,F=24.741,P<0.05;R2=0.401,F=9.378,P<0.05;R2=0.509,F=14.526,P<0.05)。采用单因素分析,不同报告年份、现住地、性别、文化程度、传播途径、是否耐药和CD4+T淋巴细胞计数的HIV-1感染者的基因亚型分布不同,差异有统计学意义(P<0.05)。将性别、文化程度和传播途径纳入多因素Logistic回归分析,传播途径对基因亚型分布有影响,差异有统计学意义(P<0.05),见表1。
表1 398例HIV-1感染者基因亚型分布[n(%)]
变量nCRF07_BCCRF01_AECRF08_BCCRF55_01BBCχ2值P值传播途径 同性传播15598(63.23)37(23.87)0(0.00)6(3.87)12(7.74)2(1.29) 异性传播216124(57.41)64(29.63)5(2.31)5(2.31)17(7.87)1(0.46)52.59<0.05 注射毒品2717(62.96)2(7.41)6(22.22)0(0.00)1(3.70)1(3.70)CD4+T淋巴细胞计数(个/mm3) <2007435(47.30)25(33.78)5(6.76)1(1.35)7(9.46)1(1.35)11.10<0.05 ≥200318200(62.89)77(24.21)6(1.89)10(3.14)23(7.23)2(0.63)户籍 本省339205(60.47)88(25.96)9(2.65)11(3.24)23(6.78)3(0.88)4.13>0.05 外省5934(57.63)15(25.42)2(3.39)0(0.00)7(11.86)1(1.69)现住地 银川市194125(64.43)43(22.16)3(1.55)10(5.15)12(6.19)1(0.52) 石嘴山市4519(42.22)22(48.89)0(0.00)0(0.00)4(8.89)0(0.00) 吴忠市8357(68.67)6(7.23)7(8.43)0(0.00)10(12.05)3(3.61)70.15<0.05 固原市2312(52.17)11(47.83)0(0.00)0(0.00)0(0.00)0(0.00) 中卫市3617(47.22)15(41.67)1(2.78)0(0.00)3(8.33)0(0.00) 外省168(50.00)6(37.50)0(0.00)1(6.25)1(6.25)0(0.00)年龄(岁) 16~245536(65.45)11(20.00)0(0.00)1(1.82)6(10.91)1(1.82) 25~59303180(59.41)81(26.73)10(3.30)9(2.97)21(6.93)2(0.66)5.86>0.05 ≥604023(57.50)11(27.50)1(2.50)1(2.50)3(7.50)1(2.50)婚姻 离异/丧偶8451(60.71)22(26.19)1(1.19)5(5.95)4(4.76)1(1.19) 未婚15093(62.00)38(25.33)1(0.67)3(2.00)13(8.67)2(1.33)13.30>0.05 已婚16495(57.93)43(26.22)9(5.49)3(1.83)13(7.93)1(0.61)职业 干部职员1613(81.25)2(12.50)0(0.00)0(0.00)1(6.25)0(0.00) 公共场所服务96(66.67)1(11.11)0(0.00)1(11.11)0(0.00)1(11.11) 家务/待业12277(63.11)29(23.77)3(2.46)4(3.28)7(5.74)2(1.64) 农民/工人15189(58.94)40(26.49)7(4.64)2(1.32)12(7.95)1(0.66)32.18>0.05 其他3820(52.63)12(31.58)0(0.00)3(7.89)3(7.89)0(0.00) 商业服务5129(56.86)14(27.45)1(1.96)1(1.96)6(11.76)0(0.00) 学生115(45.45)5(45.45)0(0.00)0(0.00)1(9.09)0(0.00)是否耐药 否288194(67.36)66(22.92)1(0.35)8(2.78)18(6.25)1(0.35)41.60<0.05 是11045(40.91)37(33.63)10(9.09)3(2.73)12(10.91)3(2.73)诊断年份 2012—2014年10260(58.82)19(18.63)8(7.84)3(2.94)11(10.78)1(0.98) 2015—2017年16189(55.28)52(32.30)1(0.62)2(1.24)15(9.32)2(1.24)30.24<0.05 2018—2020年13087(66.92)31(23.85)1(0.77)6(4.62)4(3.08)1(0.77)
2.3 分子网络分析:获得的398条基因序列共有247条序列进入网络,入网率为62.06%(247/398),共形成50个传播簇,簇内节点数为2~152个。网络内含6种基因亚型,其中以CRF07_BC(70.85%,175/247)和CRF01_AE(19.84%,49/247)为主。网络以一个大型传播簇为主,簇内有152个节点(61.54%,152/247),包含全部6种HIV-1基因亚型,其中以CRF07_BC亚型的节点为主(92.76%,141/152)。不同基因亚型入网率不同,差异有统计学意义(χ2=39.076,P<0.05),入网率最高是CRF07_BC亚型(73.22%),其次是CRF55_01B(72.73%),CRF07_BC和CRF55_01B入网率高于其他亚型。对影响因素进行单因素分析,基因亚型、婚姻、是否耐药和CD4+T淋巴细胞计数值对入网率有影响,差异有统计学意义(P<0.05)。对以上四项影响因素纳入多因素Logistic回归模型,是否耐药和CD4+T淋巴细胞计数值是入网率影响因素,CD4+T淋巴细胞计数<200/mm3和测序时耐药的感染者更易进入网络,成为高风险传播者,见表2。
表2 HIV-1感染者分子网络入网率影响因素分析
本研究通过对获得的宁夏2012—2020年6月报告的HIV-1感染者pol区基因进行分子传播网络构建和分析,研究结果显示,宁夏共有6种HIV-1基因亚型,主要流行毒株为CRF07_BC和CRF01_AE,随着年份推移CRF07_BC比例有所上升,与我国大部分地区结果一致[3-10],与宁夏近几年相关研究结果一致[11-15];不同性别、文化程度、传播途径、CD4+T淋巴细胞计数、测序时是否耐药的HIV-1感染者基因亚型分布不同,但在各类人群中CRF07_BC构成比均最高,CRF07_BC入网率也最高。CRF07_BC早期在吸毒人群中传播并借助MSM快速传播[3,15],现已在各类人群中传播,成为主要优势毒株。
本次研究结果显示,CRF55_01B逐年发现数量呈上升趋势,入网率仅次于CRF07_BC,在全国相关研究中CRF55_01B入网率最高[4],CRF55_01B早期在男男性行为人群中传播[16-17];本研究尚未在女性HIV-1 感染者中发现CRF55_01B,但在通过异性传播者的男性HIV-1感染者中有发现,原因可能有两种,一是传播途径误报,错将同性传播误报为异性传播,二是对女性感染者的检测发现力度不够,具体原因有待进一步研究证实。本次研究对入网率影响因素进行分析,发现CD4+T淋巴细胞计数<200/mm3和测序时耐药的感染者更易进入网络,成为高风险传播者,提示尚需提高抗病毒治疗质量,以减少耐药的发生。