于 波 高 歌 贺志龙 李旭东 于明润 阮玉华
北京市MSM人群RRT模型的两阶段抽样调查*
于 波1,2高 歌1△贺志龙1李旭东1于明润1阮玉华3
目的调查估计北京市MSM人群男男性行为中安全套的破损比例,HIV阳性率等指标,为制定北京市艾滋病的预防控制规划、措施提供科学依据。方法 采用多分类敏感问题随机应答模型两阶段随机抽样的调查分析方法估计出北京市MSM人群肛交中安全套的破损比例、HIV病毒检测的阳性比例等多项涉及个人隐私的敏感性问题指标。结果 北京市MSM人群:男男性行为时安全套有破损、无破损、没有使用安全套的比例分别是12.462%,67.77%,19.77%;最近一年HIV检测的结果为阳性、阴性、检查过但不知道结果、结果不确定、没有检查过的比例分别是8.03%,72.44%,8.28%,5.21%,6.05%。结论 本文采用多分类敏感问题随机应答模型两阶段抽样的调查方法及其统计公式,取得了良好的实际应用效果。北京市MSM人群HIV阳性率高,并存在安全套破损比例高的高危性行为,应引起政府、卫生部门的高度重视。
多分类敏感问题 随机应答技术 两阶段抽样 男男性行为HIV
1.苏州大学医学部公共卫生学院(215123)
2.德州学院数学系(253023)
3.中国CDC性病艾滋病预防控制中心(100050)
△通讯作者:高歌,E-mail:gaoge@suda.edu.cn
在我国,据全国艾滋病哨点监测数据显示近几年男男性行为(MSM)人群HIV感染率上升迅速,该人群已成为继异性性传播后,中国AIDS第二大高危人群。尤其在一些大中城市的MSM人群中,HIV感染率在近3年内从小于3%上升到大于10%,估测其年HIV新发感染率在3%~5%左右。由于社会对同性恋者的歧视,被调查者有可能拒绝回答或故意高报或低报,引起调查结果与真实值之间的差值——敏感性误差,所以传统的抽样方法很难取得良好的效果。目前随机应答技术(randomized response technique,RRT)被认为是最能有效保护被调查者隐私,提高其真实回答率的一种方法。当敏感问题的特征属于多分类变量时,称为多分类或多项选择敏感问题。本文成功利用多分类敏感问题RRT两阶段抽样的调查分析方法〔1〕,对北京市MSM人群的有关多分类敏感问题特征进行了调查分析,取得了良好的实际应用效果。
本文采用两阶段随机抽样:假定总体由N1个一级单位组成,第i个一级单位由Ni2个二级单位组成,i=1,2,…,N1,平均每个一级单位包含 ¯N2个二级单位。又假定第一阶段随机抽取n1个一级单位,第二阶段从第i个被抽中的一级单位内随机抽取ni2个二级单位,i=1,2,…,n1,平均从每个被抽中的一级单位内抽取了¯n2个二级单位。本文研究总体为北京市15~50岁出入男同性恋活动场所的MSM人群,按照北京市15~50岁出入男同性恋活动场所的MSM人数约占北京市15~50岁男性人口的1.0%的比例〔7〕,可估算出北京市15~50岁出入男同性恋活动场所的MSM人数总计为57 213人。以北京市的区县为一级单位,北京市共16个区县(N1=16);以MSM者作为二级单位,平均每个区县约有 3 576人(¯N2=3 576)。从2010年1、2、…、12个月中随机抽中9月,按事先的约定,调查时间定于2010年8~10月。根据JianfengWang,Ge Gao给出的样本大小计算公式估计出〔4〕:第一阶段需从北京的16区县中随机抽取9个区县(n1=9);第二阶段分别从被抽中的区县中随机抽取部分MSM对象,共620人,平均从每个抽中区县抽取了约69人(¯n2=69)。对抽中的MSM对象应用多分类敏感问题随机应答模型进行调查。
(1)安全套的破损情况调查 调查指标为3分类敏感问题——最近一次发生男男性行为时安全套的破损情况类别 j:j=1(有破损),j=2(无破损),j=3(没有使用安全套)。设计一套随机装置:将10个1元硬币分别贴上一个数字标签,其中4个硬币贴上数字0,2个硬币贴上数字1,2个硬币贴上数字2,2个硬币贴上数字 3,贴有数字 0、1、2、3 硬币的比例 P0:P1:P2:P3为0.4:0.2:0.2:0.2(P0+P1+P2+P3=1),将 10 个硬币混合放入袋中。每个被抽中的二级单位(个人)有放回地从袋中随机抽中一个硬币,若抽中的硬币上写有0则真实回答自己“最近一次男男性行为时安全套的破损情况类别j(序号)”;若抽中的硬币上写有0以外的数字则直接回答该数字。
(2)HIV检测结果的调查 调查指标为5分类敏感问题——最近一年您的HIV检测结果类别j:j=1(阳性),j=2(阴性),j=3(检查过但不知道结果),j=4(结果不确定),j=5(没有检查过)。设计一套随机装置:将10个1元硬币分别贴上1个数字标签,5个硬币均贴上数字0,剩余5个硬币分别贴上数字1、2、3、4、5,贴有数字 0、1、2、3、4、5 硬币的比例 P0:P1:P2:P3:P4:P5为 0.5:0.1:0.1:0.1:0.1:0.1(P0+P1+P2+P3+P4+P5=1),将10个硬币混合放入袋中。每个被抽中的二级单位(个人)有放回地从袋中随机抽中一个硬币,若抽中的硬币上写有0则真实回答自己“最近一年HIV检测结果的类别j(序号)”;若抽中的硬币上写有0以外的数字则直接回答该数字。
现场调查中,苏州大学与中国疾病预防控制中心、朝阳华人AIDS干预工作组、北京市相关区县CDC通力合作,并通过男同性恋同伴志愿者、男同性恋网站、男同性恋组织及各男同性恋活动场所负责人的大力配合,对调查对象做好认真细致的思想工作,使他们充分认识和了解本次调查的目的、意义及保护隐私的切实可靠的措施,并给予他们一定的物质奖励,确保了样本的代表性与调查质量。对收集的问卷进行仔细检查,必须是独立完成的完整问卷,无漏填项目。本次调查问卷回收率达100%、回收问卷合格率达100%。用Excel2003建立数据库录入数据,对所有资料进行手工及计算机纠错。数据管理与统计分析通过Excel2003及SAS9.13完成。
(1)总体比例的估计量及其估计方差总体中属于类别j的比例为πj。pij记第i个抽中一级单位第j类的样本比例,根据贺志龙、高歌给出的结果〔1〕,πj的估计量pj为:
(2)pij的估计
设πij为第i个一级单位第j类敏感问题的总体比例,以mij记样本中第i个一级单位回答数字j的频数,λij(ij=mij/ni2)表示样本中第i个一级单位回答数字j的概率,根据全概率公式〔1〕:
(1)各区县的调查计算结果
在区县1中的MSM人群随机抽取49名作为调查对象(ni2=49),区县1回答数字1、2、3的比例分别为10/49、25/49、14/49(ij=mij/ni2)。
回答敏感问题的硬币所占比例为P0=0.4,直接回答数字1、2、3的硬币比例均为Pj=0.2。
因此,由公式(5)得区县1中MSM人群最近一次发生男男性行为时,安全套有破损(j=1)的比例:
同理,可计算各区县MSM人群最近一次发生男男性行为时,安全套破损情况的比例结果见表1。
表1 多分类敏感问题RRT两阶段抽样调查北京市MSM人群性行为中安全套破损情况类别的比例(%)
(2)全市的调查计算结果
由公式(1),计算北京市MSM人群最近一次发生男男性行为时,安全套有破损的比例p1为12.46%,由公式(3)和(4),可计算得 S和S分别为 0 .011 3,0.102 5,
由公式(2),计算得估计方差为:
由此,可得北京市MSM人群最近一次发生男男性行为时,安全套有破损总体比例的95%置信区间为:
同理可得,北京市MSM人群最近一次发生男男性行为时,安全套无破损的样本比例、总体比例的95%置信区间分别为:67.772 7%,0.593 2~0.762 3;北京市MSM人群最近一次发生男男性行为时,没有使用安全套的样本比例为19.765 3%,总体比例的95%置信区间为:0.124 3~0.271 0。
同理可得北京市MSM人群最近一年到正规医疗机构做HIV检测结果各类别的样本比例及总体比例95%的置信区间,见表2。
表2 北京市MSM人群近一年HIV检测结果各类别的样本比例及95%的置信区间
国外学者对所收集到的1965~2000年间38篇相关文献进行Meta分析的结果显示,应用RRT调查敏感问题在结果的准确性、可靠性方面较传统的调查方法有着显著的优势。本文成功地利用多分类敏感问题RRT模型两阶段抽样的调查方法及其统计公式,对北京市MSM人群的有关敏感问题特征进行了调查估计。此外,本文还调查估计了北京市MSM人群男男性行为中全程使用安全套的比例、性病患病率等指标,由于篇幅所限,因此未一一列出。
信度与效度是评价测量方法是否反映数据可靠性与真实性的两种重要指标。本项目组成员已对所研究的多种抽样方法与多种RRT模型相结合的多种调查方法及其统计公式分别进行了效度与信度评价,评价结果表明本项目组所研究的敏感问题调查方法及其统计公式具有较高的信度与效度。
在调查多分类敏感问题时,本文采用的多分类敏感问题(单一样本)随机回答模型所得到的估计值是无偏估计且操作简便、易理解、计算简单,逐渐成为调查多分类敏感问题的首选RRT模型。但其缺点是所需样本的含量较大,设计和计算较为复杂。
1.贺志龙,高歌,王冕,等.多项选择敏感问题RRT二阶段抽样的统计方法及应用.中国卫生统计,2009,26(6):580-582.
2.李旭东,高歌,贺志龙,等.多分类敏感问题RRT的分层抽样统计方法.苏州大学学报,2009,29(4):668-670.
3.Gerty JLM.Lensvelt-Mulders,Joop J.Hox,Peter G.M.van der Heijden.Meta-analysis of random ized response research:35 years of validation studies.Sociological Methods& Research,2005,33(3):319-348.
4.Wang Jianfeng,Gao Ge,Fan Yubo,et al.The estimation of sampling size in multistage sampling and its application in medical survey.Applied Mathematics and Computation,2006,178:239-249.
5.钱跃升,傅继华,毕振强.男男性行为与艾滋病.中国艾滋病性病,2006(6):583-584.
6.王建华.实用医学科研方法.人民卫生出版社,2003:457-458.
7.王丽艳,夏冬艳,吴玉华,等.乘数法估计北京、哈尔滨两市男性同性恋人群规模的研究.华南预防医学,2006,32(3):9-15.
8.薛芳辉,孙智霞,林素芳,等.应用乘数法估计某地男性同性恋人群基数的研究.中国初级卫生保健,2010(10):67-69.
9.马文军,潘波.问卷的信度和效度以及如何用SAS软件分析.中国卫生统计,2000,17(6):364-365.
10.Yu Ming run,Gao Ge,Li Xudong.Strified two-stage cluster sampling on the Simmonsmodel for sensitive question survey.Recent Advance in Statistics Application and Related Areas,2008:801-805.
11.Liu Wen,Gao Ge,Wang Lei.Stratified random sampling on the Simmonsmodel for sensitive question survey,Data Processing and Quantitative Economy Modeling,2010:22-26.
12.Wang Mian,Gao Ge.Quantitative sensitive question survey in cluster sampling and its application,Recent Advance in Statistics Application and Related Areas,2008:648-652.
The Survey among MSM Population in Beijing Using Two- Stage Sampling Method on RRT Model
YuBo,GaoGe,HeZhilong,etal.RadiationMedicineandPublicHealthSchool,SoochowUniversity(215123),Suzhou
ObjectiveTo estimate the rate of condom breakage,and positive of HIV testing result among the MSM of the city of Beijing,which provides the scientific basis to make the methods and measure of prevention and govern of HIV.MethodsThe method of two-stage sampling on RRT for sensitive questions survey with multiple choices and corresponding formulas were applied,and scientifically estimated several indicators of the sensitive issue which referred to the personal privacy among the MSM of the city of Beijing,such as the rate of breakage,positive of HIV testing result.ResultsAmong MSM population of the city of Beijing,the rate of condom breakage,no breakage and no using during sexual intercourse among the MSM population of the city of Beijing were 12.4620% ,67.7727% ,19.7653%respectively.In the recently one year,the rate of the positive,negative during the HIV testing,unknowing the result,no sure results after checking and no checking were 8.0272% ,72.4350%,8.2792%,5.2110%,6.0476%,respectively.ConclusionThe method of two-stage sampling on RRT for sensitive questions survey with multiple choices and corresponding formulas which we applied in this paper had achieved good effective in practical applications.The rate of HIV intervention among MSM population in the city of Beijing was high.There were some sexual behaviors with high risk such as the rate of condom breakage,which should be highly valued by the government and public health departments.
Sensitive question with multiple choices;RRT;Two-stage sampling;MSM;HIV
国家自然科学基金资助项目(30972548)