敏感问题RRT模型下(分层)三阶段抽样调查的统计方法及其应用

敏感问题RRT模型下(分层)三阶段抽样调查的统计方法及其应用

作者:师大云端图书馆 时间:2015-06-14 分类:论文格式 喜欢:2325
师大云端图书馆

【摘要】目的:在抽样调查中,若关心的变量或特征是涉及个人隐私或不被社会认可的敏感性问题,则采用直接调查的方法会使部分被调查对象出于自我保护的心理而产生一定程度的不合作甚至拒绝回答,调查结果难以反映总体的真实特征。为了提高敏感问题的正确应答率,Warner通过引入随机化装置,成功实现了在不暴露应答者隐私的情况下获得人群中某敏感性问题的发生比例,开创了随机应答技术(RandomizedResponseTechnique,RRT)的先河。几十年来,在随机应答技术研究领域出现了一大批Warner模型的改进模型,以及一些新的调查方法。然而,在本团队研究之前,国内外研究较多的敏感问题类型为二项选择敏感问题和数量特征敏感问题,而对于多项选择敏感问题较少关注;研究较多的敏感问题抽样调查的统计方法主要局限于简单随机抽样,实际应用也主要局限于小范围特殊人群小样本的简单随机抽样调查,或在大规模调查中将复杂抽样调查方法获取的敏感问题资料误用简单随机抽样调查有关公式来统计分析;近年来本团队对各种随机应答模型与整群抽样、二阶段抽样、二阶段整群抽样、分层随机抽样、分层整群抽样、分层二阶段抽样方法组合的各种敏感问题调查的统计方法进行了研究;在敏感问题大规模的抽样调查中,三阶段抽样、分层三阶段抽样常常被采用,但对敏感问题三阶段、分层三阶段抽样的统计方法,国内外至今未见报道。有鉴于此,本文对9种随机应答模型与三阶段抽样及分层三阶段抽样2种抽样方法组合的共18种调查方法,从数学上推导出二分类敏感问题总体比例、多分类敏感问题各类别总体比例、数量特征敏感问题总体均数的估计量及其方差、估计方差的计算公式;并采用本文研究的调查方法及给出的统计公式,对北京市男男性行为者(menwhohavesexwithmen,MSM)这一艾滋病高危人群的敏感问题特征进行抽样调查分析,为掌握北京市性病、艾滋病的流行趋势提供重要的数据,为有关部门制定性病、艾滋病预防控制规划、措施提供科学依据;并在此基础上,以北京市实际调查的统计量数值作为总体参数,采用SAS编程建立模拟总体并做模拟分层三阶段抽样和随机应答过程100次,用本文推导的公式对100个样本进行100次总体参数的点估计和区间估计,通过与实际总体参数的比较,来评价本文研究的调查方法及其统计公式的信度与效度。方法:一、对二项选择敏感问题Warner随机应答模型、二项选择敏感问题Simmons随机应答模型、二项选择敏感问题双无关问题模型和二项选择敏感问题改进的随机应答模型,多项选择敏感问题单一样本随机应答模型、多项选择敏感问题随机间接应答模型以及数量特征敏感问题无关联问题模型、数量特征敏感问题加法模型、数量特征敏感问题乘法模型9种随机应答模型,与三阶段抽样、分层三阶段抽样2种抽样方法组合的共18种调查方法,根据Cochran的经典抽样理论、全概率公式、均数的基本性质、方差的基本性质等概率论与数理统计学理论方法,推导出二分类敏感问题总体比例、多分类敏感问题各类别总体比例、数量特征敏感问题总体均数的估计量及其方差、估计方差的计算公式。二、设计RRT的随机化装置,制定敏感问题的调查问卷,采用二项选择敏感问题Simmons模型、多项选择敏感问题单一样本随机应答模型、数量特征敏感问题加法模型及三阶段抽样、分层三阶段抽样方法,对北京市男男性行为人群的敏感性问题进行调查;并按本文给出的统计公式,对调查资料作统计分析,计算出各类敏感问题总体比例、总体各类别比例、总体均数的估计量及其估计方差。三、按照北京市的区县数、MSM活动场所数、MSM人数,敏感特征实际调查的样本比例、或各类别样本比例、或样本均数作为总体参数,基于蒙特卡洛方法,用SAS编程建立模拟总体。分别对二项选择敏感问题Warner随机应答模型、二项选择敏感问题Simmons随机应答模型、二项选择敏感问题改进的随机应答模型、多项选择敏感问题单一样本随机应答模型以及数量特征敏感问题加法模型、数量特征敏感问题乘法模型等6种RRT模型与三阶段、分层三阶段2种抽样方法组合的12种调查方法,用SAS编程模拟抽样调查100个样本,第一阶段随机抽取3个区县、第二阶段在抽中的3个区县各抽取5个MSM活动场所、第三阶段平均在每个活动场所随机抽取169人(抽样比0.6),合计每个样本共2533人。按本文推导的相应公式计算总体比例、各类别总体比例或总体均数的估计量及其估计方差;分别对100个样本:计算100个(二分类敏感问题)总体比例或(数量特征敏感问题)总体均数的点估计和95%区间估计,来评价本文研究的调查方法及其统计公式的准确性(效度)和精确度(信度)。若100个95%置信区间几乎都包含总体比例、均数,可认为100个样本比例(或样本均数)几乎均接近总体比例(或总体均数),说明该本文研究的(分层)三阶段抽样下RRT调查方法及其统计公式具有良好的效度;又因100个样本比例(或样本均数)均接近相同水平,同时也说明本文研究的(分层)三阶段抽样下RRT调查方法及其公式具有良好的信度。结果:一、本文设计了二项选择敏感问题Warner模型、Simmons模型、双无关问题模型、改进的随机应答模型,多项选择敏感问题单一样本随机应答模型、随机间接应答模型,数量特征敏感问题无关联问题模型、加法模型、乘法模型9种RRT模型与三阶段、分层三阶段2种抽样方法组合的18种调查方法,分别对18种调查方法,推导出敏感问题总体比例、各类别总体比例、总体均数的估计量及其方差、估计方差的计算公式。二、本文对北京市男男性行为人群进行了敏感问题3种随机应答模型下三阶段,分层三阶段抽样调查。分层三阶段抽样得到如下主要初步调查结果:北京市MSM人群首次男男性行为的年龄均数为21.96岁、标准误为0.144岁;男男性行为月人均不同性伴人数2.80人,标准误为0.096人;月人均男男性行为次数为4.85次,标准误为0.559次;最近一次肛交男男性行为安全套全程使用的比例为77.80%,标准误为1.88%;最近一个月男男性行为中从不全程使用安全套、有时全程使用安全套、每次全程使用安全套、没有肛交的比例分别为6.46%、31.78%、51.81%、9.96%,其标准误分别为0.77%、0.71%、0.95%、0.44%;最近一年男男商业性性行为的次均费用<200元、200~399元、400-599元、600元以上、无男男商业性性行为的比例分别为5.65%、4.86%、2.67%、6.48%、80.34%,其标准误分别为0.70%、0.49%、0.57%、0.76%、2.20%;最近一年HIV病毒检测结果为阳性、阴性、结果不确定、没有检查过的比例分别为6.31%、78.67%、2.89%、6.45%,其标准误分别为0.42%、1.96%、0.28%、0.45%;最近一年到正规医疗机构性病检测结果有性病、无性病、结果不确定、没有检查过的比例分别为16.79%、67.02%、6.25%、5.23%,其标准误分别为0.66%、1.98%、0.46%,0.33%;男男性行为的方式为肛交、口交的比例分别为65.83%、18.70%,其标准误分别为0.930%、0.658%;安全套使用有破损的比例为5.50%,其标准误为0.57%。三、对6种RRT模型与三阶段、分层三阶段2种抽样方法组合的12种调查方法进行100次计算机模拟抽样结果如下:1、模拟二分类敏感问题Simmons模型分层三阶段抽样调查北京市MSM人群最近一次肛交安全套全程使用的比例,由样本统计量和样本方差推断的100个总体比例的95%可信区间有99个包含总体比例,且各样本比例均接近总体比例(模拟真值),说明本文研究的二分类敏感问题Simmons模型下(分层)三阶段抽样的调查方法及其统计公式具有良好的信度与效度。2、模拟二分类敏感问题Warner模型分层三阶段抽样调查北京市MSM人群最近一次肛交安全套全程使用的比例,由样本统计量和样本方差推断的100个总体比例的95%可信区间有96个包含总体比例,且各样本比例均接近总体比例(模拟真值),说明本文研究的二分类敏感问题Warner模型下(分层)三阶段抽样的调查方法及其统计公式具有良好的信度与效度。3、模拟二分类敏感问题改进的RRT模型分层三阶段抽样调查北京市MSM人群最近一次肛交安全套全程使用的比例,由样本统计量和样本方差推断的100个总体比例的95%可信区间有97个包含总体比例,且各样本比例均接近总体比例(模拟真值),说明本文研究的二分类敏感问题改进的随机应答模型下(分层)三阶段抽样的调查方法及其统计公式具有良好的信度与效度。4、模拟多分类敏感问题单一样本模型分层三阶段抽样调查北京市MSM人群男男性行为方式,模拟结果显示:对于分类一(肛交),100次模拟中有96次得到的该分类总体比例95%可信区间包含其总体比例。对于分类二(口交),100次模拟中有99次得到的该分类总体比例95%可信区间包含其总体比例。对于分类三(其他),100次模拟中只有97次得到的该分类总体比例95%可信区间包含其总体比例。,说明本文研究的多分类敏感问题单一样本模型下(分层)三阶段抽样的调查方法及其统计公式具有良好的信度与效度。5、对数量特征敏感问题加法模型,100个总体均数的95%可信区间均包含总体均数,且各样本均数均接近总体均数(模拟真值),说明本文研究的数量特征敏感问题加法模型下(分层)三阶段抽样的调查方法及其统计公式具有良好的信度与效度。6、对数量特征敏感问题乘法模型,100个总体均数的95%可信区间均包含总体均数,且各样本均数均接近总体均数(模拟真值),说明本文研究的数量特征敏感问题乘法模型下(分层)三阶段抽样的调查方法及其统计公式具有良好的信度与效度。结论:1、本文分别对敏感问题9种随机应答模型与三阶段、分层三阶段2种抽样方法组合的共18种调查方法,从数学上首次推导出敏感问题特征总体比例、总体各类别比例、总体均数的估计量及其方差、估计方差的统计公式,并成功应用于北京市男男性行为人群这一性病、艾滋病高危人群的敏感问题调查分析,取得了良好的实际应用效果。说明本文研究的调查方法及其统计公式科学且具有较大的理论和实际意义。2、应用本文研究的敏感问题RRT分层三阶段抽样调查分析结果提示:北京市男男性行为人群存在无固定性伴、肛交为主要性行为方式、全程使用安全套比例低、男男商业性性行为比例高(高达19.66%),未进行HIV病毒检测(达到6.54%)与未进行性病检测(达5.23%)比例高、安全套破损比例高(达到5.50%)等艾滋病、性病高危性行为,性病艾滋病的防控形势不容乐观,应引起政府、卫生部门的高度重视,寻找合理的应对措施。3、分别对6种RRT模型与三阶段、分层三阶段2种抽样方法组合的12种调查方法,进行100个样本的计算机模拟抽样与RRT调查,结果显示100个置信区间几乎都包含总体参数,说明本文研究的敏感问题调查方法及其公式具有良好的信度和效度。
【作者】范玉波;
【导师】高歌;
【作者基本信息】苏州大学,流行病与卫生统计学,2013,博士
【关键词】敏感问题;随机应答技术(RRT);(分层)三阶段抽样;艾滋病;男男性行为;蒙特卡洛方法;效度与信度;

【参考文献】
[1]徐飞.运用定量化结构分析方法揭示致矿侵入体形成过程[D].中国地质大学(北京),地质工程,2014,硕士.
[2]郑越.基于iOS平台的电子漫画软件的设计与实现[D].北京交通大学,2014.
[3]谢振华.Exendin-4对小鼠异种胰岛细胞移植存活影响的实验研究[D].宁波大学,外科学,2014,硕士.
[4]池诏丞.大鼠肝脏缺血预处理中一氧化氮和内皮素对微循环的调节作用[D].吉林大学,外科学,2004,硕士.
[5]宋晨雪.多层钢结构住宅标准节点库的研发[D].太原理工大学,结构工程,2004,硕士.
[6]王冬浩.表面活性剂APG对Pb污染土壤的淋洗修复与淋洗液的回收研究[D].河北科技大学,环境工程,2013,硕士.
[7]刘国强,谭廷栋.声波和密度测井资料的井径校正[J].石油地球物理勘探,1993,02:232-240+248.
[8]丁丽霞.浙江省海涂土壤资源利用动态监测及其系统的设计与建立[D].浙江大学,2005.
[9]周春华.论网页的视觉流程[D].北京林业大学,设计艺术学,2013,硕士.
[10]谷菲菲.人文性视角下初中文言文教学策略研究[D].河北师范大学,学科教学,2014,硕士.
[11]陶国新.基于HIV-1蛋白酶结构的非肽抑制剂的全新分子设计与合成[D].中国协和医科大学,2001.
[12]吴秀勤.贯彻国务院《质量振兴纲要》争创建材名牌提高建材质量[J].四川建材.1998(01)
[13]张振戎,张文辉,卢庆春.加氢反应器的发展历史[J].一重技术.2004(01)
[14]王建伟,厉晓强,单伟光.恩替卡韦关键中间体的合成工艺改进[J].浙江工业大学学报,2013,01:57-60.
[15]张成菊,卜万庆.某边坡支护肋板锚杆挡墙设计与施工[J].重庆建筑.2003(02)
[16]张超.基于马尔可夫链的组合预测模型[D].辽宁工程技术大学,应用数学,2012,硕士.
[17]刘阳.堆载作用下黄土冲沟区桥梁桩基础竖轴向承载特性研究[D].长安大学,岩土工程,2014,硕士.
[18]余晖.热界面材料的制备及其导热性能的研究[D].清华大学,2012.
[19]莫雪娟.基于DSP的电梯门机伺服控制系统设计与研究[D].杭州电子科技大学,计算机系统结构,2011,硕士.
[20]杨山红.基于光纤传感的地应力检测及区域油水井套损监测的研究[D].哈尔滨工业大学,机械工程,2013,硕士.
[21]范心明,管霖,夏成军,饶宏,许树楷,李立浧.基于PCHD模型的柔性直流输电鲁棒控制[J].电力系统自动化,2013,15:40-46.
[22]吴绪略,曹强,曲秀丽.浅述数据库的现状与未来[J].山东电子,2001,01:3-5.
[23]钱露.唐代诗歌数量词英译策略研究[D].华中科技大学,英语语言文学,2013,硕士.
[24]蔡致新.聚(氨酯—乙烯基咪唑)共聚物/石墨烯纳米复合材料的制备[D].上海交通大学,2011.
[25]杨丽丽.我国保险公司银行保险业务风险管理研究[D].新疆财经大学,金融学,2013,硕士.
[26]李海源.150kb人参大片段DNA转化灵芝的研究[D].吉林农业大学,生物化学与分子生物学,2012,硕士.
[27]任帅.平行四边形的弦长分布[D].武汉科技大学,应用数学,2012,硕士.
[28]邵帅.局部冲刷影响下水中沉井基础的承载性能研究[D].西南交通大学,工程力学,2013,硕士.
[29]李超.船舶轴带发电机中无功补偿技术的研究[D].大连海事大学,轮机工程,2013,硕士.
[30]白云.知识产权滥用的反垄断法律规制研究[D].北京交通大学,2014.
[31]季娜.城市热岛效应及其减缓策略研究[D].河北科技大学,环境科学与工程,2014,硕士.
[32]杜一平,梁逸曾,貟栋.烷烃保留指数与结构关系的数据挖掘[J].计算机与应用化学,2002,03:239-241.
[33]赵枝凯.机器人辅助远程骨科手术时延控制研究[D].哈尔滨工业大学,机械工程,2013,硕士.
[34]杨欢.20世纪80年代中国艺术歌曲的发展概况与演唱研究[D].华南理工大学,音乐(专业学位),2014,硕士.
[35]裴励.中国石化合同准备管理系统的设计与实现[D].山东大学,软件工程(专业学位),2013,硕士.
[36]姬春慧.基于神经网络的船用锅炉控制算法研究[D].大连海事大学,轮机工程,2004,硕士.
[37]李炜.上市国有公司思想政治教育创新研究[D].中北大学,思想政治教育,2013,硕士.
[38]王振全.城市危险化学品物流配送网络可靠性研究[D].东北大学,安全技术及工程,2010,硕士.
[39]张招磊.右旋佐匹克隆片的制备工艺及质量评价[D].黑龙江中医药大学,药学,2014,硕士.
[40]王赂.科学发现学习环境的概念设计研究[D].扬州大学,教育技术学,2011,硕士.
[41]王爽.马克思人学视野下文化人的生成研究[D].河北师范大学,马克思主义基本原理,2014,硕士.
[42]王文玲.初中藏语文教材浅层句法分析[D].西北民族大学,语言学及应用语言学,2012,硕士.
[43]徐鑫雨.Changes in Content and Design: an Empirical Study on MTI Students’ Resume Translation in a Technical Writing Course[D].西安外国语大学,MTI翻译,2014,硕士.
[44]孙健.晚明主情思潮的嬗变[D].西安音乐学院,音乐美学,2014,硕士.
[45]张斌.基于GSA的数据挖掘在电力系统不良数据辨识中的应用[D].南京理工大学,2004.
[46]任方.基于贝叶斯网络与BP网络的混合分类器研究[D].山西财经大学,计算机应用技术,2014,硕士.
[47]吴清华.附子原植物乌头土壤微生态特征的初步研究[D].成都中医药大学,生药学,2012,硕士.
[48]刘静.基于知识管理的期刊管理初探[J].河北科技图苑,2005,05:59-61.
[49]陈洁.政府网络新闻发言人研究[D].苏州大学,新闻与传播(专业学位),2014,硕士.
[50]杨丹.分布式协同地理建模任务接口的图形化定制研究[D].中国矿业大学,地图学与地理信息系统,2014,硕士.

相关推荐
更多