高维数据变量选择的几点研究

高维数据变量选择的几点研究

作者:师大云端图书馆 时间:2015-12-12 分类:期刊论文 喜欢:3386
师大云端图书馆

【摘要】变量选择是高维数据分析的一个重要研究问题,而对似然函数加一个惩罚项是近些年使用最为广泛的变量选择方法。惩罚似然方法的提出始自上世纪六七十年代,但直到上世纪九十年代,统计学家才开始系统地研究惩罚似然方法的理论性质,其中研究较多的是线性模型和广义线性模型。针对具有重要实际应用背景的生存分析模型鲜有突破性的理论性质,其中的困难主要来源于生存分析数据的删失特征。本论文的一部分内容是针对生存分析模型研究惩罚似然方法的理论性质,主要研究了生存分析中最重要的Cox模型下惩罚似然估计量的oracle性质。我们在计数过程框架下研究高维、非齐次变量的Cox模型,在证明定理时,所加的正则条件仅加在真实的回归参数上,从而使得条件更自然,这有别于文献中其他方法所加条件。在实际应用中,人们更感兴趣的是如何快速有效地获得合适的参数估计。近十几年来人们提出了各种算法,大部分可以归结为路径算法。似然惩罚估计量的求解是一个最优化问题,对于凸惩罚其算法相对简单,而对于非凸惩罚的算法往往复杂多了。我们在第三章中提出了一种新的路径算法,该方法与文献中已有方法的优点是,可以更容易找到全局最优解。可以针对凸惩罚和非凸惩罚都得到有效的路径解。通过数值计算比较发现新提出的算法在计算效率上与现有方法有较大的优势。路径算法提供了一系列的解,必须从中选择最优的解,而针对低维数据的传统方法不适用于高维数据。大多数针对高维数据的前人工作是基于修正信息类准则,本文的第四章和第五章对交叉验证方法(一类数据驱动的方法)进行修正以分别应用于线性模型和广义线性模型,并证明了所得方法具有相合性,大量的模拟研究及实际数据分析结果证实了所提方法的有效性。
【作者】于怡;
【导师】应志良;
【作者基本信息】复旦大学,概率论与数理统计,2013,博士
【关键词】高维数据;变量选择;惩罚似然估计;Cox模型;路径解;交叉验证;

【参考文献】
[1]李峰.考试应激状态下人体肺活量、血压及体成分的变化研究[D].沈阳师范大学,体育教育训练学,2013,硕士.
[2]杨青云.新时期文学中的“藏地书写”[D].西南大学,中国现当代文学,2013,硕士.
[3]何永华,李朝銮.攀枝花苏铁种群生态地理分布、分布格局及采挖历史的研究[J].植物生态学报,1999,01:24-31.
[4]刘志杰.猪链球菌荚膜多糖基因簇的分析及血清型分子检测方法的建立[D].中国疾病预防控制中心,病原生物学,2014,博士.
[5]张媛.探讨不同体位喉罩充气容积与气囊内压的变化[D].吉林大学,临床医学,2014,硕士.
[6]宋彩玲.前列地尔对体外循环下心脏瓣膜置换术患者肺损伤的保护作用[D].河北医科大学,外科学,2014,硕士.
[7]袁自豪.多芳环新烟碱杀虫剂的合成、生物活性及稳定性研究[D].华东理工大学,植物保护,2014,硕士.
[8]苏颖超.地方普通高校绩效津贴管理的优化研究[D].内蒙古农业大学,公共管理,2013,硕士.
[9]代德建.四川长虹信息化建设初探[D].西南财经大学,2003.
[10]陈伟.基于客户细分的保险电销保费提升的实证分析[D].浙江工商大学,保险,2013,硕士.
[11]王方权.碳纤维填充聚合物多组分导电高分子复合材料的研究[D].浙江大学,2011.
[12]刘月,余林,魏志钢,潘湛昌,邹燕娣,谢英豪.稀土金属掺杂对锐钛矿型TiO_2光催化活性影响的理论和实验研究[J].高等学校化学学报,2013,02:434-440.
[13]李肖利.我国独立学院法人治理结构研究[D].信阳师范学院,马克思主义基本原理,2014,硕士.
[14]韦巍.年龄对房间隔缺损患者临床表现及其经皮导管封堵治疗的影响[D].广西医科大学,心血管内科(专业学位),2013,硕士.
[15]苏明扬.质谱于环境中农药残留快速检测中的应用[D].浙江理工大学,应用化学,2014,硕士.
[16]杨杰.东昆仑南缘布青山地区晚古生代洋壳型构造岩块地质特征及其构造属性研究[D].长安大学,构造地质学,2014,硕士.
[17]张茜茜.1899-1901年英国对华政策[D].安徽大学,世界史,2014,硕士.
[18]王新明.小麦秸秆冻融—酸碱相结合的预处理工艺研究[D].陕西科技大学,发酵工程,2013,硕士.
[19]葛乐,杨志超,胡波,朱辉,龚灯才,资斌.面向复杂工况的输电线路本体结构安全评价[J].电力系统自动化,2013,20:108-113.
[20]李卫朝.对中国现代化认识的一个侧面[D].华东师范大学,中国哲学,2004,硕士.
[21]许文.全髋关节置换术治疗髋关节病的疗效观察[D].吉林大学,临床医学,2014,硕士.
[22]陈海燕.子宫内膜癌中抑癌基因甲基化及其表观遗传调控的研究[D].山东大学,病理学与病理生理学,2013,硕士.
[23]陈继,李凯,周健.基于黑板的自治代理协同入侵检测系统模型[J].计算机与数字工程,2004,03:59-62.
[24]彭云.GPS电离层模型及其影响因素研究[D].中国地质大学(北京),测绘工程,2014,硕士.
[25]朱亮.基于马尔科夫随机游走模型的query-doc关联挖掘[D].吉林大学,计算机软件与理论,2014,硕士.
[26]托合提江·拜合提.单壁碳纳米管(SWCNTs)电子特性研究[D].新疆大学,2014.
[27]张静静.男性时尚杂志护肤品广告的男性形象构建研究[D].上海外国语大学,新闻学,2013,硕士.
[28]陆芳.学龄前儿童情绪调节策略的发展及其相关研究[D].华东师范大学,发展与教育心理学,2004,硕士.
[29]孙家昊.嵌入式磨削加工表面质量图像检测系统关键技术研究[D].浙江理工大学,信号与信息处理,2013,硕士.
[30]李丁.两类多步骤细分格式的构造和分析[D].河北师范大学,计算数学,2013,硕士.
[31]关杰敏.铁皮石斛良种繁育与GAP种植关键技术研究[D].广州中医药大学,中药学,2014,博士.
[32]牛长华.老龄化背景下我国社区养老服务问题研究[D].山东财经大学,社会保障学,2012,硕士.
[33]张亮.松辽盆地萨北三区沉积微相特征及对储层压裂效果影响研究[D].东北石油大学,石油与天然气工程,2014,博士.
[34]武云甫,罗惠威,花睿.住宅楼梯间采暖刍议[J].中国住宅设施.2003(06)
[35]刘述煌.涡轮盘用高温合金材料的超声检测方法研究[D].南昌航空大学,测试计量技术及仪器,2013,硕士.
[36]钱思伟.基于价值感知的手机管理应用交互研究与设计[D].湖南大学,设计学,2014,硕士.
[37]靳晓飞,张良,张欣.纯电驱动整车控制器XCP标定系统的研究与开发[J].汽车工程学报,2014,05:364-371.
[38]申瑞坤.曾燠交游诗研究[D].河北师范大学,中国古代文学,2013,硕士.
[39]徐伟勇.城市污水处理厂尾水中磷的形态分析及除磷研究[D].浙江工业大学,2009.
[40]王方方.凹凸棒石改性及胶体性能研究[D].兰州理工大学,环境工程,2014,硕士.
[41]余多.梅山文化园道路景观设计及其地域性文化表达[D].湖南大学,设计学,2011,硕士.
[42]徐慧明.基于中性点短时投切低阻方法的中压电网单相接地故障选线的研究[D].合肥工业大学,电力系统及其自动化,2003,硕士.
[43]杨长辉.制造企业快速反应理论及应用研究[D].中南大学,2004.
[44]胡晓燕.美化之艺术在许译李白诗歌的再现[D].延安大学,外国语言学及应用语言学,2014,硕士.
[45]贾晓清.发展中国家童工问题研究[D].武汉科技大学,社会保障,2012,硕士.
[46]霍秀敏.新课程标准下初中化学课堂有效教学的研究[D].内蒙古师范大学,教育(专业学位),2013,硕士.
[47]刘思佳,庄圣贤,谢茂军.基于调制比定向偏移控制的孤岛检测方法[J].电力系统自动化,2015,03:132-139.
[48]孙萌萌.BK公司采购管理研究[D].河北大学,工商管理(专业学位),2014,硕士.
[49]张巍巍.聚乙烯醇与碳纳米管共混体系的薄膜材料制备及其性能研究[D].苏州大学,2010.
[50]温磊.基于有向项集图的关联规则挖掘算法研究与应用[D].天津大学,2004.

相关推荐
更多