认知无线电中智能学习技术研究

认知无线电中智能学习技术研究

作者:师大云端图书馆 时间:2015-09-01 分类:期刊论文 喜欢:2790
师大云端图书馆

【摘要】在当今世界经济和社会发展信息化的潮流中,无线通信技术得到了迅速发展,各种无线业务和应用以惊人迅速增长,新的无线通信及网络技术不断涌现。无线通信和网络蓬勃发展的同时,其高速和宽带化特征使得对频谱资源的需求日益加大,同时也使得频谱资源的供需矛盾问题日益突出。认知无线电提出的从固定频谱使用到动态频谱使用的变革可有效地提高频谱利用率;同时,认知无线电强调的高度智能性符合无线通信系统和网络的发展方向。本论文关注认知无线电智能性体现的最重要环节——学习,在离线学习和在线学习两个方面开展研究,主要完成了以下具有创新性的研究成果:1.提出一种通用的CR离线学习与决策框架,在此框架下研究神经网络(NN)和最小二乘支持向量机(LSSVM)两种学习方法的具体应用。在NN方面,提出了“直接的”径向基函数神经网络(RBF-NN)学习与决策方法;与传统“间接的”方法相比,通过在学习训练前增加优化案例搜索处理,减少了输入及输出神经元数量,降低了训练的复杂度;并可直接完成配置参数决策,提高决策实时性。在LLSVM方面,从复杂度、性能等方面对比研究了CR场景下的几种多分类LSSVM;研究了非支配排序遗传算法完成LSSVM超参数搜索以提高学习算法的普适性。仿真结果表明,RBF-NN和LSSVM方法都能提升认知无线电系统性能,非支配排序的遗传算法能够在较少进化代数内搜索出合适的超参数,基于LSSVM的离线学习具有更好的决策性能和泛化性能。2.提出一种能促进多用户学习收敛的,基于用户聚类和可变学习速率的多Agent强化学习方法,以解决多用户在下垫式频谱共享下的信道选择与功率分配问题。首先使用分层处理分离信道选择与功率控制,采用快速最优信道搜索结合基于性能预测的用户数均衡调节方法实现信道分配;其次,使用随机博弈框架对多用户功率控制问题进行建模,引入K均值用户聚类减少博弈参与用户数量和降低单个用户的环境复杂度,并提出可变Q学习速率和策略学习速率的方法进一步促进多Agent强化学习的收敛。仿真结果表明,该方法能使多个用户的功率状态和总收益有效收敛,并且获得整体性能达到次优。3.提出了一种在总功率资源受限条件下基于纳什议价解的方法,用于多信道多用户的信道选择与功率分配。设计了合理的纳什议价效用函数,使纳什乘积能明确表征认知无线电系统的性能指标,并证明了纳什议价解的存在性与唯一性。提出基于梯度下降思想和性能变化预测的具体迭代议价过程完成信道与功率的分配。理论分析与仿真结果表明,基于纳什议价的功率分配满足全局比例公平,信道与功率分配的迭代算法能够得到较好性能,达到系统总性能的次优解。4.提出协作去耦合方法和跨层联合方法解决多跳认知无线网络的多层资源分配问题。协作去耦合方法首先单独完成路径选择任务,随后进行信道与功率的博弈分配;跨层联合方法则通过博弈直接对路径、信道、功率三层资源进行同时分配。两种方法都综合考虑网络层、MAC层、物理层的启发原则,引入了节点被干扰度信息和节点主动干扰度信息来辅助路径的选择;设计了基于功率允许宽度信息的Boltzmann探索来完成信道与功率选择;设计了长链路和瓶颈链路替换消除手段以进一步提高网络性能。从促进收敛角度,选用序贯博弈方法,并设计了具体的博弈过程;此外还分析了博弈的纳什均衡,讨论了两种算法的复杂度。仿真结果表明,协作去耦合方法和跨层联合方法在成功流数量、流可达速率、发射功耗性能指标上均优于简单去耦合的链路博弈、流博弈方法。5.提出一种无需信息交互的多用户自主Q学习方法,用于实现认知无线电中的多用户动态频谱访问。该方法采用自学习方案,每个认知无线电用户不需要耗费通信资源与其他用户进行信息交互,仅通过观察自己的回报进行强化学习,定义的回报值能反应信道优劣以及信道冲突状态;设计了充分探索、倾向优势信道、冲突惩罚的学习策略,实现多用户多信道的动态频谱访问。对2用户2信道的场景,提出一种快速学习算法并证明了它能够收敛到整体回报最大。仿真结果表明,该方法能使认知无线电多用户多信道选择以大概率收敛到纳什均衡,且得到高的整体回报性能。
【作者】伍春;
【导师】于全;易克初;
【作者基本信息】西安电子科技大学,军事通信学,2014,博士
【关键词】认知无线电;机器学习;博弈论;多Agent强化学习;资源分配;

【参考文献】
[1]张春艳.黄酮类化合物抗LDL氧化、下调LOX-1表达、抑制肝癌细胞增殖及构效关系研究[D].大连医科大学,生物化学与分子生物学,2012,硕士.
[2]贺勇.夏热冬暖地区多层居住建筑碳排放及减排研究[D].华侨大学,管理科学与工程,2013,硕士.
[3]朱建华.分布式数据同步采集系统的设计与实现[D].安徽大学,通信与信息系统,2014,硕士.
[4]封娇.基于CA-Markov模型的老河口市土地利用格局变化研究[D].华中师范大学,人文地理学,2014,硕士.
[5].中国农村改革与发展的探寻者——黄祖辉[J].世界农业,2014,01:189-190.
[6]王璐.人尿激肽酶原对急性脑梗死侧枝循环与金属基质蛋白酶的影响[D].吉林大学,临床医学,2014,硕士.
[7]李大勇.河北省坝上地区生物多样性评价[D].内蒙古农业大学,林业,2013,硕士.
[8]周欣.激流式生物反应器大规模培养IBDV及制备高效灭活疫苗的研究[D].河南农业大学,预防兽医学,2012,硕士.
[9]侯绪云.阿尔都塞“理论的反人道主义”研究[D].黑龙江大学,文化哲学,2013,硕士.
[10]姚欣.CHEG集团薪酬管理诊断与研究[D].电子科技大学,工商管理(专业学位),2012,硕士.
[11]冯智博.子宫动脉栓塞术在前置胎盘孕妇引产前应用的疗效观察[D].广西医科大学,介入放射学(专业学位),2013,硕士.
[12]周明.初中VB教学中任务驱动教学法的应用[D].山东师范大学,教育,2012,硕士.
[13]邱娟.柴胡疏肝散及拆方对抑郁模型大鼠行为学和脑组织p38MAPK、ERK5表达的影响[D].中南大学,中西医结合临床,2014,博士.
[14]师生波,贲桂英,韩发.不同海拔地区紫外线B辐射状况及植物叶片紫外线吸收物质含量的分析[J].植物生态学报,1999,06:529-535.
[15]唐伟伟.学龄期骨折患儿气质特征对早期功能锻炼依从性影响的分析[D].青岛大学,护理学,2013,硕士.
[16]朱秋霞.某镇政府村庄社区化管理试点实施策略研究[D].北方工业大学,工商管理,2014,硕士.
[17]周明,李光福.QJG-100-1型气体标准体积管[J].油田地面工程.1991(04)
[18]刘洋.肝癌肿瘤细胞的电化学阻抗传感器的制备及应用[D].哈尔滨工业大学,2012.
[19]王培培.手机媒体对大学生思想道德教育的影响及其对策研究[D].首都师范大学,思想政治教育,2014,硕士.
[20]郭家义.个性化最新资料快报服务系统相关问题研究[J].现代图书情报技术,2003,03:64-66+75.
[21]肖伟栋.含分布式电源的配电网保护方案研究[D].北京交通大学,2014.
[22]吕君,柴国钟,顾盛挺,鲍雨梅.激光熔覆颗粒增强复合涂层微观损伤模型[J].中国激光,2013,02:90-97.
[23]王学栋.济南正昊化纤营销战略研究[D].大连理工大学,工商管理,2003,硕士.
[24]高文静.基于时空特征的人体动作识别方法研究[D].燕山大学,计算机应用技术,2013,硕士.
[25]王晓霞.试论冷战后美国对外政策中的霸权稳定论[D].湘潭大学,国际关系,2003,硕士.
[26]郭娅棣.兰索拉唑对2型糖尿病患者血糖及胃泌素的影响[D].青岛大学,内分泌与代谢病,2013,硕士.
[27]葛家琪,王树,梁海彤,张爱林,张国军,管志忠,杨霄.2008奥运会羽毛球馆新型弦支穹顶预应力大跨度钢结构设计研究[J].建筑结构学报,2007,06:10-21+51.
[28]赵华.宁夏地区村镇银行发展现状与前景展望[D].宁夏大学,工商管理(专业学位),2014,硕士.
[29]李晓峰.利用数据挖掘提升税源监管水平[J].辽宁经济,2005,12:107.
[30]李绍艳.《玛丽·巴顿》中慈善叙事的“伦理取位”研究[D].燕山大学,英语语言文学,2013,硕士.
[31]刘兴华.博弈论视角:地方政府征地补偿机制研究[D].辽宁大学,行政管理,2012,硕士.
[32]张坤.基于8051F410的蒸渗仪测控系统的研制[D].西安科技大学,测试计量技术及仪器,2014,硕士.
[33]马特.中国南海的策略研究[D].浙江大学,中国学,2013,硕士.
[34]高向飞.直驱型风力发电系统机侧三电平变换器及其控制技术研究[D].内蒙古工业大学,电力电子与电力传动,2013,硕士.
[35]汪树生.浅谈火灾隐患的认定[J].智能建筑.2005(09)
[36]赵扬.ZrC-W复合材料的反应金属熔渗制备与组织演变[D].哈尔滨工业大学,材料工程,2013,硕士.
[37]曾小周.儿童注意缺陷多动障碍相关危险因素及事件相关电位P300研究[D].广州医科大学,流行病与卫生统计学,2014,硕士.
[38]傅轶娜.基于MapReduce和遗传算法的粗糙集属性约简研究[D].安徽大学,软件工程,2014,硕士.
[39]傅斌.嘉陵江回水区水体氮赋存形态特征及硝酸还原酶活性研究[D].重庆大学,市政工程,2014,硕士.
[40]赵光士.水利水电工程三维图形建模研究[D].清华大学,水利工程,2013,硕士.
[41]张乃超,张雪磊,陆仁诚.铁路公共信息标志的标准化管理[J].上海铁道科技.2001(02)
[42]吴苏蔓.高速移动环境下MIMO无线信道的建模及仿真[D].杭州电子科技大学,电子与通信工程,2011,硕士.
[43]张益林.俄英动词体时系统及其用法对比研究[D].华中师范大学,俄语语言文学,2014,硕士.
[44]高佳.盐酸决奈达隆原料药及其薄膜包衣片的质量控制研究[D].河北医科大学,药物分析学,2013,硕士.
[45]刘智敏.不确定度最新进展[J].宇航计测技术.1990(06)
[46]郭少红.归国初中生文化适应的跨文化研究——北京市中关村科技园区个案研究[D].中央民族大学,教育学原理,2004,硕士.
[47]石兴念.城市轨道交通线网规划方法研究与实践[D].北京交通大学,2013.
[48]李大达,杨沙沙,廖立雄,霍乃礼,许传志.铁合金炉上料微机控制系统[J].冶金自动化,1987,02:8-11+16.
[49]徐志成,钟伟荣.更正:C60轰击石墨烯的瞬间动力学[物理学报2014,63,083401][J].物理学报,2014,11:476.
[50]谌苗苗.野蚕基因组研究Ⅰ[D].沈阳农业大学,特种经济动物饲养,2014,硕士.

相关推荐
更多