信息检索中虚拟域重排技术的研究与实现

信息检索中虚拟域重排技术的研究与实现

作者:师大云端图书馆 时间:2017-10-09 分类:参考文献 喜欢:2965
师大云端图书馆

【摘要】随着Web技术的发展,人们对于信息的需求也与日俱增。用户希望获得信息的渠道和方式更加便捷和高效,尤其是在搜索信息时,期望所需求的信息尽量排在前边,这便是SEO(SearchEngineOptimization,搜索引擎优化)问题。检索结果重排序技术的研究是SEO课题一个重要的分支,且该技术的研究也趋于多样化。近几年在查询扩展中提出了虚拟域概念,取得了很好的效果,构成虚拟域的方法有许多种,但由于计算虚拟域的工作量巨大,一般只能使用一种方法进行查询扩展,不能同时综合使用几种方法,有一定的局限性。本文提出一种新的重排序模型,将虚拟域概念应用于重排方法,重排只针对初次检索结果若干文档进行,综合运用多种虚拟域提高了重排性能。基于虚拟域的重排模型,是用多种查询词运算构成多个虚拟域,通过线性插入法综合多个虚拟域计算待排序文档(初次检索结果前k个文档)与查询的新的相关度,依据相关度给出新的排序。根据查询词运算符or、and、gram和phrasal设计和实现了查询词映射和构建虚拟域的算法。相关度的计算是基于传统的BM25,在其基础上实现了虚拟域重排模型。研究分析了or、or-and、or-gram、or-and-gram、or-and-gram-phrasal等5种组合的虚拟域计算方法对重排序的影响,结合已有的经验,通过大量的实验优化了模型中各个参数。本文创新之处在于结合多种运算来计算虚拟域,突破了原来单一运算符的局限,这种方法得到的文档与查询的相关度更为准确。在多个TREC集上进行了实验,实验结果表明本文所提出的模型能够有效地提高重排性能。
【作者】丁凯朝;
【导师】王俊义;
【作者基本信息】内蒙古大学,计算机科学与技术,2014,硕士
【关键词】信息检索;语言模型;虚拟域;BM25;重排序;

【参考文献】
[1]田里.突破“三种唱法”划分的声乐教学研究[D].湖南师范大学,课程与教学论,2004,硕士.
[2]李晓敏.国内投资与FDI对山东省产业结构影响的实证研究[D].青岛理工大学,数量经济学,2013,硕士.
[3]李智慧.《吴郡文编》研究[D].苏州大学,中国古代文学,2014,硕士.
[4]梁治.中国工笔人物画的装饰语言与技法研究[D].湖南师范大学,美术学,2013,硕士.
[5]孙宝骏,吴凡,许广昀,陈磊,徐志伟,赵亚娣,王航,张斌.氧化石墨烯薄膜的自组装制备与伽玛射线辐照还原[J].辐射研究与辐射工艺学报,2013,06:26-31.
[6]王文元.费米超流气体的自俘获及其朗道-齐纳隧穿现象[D].西北师范大学,理论物理,2013,硕士.
[7]许欣雪.金隅股份吸收合并太行水泥的并购绩效研究[D].湖南大学,会计,2013,硕士.
[8]杨舒航,董媛媛.2013年中国互联网治理研究四大议题[J].青年记者,2014,17:22-23.
[9]王小龙.美用石墨烯开发出超强防锈材料[N].科技日报,2012-06-02002.
[10]苑亦男.石墨烯/氢氧化镍复合电极材料的制备及其超级电容器性能研究[D].哈尔滨工业大学,材料工程,2014,硕士.
[11]马腾.IL-18在乳腺癌及NSCLC中的表达及与IL-10的相关性[D].泰山医学院,肿瘤学,2012,硕士.
[12]李曲,龙昊.SAT-TC:基于关联的层次文档聚类[J].计算机科学,2004,07:178-180.
[13]王玉博.辽阳共青团门户网站的设计与开发[D].吉林大学,软件工程,2012,硕士.
[14]李松.我国环保产业投融资体制创新研究[D].重庆大学,工商管理,2003,硕士.
[15]薛永红.论刑事诉讼回避制度的完善[D].辽宁大学,法律,2012,硕士.
[16]谢川,倪世宏,张宗麟.一种缺失飞行参数预处理的新方法[J].计算机仿真,2005,04:27-31.
[17]贾新春,郑南宁,张元林.线性不确定时滞系统的可靠保性能鲁棒控制[J].自动化学报,2003,06:971-975.
[18]杨绍国,周熙襄.Zoeppritz方程的级数表达式及近似[J].石油地球物理勘探,1994,04:399-412+534.
[19]郭文光.现阶段我国政府官员与网络媒体关系研究[D].华中师范大学,政府公共管理,2013,硕士.
[20]李松.海相碳酸盐岩层系钻井液漏失诊断基础研究[D].西南石油大学,油气井工程,2014,博士.
[21]傅林婉.我国农村社会保障制度财政扶持现状分析与完善对策[D].河北大学,社会保障,2014,硕士.
[22]曾东柱.多杀性巴氏杆菌HN06株新型免疫蛋白的鉴定及PGAM免疫功能研究[D].华中农业大学,预防兽医学,2014,硕士.
[23]方星.大豆悬浮细胞培养及作为外源基因转化受体的研究[D].苏州大学,遗传学,2014,硕士.
[24]李宏,蔡之华.应用于空间关联规则挖掘的ILP方法[J].计算机工程与应用,2003,16:188-191+197.
[25]靳方建.电连接器接触件可靠性分析与高温插拔试验[D].浙江理工大学,机械设计及理论,2013,硕士.
[26]刘显艳.语言培训机构雅思/托福留学备考课程设计探究[D].华中师范大学,教育学,2013,硕士.
[27]嵩山木子.巴托克《小宇宙》的研究[D].中国音乐学院,音乐学,2014,硕士.
[28]王金飞.政府干预、治理结构与企业过度投资行为[D].山东财经大学,会计学,2013,硕士.
[29]彭英.CRM管理及其在电信企业信息化管理中的应用——镇江电信客户关系管理问题研究[D].南京理工大学,2002.
[30]逄锦荣.建筑施工图与工程概预算的一体化研究[D].辽宁工程技术大学,管理科学与工程,2004,硕士.
[31]高舒芳.柴油机冷却水套内不同冷却液流场的CFD分析[D].中北大学,动力机械及工程,2013,硕士.
[32]杨爱民,张文祥,王新辉.航空救生试验仿真系统的设计与实现[J].计算机仿真,2004,09:37-39.
[33]高福刚.Al-Si(Zr)/Gr耗散防热复合材料的性能和耐烧蚀机理研究[D].哈尔滨工业大学,材料工程,2014,硕士.
[34]张琪瑛.氢化和氟化石墨烯材料的第一性原理研究[D].烟台大学,2012.
[35]卢忠良.基于多类的汉语文本自动分类研究[D].中国人民解放军国防科学技术大学,2002.
[36]王湛宇.业务流程在PaaS平台上的设计与实现[D].西安电子科技大学,计算机应用技术,2011,硕士.
[37]孟丹.软件统一性能测试模型的构建与应用[D].西安电子科技大学,计算机技术,2011,硕士.
[38]宋红丽.一维可压Navier-Stokes方程自由边值问题全局强解存在性和解的边界行为[D].西北大学,基础数学,2013,硕士.
[39]张珈铭,刘坚,周观根.大跨度空间钢结构抗震及施工模拟分析研究展望[J].华南地震,2014,S1:43-48.
[40]李杰.基于钴基非晶微带MI磁敏元件的制作[D].中国科学技术大学,材料物理与化学,2014,硕士.
[41]侯汉清,薛春香.用于中文信息自动分类的《中图法》知识库的构建[J].中国索引,2005,03:31-36.
[42]魏萌.“仁爱孝悌”文化在影视广告中的应用研究[D].西南交通大学,传播学,2013,硕士.
[43]王琼.论乔治·爱略特前期创作中的心理分析艺术[D].上海师范大学,比较文学与世界文学,2004,硕士.
[44]郭甦.区间直觉正态模糊集结算子及其在多属性决策中的应用[D].安徽大学,运筹学与控制论,2014,硕士.
[45]王凡.模块化组织中第三方支付企业提升顾客价值的实证研究[D].山东财经大学,企业管理,2014,硕士.
[46]周敬波.家蚕核型多角体病毒泰国株的鉴定及其bro基因家族分析[D].安徽农业大学,生物化学与分子生物学,2012,硕士.
[47]齐晓明.英首次将石墨烯变成绝缘体[J].成才之路,2011,31:93.
[48]孙艳茹.论《吕氏春秋》之阴阳五行说[D].河北师范大学,中国古典文献学,2012,硕士.
[49]丁建文.从案件实务看违约责任与侵权责任的竞合[D].兰州大学,民商法,2012,硕士.
[50]周茹薪.论文化顺应在品牌名称翻译中的动态作用[D].安徽大学,英语语言文学,2004,硕士.

相关推荐
更多