基于微博信息分析对旅游景点热度预测系统的设计与实现

基于微博信息分析对旅游景点热度预测系统的设计与实现

作者:师大云端图书馆 时间:2021-10-30 分类:硕士论文 喜欢:1713
师大云端图书馆

【摘要】微博作为目前最流行的社会化网络媒体,其对旅游景点热度预测方面有一定的作用和意义,不仅可以帮助用户在选择游玩景点时提供决策参考的价值,还可以帮助商家给用户提供个性化的旅游景点推荐,甚至在预防突发事件的发生上也有一定的重要作用。要想实现旅游景点热度预测系统,需要解决如下一些问题:一是,微博数据库的数据量正在爆炸式的增长,其数据量之大,已经超出了传统的技术对数据的处理能力。二是,传统的关键词提取算法只考虑关键词与它出现的文本数之间的关系,但是忽略了关键词在一个类别内的分布情况,从而导致对微博中关键词提取的准确性下降问题。三是,为了得到有效关键用户需要消除僵尸粉的干扰、广告用户的影响。四是,目前的相关研究都是针对过去的内容或当前的信息记录,没有做到预测性,因此需要设计相关算法。面对以上的问题,本文首先通过设计算法来消除僵尸粉的干扰以及广告用户的影响来得到有效的关键用户集合;其次,对海量微博信息进行了分类,从中分离出有关旅游方面的微博,对得到的旅游相关微博信息进行中文分词,进而使用改进后的TF-IDF函数进行词语权值计算,得到在某段时间内高频的旅游类关键词;然后通过对用户之间的行为影响力的分析,结合关键用户集合和高频旅游类关键词集合来分析计算旅游信息的传播趋势,从而可以预测旅游景点的热度;最后将该系统移植到Hadoop分布式框架中。实验表明,该系统是有效可行的并且Hadoop框架能快速的处理海量数据。
【作者】黄兴;
【导师】吴卿;
【作者基本信息】杭州电子科技大学,计算机技术,2014,硕士
【关键词】微博;Hadoop;海量数据;用户影响力;旅游景点热度预测;

【参考文献】
[1]任峰.p62/SQSTM1与自噬在结肠癌发生中的作用机制研究[D].中南大学,临床医学,2014,博士.
[2]王弘.电信运营商网络代理运维管理模式研究[D].厦门大学,工商管理(EMBA),2014,硕士.
[3]刘承军.首钢矿业公司靠自控设备强化质量检验[J].冶金自动化,2008,03:38.
[4]林佳.秦皇岛金海食品公司外贸客户信用风险评估研究[D].燕山大学,工商管理,2014,硕士.
[5]任泽玉.先进歼击机超机动飞行运动建模与控制研究[D].南京航空航天大学,控制理论与控制工程,2013,硕士.
[6]张硕.塔里木盆地塘古坳陷塘南台地奥陶系台缘带构造特征及地质条件研究[D].中国地质大学(北京),构造地质学,2014,硕士.
[7]曾妮.二十世纪八九十年代儿童文学在中国的译介热潮研究[D].华中师范大学,英语语言文学,2013,硕士.
[8]郭晓楠.石家庄外国语学校初中体育与健康课程教学模式研究[D].河北师范大学,体育教学,2012,硕士.
[9]秦国伟.清解利感合剂主要药效学研究[D].云南中医学院,中药学,2012,硕士.
[10]程正东,尹建威.喷煤枪装置的现状及改进[J].炼铁.1996(04)
[11]刘善智.大学生群体对手机银行初始信任的影响因素研究[D].江苏科技大学,技术经济及管理,2013,硕士.
[12]段丽芳.禁飞区制度的国际法探析[D].北京交通大学,2014.
[13]张豫川.几类微分方程边值问题解的存在性[D].安徽大学,基础数学,2013,硕士.
[14]王娜.自首认定的实践难题及其解决[D].辽宁大学,法律,2012,硕士.
[15]朱忻.Varian Clinac 23EX型加速器残余辐射的监测与评价[D].苏州大学,公共卫生(专业学位),2013,硕士.
[16]林虓.青岛汇泉湾海滨浴场区浮游植物的群集特征及其对环境因子的响应[D].中国海洋大学,渔业资源,2014,硕士.
[17]钱雅文.泰州文化产业品牌经营策略探析[D].上海大学,艺术学,2013,硕士.
[18]杨鑫.碳钢换热表面耐蚀抗垢镀层的制备与性能研究[D].东北大学,材料学,2010,硕士.
[19]侯建国.AACN公司市场营销策略研究[D].燕山大学,工商管理,2014,硕士.
[20]周金辉,余贻鑫,王菲,曾沅.计及静态安全风险的输电网短期综合扩展规划[J].电力系统自动化,2010,06:22-25+36.
[21]四兵锋,张好智,高自友.求解Logit随机网络配流问题的改进Dial算法[J].中国公路学报,2009,01:78-83.
[22]彭江涛.掺杂钬、镨离子氟化钇锂激光晶体制备及中红外光谱特性[D].宁波大学,光学,2014,硕士.
[23]易珺,路璐,唐平,梁志勇.构建基于CRM理念的中小型酒店管理信息系统[J].计算机与数字工程,2005,06:19-22.
[24]隋鑫.上市公司业绩变脸与IPO资源分配[D].南京大学,会计学,2013,硕士.
[25]卢敬伟.基于新型正交磁化可控电抗器的混合电力滤波器设计[D].北方工业大学,电力电子与电力传动,2013,硕士.
[26]吴敏,颜钢锋,张瑶瑶,刘妹琴.基于Petri网结构分析的监控器综合[J].自动化学报,2008,08:964-971.
[27]王欢良,韩纪庆,郑铁然.高斯混合分布之间K-L散度的近似计算[J].自动化学报,2008,05:529-534.
[28]张琳琳.酶法辅助提取迷迭香精油及其抗炎作用[D].天津科技大学,粮食、油脂及植物蛋白工程,2010,硕士.
[29]王选文,丁夷,范九伦.关联规则挖掘在人事系统中的应用[J].西安邮电学院学报,2001,01:21-23.
[30]韩邦生.面向检索的多源遥感影像关联技术研究[D].国防科学技术大学,摄影测量与遥感,2012,硕士.
[31]赵云.新型PDLC器件的研究与制备[D].宁波大学,光学,2013,硕士.
[32]梁春慧.基于“图书馆-环境-用户”三螺旋理论的图书馆服务——以面向协同创新中心的专利信息服务为例[J].新世纪图书馆,2015,04:31-34.
[33]穆振锋.诺基亚公司手机机构件供应商评价的优化研究[D].兰州大学,工商管理(专业学位),2013,硕士.
[34]田洪山.羧基化合物及其盐在非离子表面活性剂及卵磷脂水溶液中的聚集行为研究[D].山东大学,胶体与界面化学,2014,博士.
[35]付琳琳.生物质炭施用下稻田土壤有机碳组分、腐殖质组分及团聚体特征研究[D].南京农业大学,土壤学,2013,硕士.
[36]张华.表面改性、分子印迹型TiO_2的制备及其性能[D].中北大学,无机化学,2014,硕士.
[37]王成山,王赛一.基于空间GIS的城市中压配电网络智能规划(一)辐射接线模式的自动布局[J].电力系统自动化,2004,05:45-50.
[38]刘国华,马朝虹,马博,刘佳.量化关联规则的隐私保持挖掘方法[A].中国计算机学会数据库专业委员会.第二十届全国数据库学术会议论文集(技术报告篇)[C].中国计算机学会数据库专业委员会:,2003:3.
[39]安学利,周建中,刘力,李清清,李超顺.基于熵权理论和信息融合技术的水电机组振动故障诊断[J].电力系统自动化,2008,20:78-82.
[40]七林卓玛.信息不对称视角下我国个人所得税征管问题研究[D].云南财经大学,公共管理,2014,硕士.
[41]郑欢欢.MANET中无证书密钥管理研究[D].西安电子科技大学,信息安全,2012,硕士.
[42]王文宾.混合动力汽车废气能量回收辅助动力系统建模与优化研究[D].重庆交通大学,车辆工程,2012,硕士.
[43]吕巍,蒋波,陈洁.基于K-means算法的中国移动市场顾客行为细分策略研究[J].管理学报,2005,01:80-84.
[44]张高阳,金鑫,张之敬.步进驱动系统大振荡机理与轨迹优化控制[J].自动化学报,2015,01:84-93.
[45]宫秋姗.18世纪中法丝绸文化比较[D].北京服装学院,艺术学,2012,硕士.
[46]谢品.基于网络视角的园区内企业间竞合行为研究[D].江西财经大学,管理理论与企业管理,2013,博士.
[47]闫彤.通用航空监管信息管理平台建设的设计与实现[D].吉林大学,软件工程,2012,硕士.
[48]赵传纪.水稻抗白叶枯病基因Xa31(t)的精细定位及2个候选基因的比对分析[D].中南民族大学,生物化学与分子生物学,2013,硕士.
[49]邢镇.机制设计理论视角下供应链战略合作伙伴关系治理的研究[D].广东工业大学,物流工程(专业学位),2014,硕士.
[50]马二林.FAI二冲程缸内直接喷射航空用发动机的研究[D].天津大学,动力机械及工程,2013,硕士.

相关推荐
更多