基于主题和结构的微博社区挖掘方法研究

基于主题和结构的微博社区挖掘方法研究

作者:师大云端图书馆 时间:2022-08-22 分类:参考文献 喜欢:1475
师大云端图书馆

【摘要】近几年,随着互联网的兴盛,在线社交网络(Onlinesocialnetwork,OSN)蓬勃发展。其中,微博(Microblog)作为一种全新的社会化媒体工具和网络交流工具,以其“短、平、快”的特点迅速捕获大众的青睐。目前我国微博用户已经超过3亿人,将近占我国互联网用户的一半,全球排名第一。面对如此庞大的用户群,无论是网络管理者还是使用者都面临着许多全新的机遇和挑战。用户如何在茫茫人海中找到与自己兴趣相投的人群来互动;企业是否可以从产生的海量数据中获取有意义的信息帮助它市场营销;管理者如何治理这个庞大的网络等等。社区挖掘可以帮助解决这些问题。“社区”就是一群相似用户的集合。有关它的研究由来已久,但多是基于复杂网络的理论研究。虽然社交网络本质上也是一种复杂网络,但它拥有自己的特质。社交网络是由一个个鲜活的人以及他们之间的链接关系组成的,不同于传统的复杂网络只考虑网络链接结构,这种新兴网络的节点内容,即用户的特性同样不可忽视,它促使着社区的形成,同时社区也影响着其中的用户。因此,本文就旨在于寻找一种综合考虑节点内容和网络结构的划分方法,以获得内容相似,结构紧密的社区。本文首先对社交网络进行研究,分析用户行为特征,从两个方面对用户进行分析——用户影响力分析和用户主题分析。前者可以获取网络中的“核心用户”,即对于其它用户有着很强号召力的用户。这不但帮助我们认识网络,也是后面挖掘工作的基础。同时,本文认为一个用户的特性会体现在其言行之中,所以后者从用户发表的微博中提取出用户主题。在此基础之上,本文建立聚类模型,以“核心用户”为初始聚类节点,这样不但能提高效率,而且也避免了结果的局部最优。然后进行以用户主题相似性为基础的聚类工作,这其中同时考虑了用户在网络路径中的距离,以保证社区中的用户内容上兴趣相投,结构上是联系紧密。随后,对初步结果进行社区合并,减少小社区的数量,获得更有应用价值的社区结构。最后,将本文提出的方法应用在真实的数据集上。实验证明,本文提出的方法不但能够发现潜在社区,而且还能获知社区主题,解决了传统基于链接结构社区发现方法缺乏语义性解释的问题。另外,本文最后对研究成果进行了总结,展望了下一步研究工作。
【作者】范田;
【导师】王卫平;
【作者基本信息】中国科学技术大学,管理科学与工程,2014,硕士
【关键词】社交网络;微博;社区挖掘;主题模型;聚类;

【参考文献】
[1]周前凯.基于SAGE技术的家蚕雄性幼虫高温处理前后差异表达基因筛选及分析[D].苏州大学,生物化学与分子生物学,2013,硕士.
[2]李瑞玲.韩寒现象与当代文学批评[D].南京师范大学,文艺学,2012,硕士.
[3]吴伟.高速三维数据扫描机系统设计与研究[D].广东工业大学,控制理论与控制工程,2014,硕士.
[4]谢东.环境艺术设计手绘表现技法研究[D].广东工业大学,设计艺术学,2013,硕士.
[5]廖洪玲.现代教师角色转换问题的研究[D].江西师范大学,教育管理,2003,硕士.
[6]钟志杰.基于“云外包”模式的粮情测控系统设计与实现[D].安徽大学,通信与信息系统,2014,硕士.
[7]黄日升.1H-MRS在原发性中枢神经系统淋巴瘤与高级别胶质瘤鉴别诊断中的价值[D].福建医科大学,影像医学与核医学(专业学位),2014,硕士.
[8]马瑞.论刑事诉讼中的技术侦查制度[D].燕山大学,诉讼法学,2013,硕士.
[9]陈博.视频中人的异常行为检测方法研究[D].吉林大学,计算机应用技术,2013,硕士.
[10]胡建华.微博用户行为与影响力分析系统的研究[D].北京交通大学,2013.
[11]刘睿.交口灌区水资源合理配置研究[D].长安大学,水利工程(专业学位),2014,硕士.
[12]曾先涛.胰腺实性假乳头状瘤的诊断及治疗研究[D].福建医科大学,外科学,2014,硕士.
[13]于长岁.坐位牵引电针治疗神经根型颈椎病的临床观察[D].黑龙江中医药大学,中医骨伤科学(专业学位),2014,硕士.
[14]王健.人工膝关节置换围手术期规范化疼痛管理[D].南方医科大学,外科学,2014,博士.
[15]林达洁.王蒙新时期小说的杂语现象研究[D].福建师范大学,汉语言文字学,2004,硕士.
[16]陈贤博.基于Web挖掘技术的网络营销决策支持系统研究[D].合肥工业大学,2004.
[17]宋国平.3.0T磁共振DW成像对前列腺癌的诊断价值[D].苏州大学,影像医学与核医学,2013,硕士.
[18]袁利利.超临界CO_2在溶液法制备石墨烯中的作用的第一性原理研究[D].郑州大学,2014.
[19]石松波.Li-Mg-N-H复合体系的储氢性能及其机理[D].浙江大学,材料学,2013,硕士.
[20]钟青静.杭州上世纪80年代住宅适老化改造研究[D].浙江大学,2014.
[21]郑文鹏.Ti-6Al-4V合金表面离子渗钼—渗硫复合处理工艺及摩擦学性能研究[D].长安大学,材料加工工程,2013,硕士.
[22]付会敏,黄英彪,赵文辉,汪瑄.高强高导CrZrCu合金结晶器的研制[J].一重技术.2002(Z1)
[23]郑振云,刘召军,郑洁.CSAMT法在甘肃寨上金矿区南矿带找矿中的应用[J].黄金科学技术,2014,02:13-16.
[24]闫晓惠.基于新一代测序技术的选择性启动子和双向启动子识别研究[D].哈尔滨工业大学,计算机科学与技术,2014,硕士.
[25]黄川.论刑事审判公开中个人隐私例外[D].西南政法大学,刑事诉讼法学,2012,硕士.
[26]张静.含氟偶氮苯材料制备与表面性质研究[D].苏州大学,高分子化学与物理,2013,硕士.
[27]高二平,王文中.石墨烯/Bi_2WO_6可见光催化材料合成及增强的光催化性能[A].中国化学学会、中国太阳能学会.第十三届全国太阳能光化学与光催化学术会议学术论文集[C].中国化学学会、中国太阳能学会:,2012:1.
[28]罗达灿.自适应鲁棒滤波算法研究及其在发酵过程中的应用[D].北京化工大学,控制科学与工程,2013,硕士.
[29]刘家燕.2011~2013年我院急诊ICU病原菌分布及耐药性分析[D].河北医科大学,急诊医学(专业学位),2014,硕士.
[30]肖湘杰.小型事业单位思想政治工作方法初探[J].湖湘论坛.2002(05)
[31]陶玮.矿用对旋轴流局部通风机噪声控制技术研究[D].湖南科技大学,安全技术及工程,2013,硕士.
[32]马红祥.甘肃省经济增长与就业关系实证研究[D].甘肃农业大学,区域经济学,2013,硕士.
[33]孙文博,孙赞东.3D3CVSP资料矢量波场分离方法的研究[J].石油地球物理勘探,2009,06:708-719+783+647.
[34]吕强.基于特征点提取的单目视觉里程计的研究[D].浙江大学,2007.
[35]李雪妮.发动机排气歧管非稳态传热串行耦合分析方法研究[D].武汉理工大学,动力机械及工程,2013,硕士.
[36]侯真珍.珍稀克隆植物北极花繁育系统的初步研究[D].新疆大学,植物学,2013,硕士.
[37]郑方.两种可生物降解高分子纳米复合材料的制备和表征[D].山东农业大学,2014.
[38]王彦江.STZ诱导糖尿病大鼠模型肾脏TRPC6表达变化及分析[D].川北医学院,内科学,2013,硕士.
[39]何丽萍.汉语焦点结构的生成语法研究[D].中南大学,外国语言文学,2013,博士.
[40]李征.纳米TiO_2的掺杂和修饰及其用于光动力治疗的机理研究[D].复旦大学,光学,2013,博士.
[41]郑子都.船用增压锅炉汽包水位控制系统实验及仿真研究[D].哈尔滨工程大学,工程热物理,2012,硕士.
[42]陈宏亮.粒子群优化算法在气象信息预测建模中的研究[D].中国科学技术大学,计算机体系结构,2014,硕士.
[43]谈强.关于四维近复流形上的若干问题[D].扬州大学,基础数学,2014,博士.
[44]徐雅卿.电子商务环境下的网上拍卖理论研究[D].西安电子科技大学,企业管理,2004,硕士.
[45]钟懿博.SG公司信息化战略研究[D].西南交通大学,工商管理(专业学位),2014,硕士.
[46]胡铭.天山北坡季节性冻土冻融过程及影响因子分析[D].新疆大学,地理学,2013,硕士.
[47]黄姝.民间组织的形成机制与实践逻辑[D].湖南师范大学,社会学,2014,硕士.
[48]刘永春.高校辅导员队伍建设管理问题与研究[D].吉林大学,项目管理,2014,硕士.
[49]林佳良.基于现实的自动化立体仓库轨道式循环搬运系统构建与调度优化[D].北京物资学院,物流工程,2014,硕士.
[50]毛培兵.外资并购的国家安全审查制度研究[D].辽宁大学,国际法学,2012,硕士.

相关推荐
更多