面向社会网络的用户行为挖掘与应用研究

面向社会网络的用户行为挖掘与应用研究

作者:师大云端图书馆 时间:2015-11-24 分类:期刊论文 喜欢:959
师大云端图书馆

【摘要】社会网络,又称社交网络,是一个由大量社会个体成员组成的庞大网络。与一般网络相比,它更加强调网络中个体成员之间的社会关系,及其相互间的互动与影响。近年来,随着Web2.0技术的深入发展和各类社交网站及服务的广泛应用,社会网络不再局限于传统社会学领域的研究范畴,而已经成为经济学、传播学、医学和计算机科学等众多学科领域学者关注和研究的对象。无论是分析社会网络的拓扑结构、探讨网络的成因,抑或对网络个体以及个体间的社会关系进行研究,都属于社会网络分析的研究范畴。而对社会网络用户的各类行为进行分析与挖掘也是其中一个重要的研究分支。这类研究的目的是发现用户行为的模式、规律,或是影响用户行为的因素,以及用户行为所带来的结果等等。面向社会网络的用户行为挖掘与分析在改进用户体验、企业客户关系管理、产品市场推广,以及实现高度智能化的搜索服务等方面具有实际的应用价值和巨大商机,因而受到学术界和工业界人士的广泛关注。近年来,在各学科领域虽己涌现出一大批关于社会网络用户行为的研究工作,但其中很多工作所采用的方法还存在不足。不少用户行为的模式、成因等仍未得到深入的挖掘。另一方面,计算机科学领域的研究人员借助计算机技术在分析从互联网中获取的海量数据过程中,虽然注重借鉴传统社会学的研究成果,却缺乏与现实的应用场景相结合。例如,关于社会网络中的信息传播,虽然已经有学者提出了社会影响(SocialInfluence)和同质性(Homophily)是两种最重要的促使网络个体参与信息传播的因素,但对这两种因素的量化分析还不够深入,尤其缺少针对不同应用场景的特别考虑。又如,不少学者关于网络用户行为的建模研究过于强调理论和方法上的改进,却忽视了建模方法的选取应当贴合实际的应用场合,这样才能有效地提升模型预测的效果以证实模型切实具有的应用价值。针对这些问题和不足,本文关注几种典型的社会网络中存在的用户行为,通过对其进行详尽的挖掘和分析,探寻影响这些用户行为的关键性因素。同时,本文尝试建立准确的模型来刻画并预测用户的行为,从而为实际的应用需求服务。在本文阐述的研究工作不光注重采用合理、有效的理论方法,更看重实验结果和相关结论对实际的应用场合能带来的促进作用。本文的主要工作内容和研究贡献包含以下几个部分。1.由网络论坛用户构成的社会网络是在线社交网络的雏形,本文针对这种网络中的用户群体关注度概念提出了合理的度量方法,并通过对论坛数据的实证分析,发掘出影响论坛用户群体关注度变化的几种相关因素。在此基础上,本文还建立了用户群体关注度的演变模型,用以预测论坛中新出现的帖子在将来被他人关注的情况,因而在网络舆情预测和监控方面有重要应用价值。2.由于论坛用户数据集缺少社会好友的联系信息,使得相关分析结论缺少对社会影响力的考虑。因此,本文还关注另一种社会关系显著的结构化网络——科学家合作网络,对其中学者们的主题跟随行为进行研究。该行为可视作科学家合作网络中的主题传播,但在之前的相关研究中少人涉及。本文的工作不仅度量了社会影响和同质性这两种因素对主题跟随行为的影响效果,而且通过实证分析证明了这两种因素的混合作用,及其影响是随时间推移呈指数下降的趋势。本文还进一步对应这两种因素建立了一个多元逻辑回归模型,用以预测网络中各个用户(即学者)针对某个研究主题发表相关文献的概率。该模型在学术会议的研究主题设置,提高论文征稿函的分发效率等方面具有实际的应用价值。3.为进一步提升对科研学者主题跟随行为的预测准确率,并拓展其应用场合,本文又将同构的科学家合作网络扩充成一个结构更复杂、信息量更丰富的异构信息网络。为了衡量该网络中两个用户的相似性程度,本文不仅借鉴了前人提出的元路径概念,而且额外考虑了邻居用户跟随某个具体主题的倾向性。本文为预测用户主题跟随的模型找到了更多、更关键的特征变量,从而提升了模型的预测准确度。同时,本文的实验评测验证了模型在微观和宏观两个层面的应用价值。4.微博的兴起和流行标志着在线社会网络发展到一个全新的阶段,对微博社区中的用户行为进行挖掘同样具有重要的研究意义和应用价值。具体而言,本文关注微博用户对自身的标注行为,该行为属于社会标注的范畴。前人对于社会标注的研究大都基于对网络物体(图片、URL等网络资源)的标注,却很少关注对一个人进行标注,尤其是针对微博用户。本文通过实证研究发现了在微博用户的标注行为中同样存在社会个体间的同质性影响,基于该原理设计的标签推荐机制解决了传统推荐算法在面对用户标注问题时难以避免的冷启动问题。此外,本文还利用基于在线百科网站构建的语义网络来消除推荐标签中存在的语义冗余,最终设计并实现了一个性能优良的微博用户标签推荐系统STUP。详细的实验证明,在设计STUP系统时提出的标签推荐算法还有助于准确地推断用户的个人属性信息,该功能在很多场合都具有非常重要的应用价值。
【作者】阳德青;
【导师】汪卫;
【作者基本信息】复旦大学,计算机软件与理论,2013,博士
【关键词】社会网络分析;用户行为挖掘;社会影响;同质性;群体关注度;主题跟随;社会标注;个人属性推断;

【参考文献】
[1]李鼎.与众不同——我看于钟华[J].书画世界,2014,02:67-73.
[2]陈双艳.一株大肠杆菌O104的表型及基因型鉴定[D].大理学院,流行病与卫生统计学,2013,硕士.
[3]默然.对布莱恩·卡斯特罗《沐浴赋格曲》的解构主义解读[D].河北师范大学,英语语言文学,2014,硕士.
[4]朱秋霄.利拉鲁肽对高糖条件下SD乳鼠心肌细胞P38MAPK信号通路作用的研究[D].河北医科大学,内科学,2014,硕士.
[5]马欣伯.两边连接钢板剪力墙及组合剪力墙抗震性能研究[D].哈尔滨工业大学,2009.
[6]朱琳.基于面板数据对城市集聚经济的影响因素研究[D].北京交通大学,应用统计(专业学位),2013,硕士.
[7]贺元康,赵鑫,樊江涛.变压器相间短路后备保护中负序阻抗继电器应用探讨[J].电力系统自动化,2011,15:84-87.
[8]钱伟.城市居住社区公共服务设施配套问题的研究[D].浙江大学,城市规划与设计,2004,硕士.
[9]胡海英.旅游酒店室内空间文化性设计研究[D].中南林业科技大学,工业设计工程,2013,硕士.
[10]马雪飞.汉代的豪族与儒学的关系[D].鲁东大学,专门史,2013,硕士.
[11]潘晓瑜.UL27、UL54基因shRNA联合干扰HSV-2复制研究[D].遵义医学院,生物化学与分子生物学,2013,硕士.
[12]叶志宝.支持企业业务过程持续改善的应用系统开发方法[D].中国科学院研究生院(软件研究所),2002.
[13]王龙耀.5’-三磷酸腺苷的分离与提纯研究[D].广西大学,化学工艺,2004,硕士.
[14]彭钧敏,王佳楠,叶旭东.不确定型网络系统的分布式自适应跟踪控制器(英文)[J].自动化学报,2013,10:1729-1735.
[15]苗银卓.我国房屋征收补偿法律制度研究[D].首都经济贸易大学,民商法学,2013,硕士.
[16]叶建勋.动产买卖中交付的公示效力[D].清华大学,民商法,2003,硕士.
[17]潘静.论创新实践的价值评价[D].中共中央党校,马克思主义哲学,2013,硕士.
[18]王亚兵.论传媒监督与司法公正[D].辽宁大学,法律,2012,硕士.
[19]李星皓.河南省农业产业化龙头企业政策性金融支持问题研究[D].河南科技大学,农村与区域发展(专业学位),2014,硕士.
[20]潘春华.基于WebGIS技术的区域地质调查信息系统研究与实现——以青海冬给措纳湖幅区调信息为例[D].中国地质大学,计算机应用技术,2003,硕士.
[21]李晓娜.基于协同过滤推荐的流媒体代理缓存替换机制研究[D].燕山大学,计算机应用技术,2014,硕士.
[22]李曼.未成年证人证言补强规则研究[D].山东大学,法律(专业学位),2013,硕士.
[23]张跃飞.中国城镇化建设中宏观问题与对策研究[D].中共陕西省委党校,科学社会主义与国际共产主义运动,2014,硕士.
[24]王自桦.基于多字典和稀疏表示的图像去噪方法[D].厦门大学,计算机软件与理论,2014,硕士.
[25]朱苓瑕.持续性不卧床腹膜透析患者营养状况的研究[D].广西医科大学,肾内科(专业学位),2013,硕士.
[26]张保明.法制要先行[J].信息与电脑.1994(05)
[27]吴培昊,徐金安,张玉洁.面向短语统计机器翻译的汉日联合分词研究[J].计算机工程与应用,2015,05:116-120+141.
[28]刘琴.基于资源配置效率的沈阳市科技资源整合对策研究[D].沈阳理工大学,企业管理,2012,硕士.
[29]邹鑫.磁性二氧化硅微球在生物医学中的应用[D].吉林大学,分析化学,2013,硕士.
[30]李秀婷.我国金融生态系统运行效率研究[D].中国海洋大学,金融(专业学位),2014,硕士.
[31]佟靖.民营自行车企业营销战略研究[D].天津大学,工商管理,2013,硕士.
[32]邵菊美.水性聚氨酯的合成及其改性研究[D].苏州大学,纺织化学与染整工程,2003,硕士.
[33]刘小如.SAS:提升企业快速应变能力[N].中国计算机报,2003/09/08B03.
[34]朱华强.交通运输企业资源管理系统设计及实现[D].武汉理工大学,2004.
[35]汪玥.徽州文化与地域环境艺术研究[D].武汉理工大学,设计艺术学,2003,硕士.
[36]赖龙波.毛泽东阶级斗争思想研究[D].华中师范大学,中共党史,2014,硕士.
[37]苏青青.玄武岩纤维混凝土耐久性研究[D].天津城市建设学院,桥梁与隧道工程,2012,硕士.
[38]周谧.草根民间组织与企业互动关系模式变迁研究[D].吉林大学,社会学,2014,硕士.
[39]李园园.氢化钛热分解特性及泡沫铝发泡过程的研究[D].大连理工大学,材料加工工程,2013,硕士.
[40]杜翠焕.3D人物模型和动画自动生成技术的研究[D].首都师范大学,计算机应用,2013,硕士.
[41]徐大波,张庆灵,胡跃冰.不确定广义系统的降阶H_∞控制器设计[J].自动化学报,2007,01:44-47.
[42]阎岩.汉俄祈使句对比研究[D].吉林大学,语言学及应用语言学,2013,硕士.
[43]吕柳.T2DM大鼠肝脏SAA-Tanis系统变化及择时有氧运动干预作用[D].苏州大学,运动人体科学,2013,硕士.
[44]黄安丽.170例睡眠呼吸暂停综合征患者中医证候规律研究[D].广州中医药大学,中医学(专业学位),2013,硕士.
[45]王丽.副溶血性弧菌中密度感应系统依赖的T3SS1和T6SS2调控机制研究[D].重庆医科大学,临床检验诊断学,2014,博士.
[46]谭祺启.自建电磁学网站及辅助教学的实践研究[D].湖南师范大学,课程与教学论,2013,硕士.
[47]杨文泽.商业银行流动性建模、预测与优化[D].上海交通大学,2011.
[48]杨金晶.考虑消费者损失的企业产品召回决策研究[D].中国科学技术大学,管理科学与工程,2014,硕士.
[49]何丽君,董蕊,袁克杰.常见关联规则算法分析与比较[J].大连民族学院学报,2005,05:39-42.
[50]齐慧丽,盖轲,马东平.流动注射化学发光法测定人尿液中尿酸的含量[J].中国药房,2014,42:3975-3978.

相关推荐
更多