社会化标注系统中群组推荐方法研究

社会化标注系统中群组推荐方法研究

作者:师大云端图书馆 时间:2015-08-08 分类:期刊论文 喜欢:2218
师大云端图书馆

【摘要】随着Web2.0技术的兴起,网络上出现了大量的社会化标注系统,用户可以通过一个开放的平台对共享资源进行个性化标注,同时可以上传资源并将其分享到感兴趣的群组中。由于群组能够满足用户间交互与兴趣分享等诸多需求,近年来吸引了大量的用户。但是随着群组数量的飞速增长,用户手动的浏览或查找感兴趣的群组成为一件困难而耗时的工作,迫切需要一种工具帮助用户从海量的群组中过滤出有用的信息,群组推荐系统应运而生。群组推荐系统可以帮助用户发现有价值的群组信息,节约用户时间,提高用户对网站的满意度,从而吸引更多用户加入网站,实现服务提供商与用户的双赢。本文主要研究如何为社会化标注系统中的用户和资源推荐群组,并以社会化标注系统中的典型代表—Flickr图片共享网站为例,介绍主要的研究方法。尽管本文提出的方法都是基于Flickr,但它们均可以推广到任意具有群组信息的社会化标注系统中。Flickr允许用户上传图片,为图片添加标签并将图片分享到感兴趣的群组中。用户、标签、图片和组是Flickr中主要的四个实体,它们之间相互关联,形成了用户、标签、图片和组之间的四元关系。本文在分析该四元关系的基础上,提出了基于四元语义分析的Flickr组推荐模型,并利用该模型完成了以下工作:(1)利于四元语义分析为Flickr用户推荐组为Flickr用户推荐组的现有研究主要使用基于协同过滤的推荐算法,利用(用户,组)二元关系或者(用户,标签,组)三元关系挖掘用户和组之间潜在的语义关系。由于它们均忽略了图片丰富的视觉信息,同时标签可能存在多义性和歧义性,因此往往不能提供准确的推荐结果。本文针对现有研究存在的问题和不足,提出了一种基于四元语义分析的Flickr组推荐方法,利用四阶张量建模用户、标签、图片类和组之间的四元关系,通过高阶奇异值分解技术挖掘用户和组之间潜在的语义关系,得到为用户推荐的组列表。该方法首次将四元语义分析引入到组推荐领域,综合利用图片的视觉特征和标签信息,通过挖掘用户和组之间隐含的语义关系,为用户推荐组。通过在Flickr数据集上的实验证明了本文提出的方法相比利用用户、标签和组之间三元关系的方法,在top-k和MAP评价标准下,取得了更精确的推荐结果。此外,在对Flickr图片分类时,提出了一种基于稀疏编码的改进的空间金字塔匹配方法,为空间金字塔中不同层次的图像的稀疏编码值赋予不同的权重,设计了一种新的空间金字塔匹配核,在Caltech101/256及PascalVOC2006数据集上的实验证明,新的空间金字塔匹配核函数在分类准确率上优于已有的基于空间金字塔匹配的方法。(2)利用四元语义分析为Flickr图片推荐组现有为Flickr图片推荐组的研究主要使用基于内容的推荐算法,需要为每个主题建立一个模型,系统可扩展性差。此外,推荐时仅根据图片的特征没有考虑用户的兴趣,导致推荐结果不一定满足用户的兴趣需要。本文针对现有研究存在的问题和不足,提出了基于四阶张量分解的Flickr组推荐算法,将用户的兴趣信息引入到推荐模型中,利用基于协同过滤的推荐方法为图片推荐组。算法使用四阶张量建模图片、用户、标签和组之间的四元关系,利用高阶奇异值分解和kernel-SVD技术挖掘用户潜在的兴趣以及图片和组之间潜在的语义关系,为图片推荐满足用户兴趣需要的组。此外,为了解决模型的可扩展性问题,当有新的用户、图片、标签和组加入模型时,利用folding-in或IncrementalSVD技术增量更新模型,避免了大量的重复计算。通过在Flickr数据集上的实验证明了本文提出的算法比现有基于内容的推荐算法推荐结果的MAP值有大幅提升。(3)设计并实现了Flickr组推荐统一框架及Web应用原型系统。现有的Flickr组推荐方法只能单独为用户或图片推荐组,不能将两者集成在一个统一框架中。而实际应用中,Flickr用户不仅希望知道自己上传的图片适合分享的组同时还希望了解有哪些自己感兴趣的组。本文在前面两项工作的基础上,建立了基于四元语义分析的Flickr组推荐统一框架,设计并实现了Flickr组推荐Web应用原型系统,该系统可以在为图片推荐组的同时为用户推荐组。统一框架利用四阶张量分解算法挖掘用户、标签、图片和组之间潜在的语义关系,同时得到为用户和图片的组推荐结果。据我们所知,这是第一个集成两种推荐功能于一体的Flickr组推荐原型系统。通过在Flickr数据集上的实验证明了本文提出的方法相比现有的仅仅为Flickr用户或图片推荐组的方法,在top-k和MAP评价标准下取得了更好的推荐效果。
【作者】王晓芳;
【导师】马军;
【作者基本信息】山东大学,计算机系统结构,2014,博士
【关键词】社会化标注系统;四元关系;张量;高阶奇异值分解;推荐系统;

【参考文献】
[1]张芳芳.粗糙表面液滴成核三维密度泛函理论研究[D].北京化工大学,化学工程与技术,2013,硕士.
[2]唐建邦.数据集中与中国银行业信息化[J].中国金融电脑,2002,10:15-18.
[3]刘桂英.“短接触”和水蒸气存在下的煤层CH_4和CO_2两步反应直接合成乙酸的研究[D].太原理工大学,化学工艺,2004,硕士.
[4]王茂鹏.HIV-1假病毒感染未成熟DC的差异蛋白质组学研究[D].吉林大学,预防兽医学,2014,硕士.
[5]张晶涛,钱晓龙,王伟,张莉,柴天佑.步进式加热炉燃烧控制的新方法[J].控制与决策,2001,03:269-272.
[6]尚卫卫.我国商业银行中间业务创新研究[D].天津财经大学,金融学,2012,硕士.
[7]张俊哲,王景荣,王家英.应用微型机的轧机速度测量装置[J].冶金自动化,1985,02:15-18.
[8]吴改.光电催化还原二氧化碳制化工品的机理研究[D].浙江大学,能源与环境工程,2013,硕士.
[9]林小婷.我国开放式股票基金业绩的内在影响因素研究[D].华侨大学,金融学,2013,硕士.
[10]邹林峰.基于移相全桥发射机电源的研究[D].西南交通大学,电力电子与电力传动,2014,硕士.
[11]胡方坤.长压短抽全岩综掘面通风除尘的数值模拟与实践研究[D].中国矿业大学,安全技术及工程,2014,硕士.
[12]陈士昂,刘谨,吴惠明.数据库及其相关技术在故障诊断专家系统中的应用[J].机电工程,2004,03:13-16.
[13]徐光芬.某体育馆气流组织的CFD分析[D].重庆大学,建筑与土木工程,2003,硕士.
[14]化学系.化学系李隽研究组全硼富勒烯研究取得重要进展[N].新清华,2014-09-05004.
[15]刘伟.植物纤维基铬六离子吸附材料的制备与吸附性能研究[D].齐鲁工业大学,制浆造纸工程,2014,硕士.
[16]陈进.出口、FDI与天津城乡居民收入变化关系研究[D].天津财经大学,国际贸易学,2012,硕士.
[17]吴江.高绩效工作系统、创业导向及其与创业绩效关系研究[D].浙江大学,2007.
[18]杨晴霞.质子交换膜燃料电池空气供给系统建模与分析[D].河南科技大学,机械电子工程,2013,硕士.
[19]陈浩泽.我国电梯安全监管问题与对策研究[D].西南大学,公共管理(专业学位),2014,硕士.
[20]盛荣.基于互联网的远程监控系统关键问题的研究[D].中国矿业大学,控制理论与控制工程,2014,硕士.
[21]张华鑫.碳基纳米器件的电磁输运性质研究[D].南京邮电大学,电路与系统,2013,硕士.
[22]万莉.薇拉·凯瑟的《啊,拓荒者!》解读[D].吉林大学,比较文学与世界文学,2004,硕士.
[23]赵瑞.电动汽车交流充电桩的设计与研究[D].苏州大学,机械电子工程,2013,硕士.
[24]陈启军,王月娟,陈辉堂.全局指数收敛的机器人PD自适应轨迹跟踪[J].控制与决策,2000,06:690-694.
[25]王彬.《天鹅湖》研究[D].中国艺术研究院,舞蹈学,2004,硕士.
[26]李艳姿.新传播环境下H省卫视发展路径创新研究[D].河北经贸大学,工商管理,2014,硕士.
[27]蒋成侠.中国大学生英语写作中高频动词Find的句型应用[D].西南交通大学,外国语言学及应用语言学,2013,硕士.
[28]苑骁勇.DX煤矿安全生产执行力提升策略研究[D].辽宁工程技术大学,安全管理工程,2012,硕士.
[29]解霏.分布式智能车站信号控制系统设计[D].北京交通大学,2014.
[30]陈朗.论雅斯贝斯的悲剧学说[D].苏州大学,文艺学,2003,硕士.
[31]马亚东.崂山区城市管理综合执法系统的设计与实现[D].山东大学,软件工程(专业学位),2013,硕士.
[32]边秀杰.导电聚合物/无机物纳米复合材料的制备及催化性质研究[D].吉林大学,2013.
[33]张少中.基于贝叶斯网络的知识发现与决策应用研究[D].大连理工大学,2003.
[34]张永贵.CRH2-300型动车组拖车轮轴振动性能研究[D].北京交通大学,2009.
[35]王龑.论中国网络文学批评的特征与发展趋向[D].内蒙古大学,文艺学,2013,硕士.
[36]李婷婷.钙敏感受体对T淋巴细胞的作用研究[D].哈尔滨医科大学,临床检验诊断学,2012,硕士.
[37]夏洋.中外扬琴击弦工具的比较与分析[D].中国音乐学院,音乐学,2014,硕士.
[38]王娟萍.Effects of First Language on Foreign Language Writing from a Cognitive Perspective: Translation vs. Direct Composition[D].浙江师范大学,外国语言学及应用语言学,2004,硕士.
[39]高滋棠.对合并范围有关问题的探讨[D].东北财经大学,会计学,2003,硕士.
[40]胡玥.互联网时代中国反腐工作机制创新研究[D].重庆大学,行政管理,2014,硕士.
[41]许明杰,宋丰华,李庆华.稳鸿科技的反欺诈解决方案[J].中国数据通信,2001,12:77-79.
[42]徐常练.速度分析中的CMP叠加道同相求和[J].石油地球物理勘探,1993,04:471-476+512.
[43]李强.陕、蒙、甘三省高原训练基地资源配置现状与发展对策研究[D].西安体育学院,体育教育训练学,2013,硕士.
[44]安舒颖.广东东莞中堂龙舟制作工艺研究[D].广西民族大学,科学技术史,2013,硕士.
[45]徐雪婷.高中信息科技算法教学与数学课程整合的研究[D].上海师范大学,现代教育技术(专业学位),2013,硕士.
[46]许伟伟.过渡金属氧化物(Co_3O_4、Mn_3O_4)及其与石墨烯复合纳米材料的合成、表征及性能研究[D].西北大学,材料化学,2013,硕士.
[47]徐海莹.Mg-5Al系合金细晶强韧化机理研究[D].长春工业大学,材料加工工程,2013,硕士.
[48]苗永超.重油和二甲醚复合燃料的物化性质及其排放特性研究[D].宁波大学,船舶与海洋工程(专业学位),2014,硕士.
[49]廖梅.青少年广泛性焦虑障碍患者脑结构与脑功能特点的研究[D].中南大学,临床医学,2013,博士.
[50]宋涛.河北省高校科技工作评估研究[D].河北工业大学,技术经济及管理,2004,硕士.

相关推荐
更多