协作过滤推荐算法的稀疏性问题研究
【摘要】近年来,随着云计算、物联网、社交网络等新兴服务的迅猛发展,微博、视频网站、移动设备、通讯服务为代表的新型信息发布方式的不断涌现,大量的数据以TB、PB级产生,大数据(BigData)时代正式到来。大数据的出现如一把双刃剑,可以方便用户随意处理、发布信息,但是从繁杂内容中寻找用户感兴趣的信息如同大海捞针一股,不仅花费了大量的时间也耗费了一定的精力,这正是当前电子商务所面临的一个难题。推荐系统(RecommenderSystem)可以有效地解决信息过载问题,其中协作过滤推荐算法(CollaborativeFiltering)是当前应用最广泛的个性化推荐算法之一,但是该算法主要是基于用户对项目的评分进行推荐的,而由于用户习惯,一般系统的评分信息很少,所以导致系统推荐质量低。因此,对于协作过滤推荐算法中数据集稀疏性问题进行研究和改进是必要且有意义的。论文主要工作如下:第一,阐述了推荐技术的相关知识及国内外研究与应用现状,对协作过滤推荐算法及其所面临的问题进行了研究分析,并从算法思想和算法性能两个方面对现有改进的协作过滤推荐算法解决稀疏性问题进行了深入分析。第二,结合当前大数据环境下的数据冗余、动态变化等特点,以改善稀疏的数据集为目标,通过分析用户浏览信息来优化稀疏数据集。从各个领域追踪每个IP地址获取与用户相关的客观评分来填充数据集,从而减小候选近邻数据集的稀疏度。第三,在既定的数据稀疏环境下,提高算法精度也可提高系统推荐质量。可以从两个方面改进:一方面综合多种因素,通过分析不同特征的用户对项目的各种属性的兴趣度,综合已评项目的属性评分值预测没有被评分的项目,提高项目相似度计算的准确性;另一方面考虑到用户对项目评分的差异性问题,提出一种针对目标项目选择近邻的协作过滤推荐算法,基于项目类型评分建立初步的近邻用户集,在此基础上针对每个目标项目构建用户的精确近邻,结合衍生的扩展邻居,有效地改善了服务质量。最后,基于属性论,提出一种基于项目属性的协作过滤推荐算法,在数据集中对项目及其属性研究分析,划分出项目的属性并计算属性权重,利用基于属性的重心剖分模型结合项目的属性权重计算项目之间的相似度。实验表明,优化的算法对于数据集稀疏所导致的问题有所改善,提高了推荐精度。
【作者】孙龙菲;
【导师】黄梦醒;朱东海;
【作者基本信息】海南大学,计算机应用技术,2014,硕士
【关键词】推荐技术;项目属性;协作过滤;用户特征;稀疏性;
【参考文献】
[1]李瑞钧.蠕墨铸铁快速热分析系统的研制[D].南昌大学,机械工程(专业学位),2014,硕士.
[2]于小雯,石高全.石墨烯/高分子复合薄膜的制备及应用[J].高分子学报,2014,07:885-895.
[3]张淑红.肇东公司生产成本控制研究[D].吉林大学,工业工程,2014,硕士.
[4]张文娟,潘灵刚,陶缘,王亚军,李昕,王瑞花,陈健初,叶兴乾.微波辅助提取椪柑幼果总黄酮工艺优化及其抗氧化活性研究[J].食品工业科技,2015,05:223-226.
[5]闫涛.我国房地产市场在货币政策传导机制中作用的实证研究[D].天津财经大学,金融学,2012,硕士.
[6]双玉娥.我国单位犯罪刑事诉讼研究[D].中国政法大学,诉讼法学,2004,硕士.
[7]王彦辉.中厚板轧机板形控制系统和模型研究[D].东北大学,材料加工工程,2011,硕士.
[8]陆慧萍.七子花遗传结构及优先保护种群的确定[D].华东师范大学,生态学,2004,硕士.
[9]胡素贞.N-取代3,5-二硝基水杨酰肼的锌配合物的合成、结构及性质研究[D].华侨大学,无机化学,2013,硕士.
[10]李强.“16500kVA硅锰合金电炉配料、上料微型机控制系统”通过鉴定[J].冶金自动化,1986,01:61.
[11]徐振上.阿魏酸酯酶基因的获得和异源表达[D].齐鲁工业大学,轻工技术与工程,2014,硕士.
[12]李学军,张美阳,曹王剑.大规模铅锌冶炼烟气治理自动化生产综合管理及控制[J].冶金自动化,2006,05:34-37+55.
[13]全锐.陕西省旅游业可持续发展问题研究[D].西安建筑科技大学,科学技术哲学,2004,硕士.
[14]徐巍.论弗吉尼亚·伍尔夫与“女性写作”问题[D].吉林大学,比较文学与世界文学,2004,硕士.
[15]雷莹.沈阳市农信社塑料编织贷款项目风险控制研究[D].吉林大学,项目管理,2014,硕士.
[16]张华芳,冯志仙,邵乐文,章梅云,徐红,邵荣雅,沈丽娜,赵雪红,黄丽华.护理质量敏感性指标的构建[J].中华护理杂志,2015,03:287-291.
[17]牛方方.高速公路营运期节能措施及效果研究[D].长安大学,交通运输规划与管理,2013,硕士.
[18]彭喜兰.对地方人大常委会立法活动监督的研究[D].湖南师范大学,宪法学与行政法学,2013,硕士.
[19]张红霞.辅助右美托咪啶或丙泊酚在臂丛神经阻滞麻醉中的应用研究[D].山东大学,麻醉学(专业学位),2013,硕士.
[20]张恋,李忠水,黄小妹,叶灵婷,林深.Pt/PEI-GN/PW_(12)_n复合膜的制备及其对甲醇氧化的电催化性能[J].功能材料,2014,07:7084-7088.
[21]周冲.微型射频薄膜体声波双工器设计[D].天津大学,电路与系统,2013,硕士.
[22]费腾.关于加强高中旅游地理教育的研究[D].河北师范大学,学科教学,2013,硕士.
[23]胡晓洁.大理州初中生健康危险行为调查[D].大理学院,流行病与卫生统计学,2013,硕士.
[24]唐雪娇.基于XML的传感网数据查询技术研究[D].南京邮电大学,信息网络,2013,硕士.
[25]王子信.质量技术监督系统入世后的应对策略研究[D].辽宁工程技术大学,矿业工程,2004,硕士.
[26]张庶萍,张世英.基于微分对策的供应链合作广告决策研究[J].控制与决策,2006,02:153-157+162.
[27]刘阳.20世纪50-60年代美国粮食援助政策研究[D].云南师范大学,世界史,2013,硕士.
[28]史之峰.骨髓X相关非受体络氨酸激酶在评估人脑胶质母细胞瘤患者预后中的作用研究[D].复旦大学,外科学,2013,博士.
[29]周楠.我国工业低碳化发展机制研究[D].浙江理工大学,区域经济学,2014,硕士.
[30]韩涛.计算机自动识别CAD图形文件技术的实现[J].铁道勘测与设计,2005,02:86-89.
[31]王楠楠.战略委员会对上市公司非效率性投资影响的研究[D].南京农业大学,会计学,2011,硕士.
[32]吴泽泉.从理念走向生活[D].曲阜师范大学,文艺学,2004,硕士.
[33]何婷婷.基于纳米复合材料的电化学生物传感器的研究[D].安徽理工大学,2014.
[34]郑启鹏,李秀,刘文煌,李兵.支持向量机在银行贷款客户分类中的应用研究[J].微计算机信息,2005,23:73-75.
[35]邱杰.顺丰速运集团有限公司发展战略研究[D].湖南大学,工商管理,2014,硕士.
[36]池仁勇,刘娟芳,张宓之,李瑜娟,何九.创新要素集聚与区域创新绩效研究——基于浙江中小企业的实证分析[J].浙江工业大学学报(社会科学版),2014,02:153-158.
[37]汪祝胜,胡卫雅,李瑛,裴文.碳基固体酸催化剂的制备与应用[J].浙江化工,2014,12:47-51.
[38]于萍.中等职业学校课程开发能力研究[D].华东师范大学,职业技术教育学,2013,硕士.
[39]梅俊.一类驱动响应复杂网络的有限时间同步控制[D].三峡大学,应用数学,2013,硕士.
[40]彭雪彬.体外共培养人脐带间充质干细胞对肝星状细胞增殖的影响[D].兰州大学,内科学,2013,硕士.
[41]吕智超.基于符号动系统理论的系统分析问题研究[D].东北大学,系统理论,2011,硕士.
[42]李赞.内蒙古对外汉语教学中“很+N”结构教学略探[D].内蒙古师范大学,汉语国际教育(专业学位),2013,硕士.
[43]王向阳,崔林,褚玉林.基于粗糙集理论的医院院内感染数据挖掘[J].洛阳工学院学报,2002,02:59-62.
[44]黄建安.夏布业与棠阴村落变迁[D].江西师范大学,专门史,2004,硕士.
[45]乌云尔德尼.氟吡啶对神经病理性疼痛大鼠的镇痛作用及其机制研究[D].华中科技大学,麻醉学,2013,硕士.
[46]丁晓东,吴让泉,邵世煌.含有模糊和随机参数的混合机会约束规划模型[J].控制与决策,2002,05:587-590+594.
[47]赵福磊.进油温度对生物柴油燃烧与排放影响的研究[D].长安大学,动力机械及工程,2013,硕士.
[48]张嘉麒.媒体城市形象塑造研究[D].四川省社会科学院,新闻学,2014,硕士.
[49]李昌平.基于黑板结构的多智能体系统实现方法的研究[D].东北大学,控制理论与控制工程,2011,硕士.
[50]钱伶琤.原水水质变化对超滤膜分离性能影响研究[D].重庆交通大学,市政工程,2012,硕士.

- 下一篇: MapReduce作业调度算法优化与改进研究
- 上一篇: 基于稠环D-A共轭聚合物光伏性能的研究

