探索B2C账号在线评论特征
【摘要】2013年10月4日,作者使用Java程序对京东商城在线商品评论信息进行抽样提取。基于采集到的32333个账号和229530条评论数据,站在账号的角度进行聚集,生成了8382个账号的在线评论特征作为研究样本。而以账号在线评论特征为研究对象的论文国内外相对较少,这也是本文的创新点所在。本文主要的研究工作在于通过统计学与数据挖掘相关技术,围绕探索账号在线评论特征及其与账号等级的内在关联为主线,从账号在线评论特征的统计描述、不同等级的账号在线评论特征差异性分析、账号在线评论内部特征与账号等级相关性分析、账号在线评论特征的聚类分析四个方面进行分析研究,并基于上述四个方面的分析结果提出最终的研究结论和建议。这四个方面的分析结果如下:第一,通过构造账号在线评论特征的描述统计量、密度直方图和核密度函数,发现了发表过评论的账号总体近期评论参与度偏低、75%账号发表评论数量在25条以下、更倾向于打高分、互动性接近冰点、发表评论尽可能简短、评论态度偏谨慎等特点。第二,通过单因素方差分析的一整套理论对账号等级的各个水平在评论特征的差异性进行分析,结果发现:评论总数、评论与购买时间间隔的均值随着账号等级的升高而增加,最近一次评论距信息提取日天数随账号等级的升高而缩短,钻石以上会员的打分均值高于其他等级会员,账号等级的各个水平在回复率上有显著差异,注册会员在心得_平均使用_字数这一指标上低于其他等级会员。第三,采用CFS属性选择理论对账号在线评论内部特征以及其与账号等级的关联进行分析。结果发现:最近一次评论距信息提取日天数、评论总数和回复率这三个指标的组合具有自相关程度弱但是与账号等级强相关的特点。采用因子分析理论将账号在线评论特征进行公共因子的提取,结果表明:最近一次评论距信息提取日天数、评论总数、回复率和评论与购买时间间隔的均值的线性组合作为第一个公共因子,该指标体现了账号的评论卷入度。将打分均值和心得_平均_使用字数作为第二个公共因子,该指标体现了账号的满意度。第四,采用CascadeSimpleKMeans、XMeans和EM三种聚类算法,并引入基于似然值的聚类评估准则对三种算法的运行效果进行比对。最终,选择EM算法并得到9类人群。进一步地,构造了9类簇和账号等级的列联表进行了二者的关联分析。基于上述四个方面的分析结果,给出了四点研究结论和建议:1、评论卷入度、账号满意度和账号等级的关系;2、针对性的提升丧失评论积极性人群的评论卷入度;3、给予购物体验失败用户更多关注;4、改进现有评论奖励机制。(注:由于京东商城诸多机制改进频繁,请特别留意1.5节相关说明)
【作者】段轶轩;
【导师】罗泽举;
【作者基本信息】重庆工商大学,统计学,2014,硕士
【副题名】以京东商城为例
【关键词】账号在线评论特征;方差分析;CFS属性选择;因子分析;聚类分析;
【参考文献】
[1]何雯婷.译者经验与翻译速度之间的关系[D].上海外国语大学,2014.
[2]刘建明.煤炭地下气化燃空区扩展及顶板稳定性研究[D].中国矿业大学,采矿工程,2014,硕士.
[3]陈景.基于棉花仓储的数据仓库构建及可视化技术研究[D].首都师范大学,计算机应用技术,2014,硕士.
[4]王芳.雪崩光电二极管的噪声测试及应用研究[D].西安电子科技大学,材料物理与化学,2012,硕士.
[5]刘金栋.摆式电动车组拖车转向架结构优化设计[D].西南交通大学,车辆工程,2003,硕士.
[6]本报记者纪爱玲.石墨烯:市场未启炒作先行[N].中国高新技术产业导报,2011-02-28C06.
[7]罗俊连.广东省清远市国土资源局清新分局公文绩效管理探究[D].中国地质大学(北京),公共管理,2014,硕士.
[8]林晓红.邮件社团特殊人物发现算法的研究[D].吉林大学,软件工程,2014,硕士.
[9]万红贵,邓春亚,谭海涛,龚寅聪.两类外源刺激对啤酒废酵母发酵产谷胱甘肽的影响[J].食品与发酵工业.
[10]刘维娜.尼克松政府对华政策转变与美国国家利益[D].安徽大学,世界史,2013,硕士.
[11]张在丽.CYP3A4/5和MDR1基因多态性的HRM检测及与西罗莫司健康人药动学的关系研究[D].复旦大学,药剂学,2012,硕士.
[12]王丹.半导体氧化物光阳极的表面/界面修饰及水分解性能研究[D].东北师范大学,材料物理与化学,2014,博士.
[13]康子博,柴天佑,尹英杰,藤井省三.SCARA型机械手的鲁棒防振控制[J].控制与决策,1997,05:554-558+564.
[14]黄以佳.基于LabVIEW的电液力控制系统研究[D].哈尔滨工业大学,流体机械及工程,2013,硕士.
[15]张曦.基于P2P的空间矢量数据索引网络缓存机制的研究[D].南京邮电大学,计算机应用技术,2013,硕士.
[16]张瑶.城镇化进程中的公共艺术研究[D].吉林大学,设计艺术学,2014,硕士.
[17]马朝博.河北省民营经济竞争力评价[D].河北经贸大学,数量经济学,2012,硕士.
[18]辛善彬.“归经理论组方中药”对耐力训练大鼠肾脏功能有关指标的影响[D].曲阜师范大学,运动人体科学,2013,硕士.
[19]于海丽.企业社会责任报告的质量研究[D].北京交通大学,2013.
[20]刘静.协同进化算法及其应用研究[D].西安电子科技大学,2004.
[21]陈明,张士勇.基于Backstepping的非线性系统预设性能鲁棒控制器设计[J].控制与决策,2015,05:877-881.
[22]王兴良.谱聚类中特征向量的选取与集成算法[D].烟台大学,计算机应用技术,2014,硕士.
[23]刘昊.首钢集团多元化战略研究[D].吉林大学,工商管理,2013,硕士.
[24]付林霄.两种钨铜复合粉末热压烧结及塑性变形性能研究[D].哈尔滨工业大学,材料加工工程,2013,硕士.
[25]李维华.概率网的重构[D].云南大学,2010.
[26]丹达尔.金界壕沿线边堡的类型学研究[D].内蒙古师范大学,专门史,2013,硕士.
[27]霍中广,吴坤达.信息技术对银行业的影响[J].价格理论与实践,2002,07:45-46.
[28]宗超.重组人胰岛素样生长因子-1在大肠杆菌中的高效表达和分离纯化[D].浙江大学,生物化工,2013,硕士.
[29]黄志豪.食品企业的产品质量安全责任研究[D].湖南农业大学,农村与区域发展,2012,硕士.
[30]孙忠耘.离婚损害赔偿制度在审判实践中若干问题研究[D].华东政法学院,民商法,2003,硕士.
[31]朱初照.农村土地流转中农民权益协调保障机制的研究[D].浙江海洋学院,农业与区域发展(专业学位),2013,硕士.
[32]周莹.基于沪深上市公司的多元化经营与企业绩效关系研究[D].山东财经大学,企业管理,2014,硕士.
[33]庞可心.基于M-Bus总线的嵌入式智能抄表集中器的研究与设计[D].东北大学,检测技术与自动化装置,2011,硕士.
[34]陈艺.曲面零件精密检测的若干关键技术研究[D].天津大学,仪器仪表工程,2013,硕士.
[35]杨玲.我国制造型上市公司应收账款质量研究[D].中国地质大学(北京),会计,2013,硕士.
[36]吕绍瑜.镍基高温合金高速铣削加工表面完整性研究[D].山东大学,机械制造及其自动化,2013,硕士.
[37]叶莹.室温自交联丙烯酸酯乳液的制备及性能研究[D].湖北工业大学,材料学,2014,硕士.
[38]刘艳.超级电容器用石墨烯/聚合物复合材料的制备及其性能[D].中南大学,2012.
[39]马谦.有效实施“税收预警”的几点建议[J].宁波职业技术学院学报,2004,04:11-13.
[40]刘莹.公路班线客运小件快运发展模式研究[D].长安大学,物流工程与管理,2014,硕士.
[41]韩金土,曹立新,杨豪,杨晓烔,王亚云.石墨烯/离子液体/壳聚糖/血红蛋白修饰玻碳电极检测过氧化氢[J].信阳师范学院学报(自然科学版),2012,03:360-363+386.
[42]孟祥佳.小分子量子动力学性质研究[D].山东大学,原子与分子物理,2014,博士.
[43]梁德翠.模糊环境下基于决策粗糙集的决策方法研究[D].西南交通大学,2014.
[44]李岷.宁夏青铜峡灌区地下水资源评价与地下水位调控研究[D].西安理工大学,水利工程,2003,硕士.
[45]郭磊.钛合金高速切削数值模拟研究[D].太原科技大学,机械制造及其自动化,2014,硕士.
[46]赵娟.高职校企合作模式下学生培养机制研究[D].内蒙古大学,行政管理,2013,硕士.
[47]徐海鹏.双轴式太阳能自动跟踪系统[D].北方工业大学,机械工程,2014,硕士.
[48]吕松泽.中国企业实施CRM状况的分析[J].学术交流,2005,08:87-89.
[49]赵俊.我国输入型通货膨胀的国际贸易传递机制及检验[D].宁波大学,国际贸易学,2014,硕士.
[50]施雪奎.肉牛CAPN1、CAST、GHR、SCD1基因多态性及与胴体、肉质性状的相关性研究[D].扬州大学,动物遗传育种与繁殖,2011,硕士.

- 下一篇: 货币等效用测度研究及应用
- 上一篇: 我国产业结构变迁对城镇化的影响研究
相关推荐
- 瑕疵出资股权转让问题研究
- 08月15日
- 新媒体环境下小学思想品德教育存在的问题及对策探析
- 05月07日
- 智能物流中车联传感网络的关键技术研究
- 06月25日
- 论勃列日涅夫的社会主义观及其历史影响
- 07月07日

