基于空间聚类和Weka平台的出租车载客热点区域挖掘研究

基于空间聚类和Weka平台的出租车载客热点区域挖掘研究

作者:师大云端图书馆 时间:2021-03-22 分类:参考文献 喜欢:3009
师大云端图书馆

【摘要】目前,几乎每台出租车上都安装有GPS调度终端,这些装置大约每隔1秒钟就会向出租车调度中心发送实时状态信息,如车辆位置、速度、载客状态等。如何从这些庞大的出租车运营数据中挖掘出有用的信息,用来指导出租车公司优化调度,是当前一个热门的研究领域。通过研究目前国内外出租车调度系统的应用发展状况,我们发现这些调度系统大多采用基于静态历史数据、粗粒度、集中式的调度方案,或者是电话预约模式下的人工调度,具有滞后性、模糊性,且当请求较多时,调度中心往往超负荷运作,最终调度效果并不理想,甚至导致多数出租车司机宁愿选择盲目随机拾客。根据以上分析,本文结合空间聚类技术,给出一种基于出租车载客热点区域的分布式、动态调度方案;提出带有范围控制的空间聚类算法R-FDBSCAN,对出租车GPS历史数据进行均匀、细粒度聚类;并在Weka平台中集成R-FDBSCAN算法,针对北京市出租车数据进行热点区域挖掘。具体工作如下:1.提出一种基于出租车载客热点区域的调度方案,该方案通过对出租车GPS历史数据进行空间聚类,挖掘细粒度的载客热点区域;定义质心、热度分别表示热点区域的位置和对出租车的需求度,用于约减出租车载客热点区域的信息,存储于出租车调度终端,用来实现快速离线调度或实时动态调度,并在一定程度上减轻调度中心的负荷;2.为实现出租车GPS历史数据的均匀、细粒度聚类,本文提出一个改进的空间聚类算法R-FDBSCAN。通过对常用聚类算法的分析发现,经典的基于密度的聚类算法DBSCAN在内存要求和执行效率方面存在不足,有人提出快速聚类算法FDBSCAN以解决此类问题,但该算法无法对GPS数据进行均匀的、细粒度聚类。为此,本文提出带有范围控制的R-FDBSCAN算法,通过增加参数R,在选择代表种子对象扩展类簇时,用参数R判断是否对该代表种子对象进行扩展,最终将类簇范围控制在边长为R的矩形区域内,从而符合出租车细粒度调度的应用要求。实验结果表明,与DBSCAN算法和FDBSCAN算法相比,R-FDBSCAN算法在时间性能及聚类结果上都具有一定优势;随着R值的增大,其对类簇的扩展限制越宽松,最终类簇的数量越小,且当R超过某一值时,其将退化为FDBSCAN算法。具体聚类过程中参数R的选取可依据城区规划的交通小区范围而定;3.在数据挖掘平台Weka中集成R-FDBSCAN算法,在此基础上进行出租车载客热点区域挖掘和可视化分析。针对Weka提供的二次开发接口,在该平台上集成R-FDBSCAN算法;对北京市12000台出租车4天的GPS数据进行统计,将正常工作日和节假日分为不同的特征时间段,并就每个特征时间段进行空间聚类;在ArcGIS中将约简的出租车载客热点区域与实景地图匹配,依热度值分等级用不同颜色显示,结合居民日常出行规律分析高热度值载客区域特点,验证使用质心、热度约简整个载客热点区域以实现出租车分布式、动态调度的可行性。本文提出的基于出租车载客热点区域的调度方案可指导出租车司机准确、快速地前往高需求区域,将调度任务分散到各个调度终端,实现分布式、动态调度,一定程度上减轻调度中心的负荷,提高整个出租车行业的运营效率;改进的R-FDBSCAN算法可用于空间数据的均匀、细粒度聚类,挖掘得出的出租车载客热点区域,可用于研究居民日常行为规律、指导政府合理规划城市交通建设、基于需求设置定点扬招站等。
【作者】刘盼盼;
【导师】齐红;
【作者基本信息】吉林大学,计算机应用技术,2014,硕士
【关键词】出租车调度;载客热点区域;空间聚类;R-FDBSCAN算法;Weka;

【参考文献】
[1]李成飞.论当代油画创作中的意象思维[D].吉林大学,美术学,2013,硕士.
[2]白鹤.马克思主义中国化思想方法的嬗变及其规律探究[D].西北大学,马克思主义中国化研究,2013,硕士.
[3]史开瑕.我国上市公司OCI列报对会计信息质量的影响研究[D].浙江财经学院,会计学,2013,硕士.
[4]努尔兰·木汉.基于自适应正交遗传算法的道路交叉口VISSIM模型参数标定方法[D].北京交通大学,2014.
[5]赵成龙.一个基于WEB的智能答疑系统的设计与实现[D].东南大学,2005.
[6]李士杰.关于max-Lukasiewicz-t-norm模糊关系方程解的唯一性及矩阵强正则性的研究[D].大连理工大学,运筹学与控制论,2013,硕士.
[7]吴孟雄.越南河内市乡级公务员培训模式研究[D].广西民族大学,行政管理,2013,硕士.
[8]瞿作虎.p130Cas蛋白在ER阳性乳腺癌中的表达及相关因素分析[D].广西医科大学,胃肠腺体外科,2013,硕士.
[9]李正元.多刺激响应性杂合凝胶:设计原则、性质及应用[D].中南大学,2014.
[10]李一全.三峡地区史前生业与居住[D].南京师范大学,专门史,2014,博士.
[11]蒋天颖,孙伟.网络位置、技术学习与集群企业创新绩效——基于对绍兴纺织产业集群的实证考察[J].经济地理,2012,07:87-92+106.
[12]郑丽丽.锂空气电池二氧化锰催化剂的制备及性能研究[D].哈尔滨工业大学,化学工程与技术,2014,硕士.
[13]伍冬梅.S动画学院核心竞争力的要素分析与培育[D].电子科技大学,2004.
[14]韩琳.艺术人生的美学追求[D].西北大学,中国现当代文学,2012,硕士.
[15]林新居.家族聚集性肝癌临床分析和预后影响因素[D].广西医科大学,外科学(专业学位),2013,硕士.
[16]李萍.韩国外国语高中中国文化教学活动设计[D].沈阳师范大学,汉语国际教育,2013,硕士.
[17]甄自兴.应用灰色系统的农村信贷市场分析[D].首都经济贸易大学,统计学,2013,硕士.
[18]王淑娜.宏观经济环境、融资约束和资本结构动态调整[D].首都经济贸易大学,会计学,2014,硕士.
[19]王德文,朱永利,翟学明,邸剑.基于MMS的ACSI基本信息模型获取方法[J].电力系统自动化,2008,22:56-60.
[20]脱中菲.小学数学教师信念结构及特征的个案研究[D].东北师范大学,课程与教学论,2014,博士.
[21]文成国.大力抢救保护民间文化资源推动社会主义文化事业繁荣发展[J].三峡大学学报(人文社会科学版),2003,06:10-13.
[22]张超.合同法定解除事由研究[D].河北经贸大学,民商法学,2012,硕士.
[23]黄伟,熊军,徐祥海,吴汕,甘德强.考虑配电网电压调节的分布式电源准入功率极限计算[J].电力系统自动化,2007,14:43-46+56.
[24]罗程.基于核聚类和序列分析的网络入侵检测方法的研究[D].广西大学,2005.
[25]张雪梅.线粒体融合蛋白2对高脂饮食诱导的胰岛素抵抗大鼠骨骼肌脂肪酸代谢的影响[D].河北医科大学,内科学,2013,硕士.
[26]姜培培.校园网络监控系统研究与应用[D].郑州大学,计算机技术,2013,硕士.
[27]韩瑾.膨润土吸附材料制备及对铜离子的吸附行为研究[D].西安科技大学,材料工程,2014,硕士.
[28]孙思思.急性肺损伤后肺纤维化大鼠模型阴虚证量表的建立与评价[D].河北医科大学,中医诊断学,2013,硕士.
[29]农毅,张西莎.我国废旧家电逆向物流体系文献综述研究[J].物流科技,2013,06:91-94.
[30]李夏菲.城市商业综合体公共空间的场所精神营造策略[D].南昌大学,建筑设计及其理论,2012,硕士.
[31]苏颖堃.独角戏《坏女孩的恶作剧》表演探索[D].中国艺术研究院,戏剧戏曲学,2013,硕士.
[32]曲洪伟.等离子体弧三维柔性成形技术基础研究[D].大连理工大学,机械制造及其自动化,2004,硕士.
[33]吴文波.海洋科学考察船侧推筒体封盖轴密封性能研究[D].湖南科技大学,机械工程,2013,硕士.
[34]刘琴.抛物型Littlewood-Paley算子在Triebel-Lizorkin空间的有界性[D].西北师范大学,应用数学,2013,硕士.
[35]段揚泽.五轴组合机床无触点程序控制系统[J].自动化学报,1964,04:219-230.
[36]杨雨箫.论安德烈·普拉东诺夫创作矛盾的背后[D].四川外国语大学,俄语语言文学,2013,硕士.
[37]李婧婷.弹性超声在甲状腺结节诊断中的应用[D].吉林大学,外科学,2013,硕士.
[38]武铭.网上交易中买家评价悖论的实证研究[D].太原科技大学,管理科学与工程,2013,硕士.
[39]赵贝贝.帕病2号方对帕金森病大鼠多巴胺能神经元的保护机制[D].广州中医药大学,中医内科学,2014,博士.
[40]燕珊珊,张琼.毒品检测技术的研究进展[J].上海化工,2014,04:12-16.
[41]王春雷.基于三维GIS展现的煤矿物联网异构数据集成与应用[D].中国矿业大学(北京),地图制图学与地理信息工程,2014,博士.
[42]石先明.对部颁标准《机车信号信息定义及分配》(TB/T3060-2002)的思考[J].铁路通信信号工程技术.2004(01)
[43]周新云.斜导面直线驱动码垛机器人控制系统设计与实现[D].广东工业大学,机械制造及其自动化,2014,硕士.
[44]邱宏.基于触觉显示技术的网络弹性材质界面研究[D].哈尔滨工业大学,广播电视艺术学,2013,硕士.
[45]赵明高.炼焦自动化监控系统及随车控制器的研究[D].大连理工大学,机械电子工程,2004,硕士.
[46]邓富求.偏移速度分析的应用效果[J].石油地球物理勘探,1982,02:90-96.
[47]彭珊.管理者过度自信、创新投入与企业价值[D].厦门大学,投资学,2014,硕士.
[48]樊国虎.网络搜索数据与消费者信心指数的相关性研究[D].吉林大学,管理科学与工程,2014,硕士.
[49]吴世琦.民事再审制度的功能缺陷及完善[D].安徽大学,法律,2003,硕士.
[50]曾智刚.具有数字图像识别的电器安全检测嵌入式系统[D].广东工业大学,检测技术与自动化装置,2004,硕士.

相关推荐
更多