时间序列数据挖掘中的维数约简与预测方法研究

时间序列数据挖掘中的维数约简与预测方法研究

作者:师大云端图书馆 时间:2015-11-09 分类:期刊论文 喜欢:2344
师大云端图书馆

【摘要】时间序列数据是一种常见的数据形式,广泛存在于各种现实应用中。相应地,利用数据挖掘技术从时间序列中发现其中蕴含的信息和知识也成为了研究的热点,其研究成果在金融、工业、农业、医药、气象、交通、计算机网络等领域取得了成功的应用。然而不同于传统静态数据,时间序列数据通常具有时序性、数量大、维数高、特征多等特性。因此,研究如何有效地通过时间序列数据挖掘技术来处理和分析时间序列数据具有重要的意义。本文以时间序列数据为研究对象,针对时间序列的高维特性,主要研究时间序列的维数约简技术,包括特征提取方法与特征表示方法。从时间序列的应用角度出发,主要研究时间序列的预测方法,包括单变量时间序列的预测与多变量时间序列的预测。时间序列的特征提取是通过选择数量较少且反映原序列主要信息的特征子集实现维数约简的技术。针对时间序列的时序特性,本文提出了一种基于因果关系挖掘的多变量时间序列特征提取方法。该方法是一个二维的特征提取,即不仅提取出特征变量,也提取特征变量的有效滞后期。同时,利用Granger因果关系挖掘的因变量及滞后期所组成的特征子集对结果也有较好的因果解释性。时间序列的特征表示是将高维的时间序列数据转换为低维表示并尽可能保留原始时间序列的特征信息。针对传统符号表示方法中只根据均值特征描述原始时间序列可能造成信息丢失的不足,本文提出了基于趋势距离的时间序列符号聚集近似表示方法,并构造了满足距离下界性的距离度量。首先提出了基于序列段起点值和终点值的趋势距离度量方法来量化不同趋势的差异,然后把趋势因素集成到原符号聚合近似表示方法中,实现利用均值特征和趋势特征共同表示原始时间序列。单变量时间序列预测是利用时间序列自身的历史值来预测未来的数据。针对传统的基于自回归滑动平均模型的预测模型建立后不能更新最新时间序列信息的不足,本文通过将自回归滑动平均模型的差分方程形式与传递形式结合,构建了一种预测值实时自修正的预测模型。新的预测模型会包含新的观测值的影响,从而提高预测的精度并减少运算量。多变量时间序列预测是利用多个变量时间序列对目标时间序列进行预测。本文的预测方法首先利用基于因果关系挖掘的特征提取方法对多变量时间序列进行特征选择,然后使用支持向量回归对目标序列进行预测。特征提取过程中剔除冗余变量和无关变量,从而达到降低支持向量回归的输入维数并提升预测准确率的效果。
【作者】孙友强;
【导师】王儒敬;
【作者基本信息】中国科学技术大学,模式识别与智能系统,2014,博士
【关键词】时间序列;数据挖掘;维数约简;特征提取;因果关系;特征表示;趋势距离;预测;

【参考文献】
[1]靳青.郝聘之对上党戏的革新研究[D].山西师范大学,戏剧戏曲学,2014,硕士.
[2]林彦.长时间热暴露及合金化对Laves相NbCr_2合金热稳定性的影响[D].南昌航空大学,材料学,2013,硕士.
[3]伏荣跃.杏北地区高三组精细构造解释与储层预测[D].东北石油大学,地球探测与信息技术,2013,硕士.
[4]钱琨.泰州市工业气体企业物流运作模式的创新研究[D].南京农业大学,物流工程,2012,硕士.
[5]徐爱春.红富士苹果叶片主要矿质元素与果实产质量关系的研究[D].河北农业大学,森林培育学,2004,硕士.
[6]汪文涛.怀宁汽车配件产业集群研究[D].安徽大学,产业经济学,2013,硕士.
[7]黄佳.团队多元化,知识管理与团队绩效的关系研究[D].浙江工商大学,企业管理,2014,硕士.
[8]李秀丽.初中信息技术课中的自主学习研究[D].河北师范大学,现代教育技术,2013,硕士.
[9]肖蓉蓉.企业营销人员前后台行为对营销绩效的影响研究[D].中南林业科技大学,企业管理,2013,硕士.
[10]沈旦.MiR-205调控非小细胞肺癌细胞发生上皮—间充质转化过程的机制研究[D].苏州大学,内科学,2014,硕士.
[11]姚力.探析现阶段我国的企业文化建设[D].对外经济贸易大学,企业管理,2004,硕士.
[12]李强.儿童期咽扁桃体增生的影像测量及其合并上颌窦炎相关性的研究[D].河北医科大学,影像医学与核医学,2014,硕士.
[13]沈飞,曹志强,徐德,周超.基于Kane方法的机器海豚动力学建模及速度优化方法[J].自动化学报,2012,08:1247-1256.
[14]黄林.民营上市公司治理效率研究[D].北京交通大学,2013.
[15]裘晓菁.高职非英语专业学生英语学习焦虑研究[D].上海外国语大学,英语语言文学,2013,硕士.
[16]李娟.个体暴力游戏经验对攻击性信息注意偏向的影响[D].西南大学,发展与教育心理学,2013,硕士.
[17]章明明.大学生心理冲突与应激水平、主观幸福感及应付方式关系的研究[D].华南师范大学,发展与教育心理学,2003,硕士.
[18]龙强.日本去工业化产业政策研究[D].江西财经大学,理论经济学,2013,硕士.
[19]李梦.城市商业综合体中多厅电影院的优化设计研究[D].北京建筑大学,建筑学,2013,硕士.
[20]薛飞.压电微夹钳的自感知控制方法研究[D].宁波大学,机械制造及其自动化,2014,硕士.
[21]韩雪.PCR-RFLP法快速鉴定镰刀菌感染的真菌性角膜炎[D].吉林大学,临床医学,2014,硕士.
[22]张毅刚,曹阳,项学智.静态背景差分运动目标检测研究[J].电子测量与仪器学报,2010,05:494-499.
[23]贾立好,邹建华.基于新的阈值化方法的背景减法改进[J].自动化学报,2009,04:394-400.
[24]李晓波.基于Hadoop的海量视频数据存储及转码系统的研究与设计[D].浙江工业大学,2013.
[25]翁国锋.村级流动人口和出租屋管理系统的设计与实现[D].电子科技大学,软件工程(专业学位),2012,硕士.
[26]杨丹丹.企业内部领导授权与员工工作自主性研究[D].浙江大学,2006.
[27]岑沛斯.基于文本分析的互联网视频搜索引擎技术研究[D].杭州电子科技大学,计算机应用技术,2013,硕士.
[28]王四四.多元文化交汇下的甘南藏区当代汉语诗歌研究[D].兰州大学,中国现当代文学,2013,硕士.
[29]田元.试论海男小说《妖娆罪》中女性形象的他者处境[D].吉林大学,中国现当代文学,2013,硕士.
[30]易沁桦.分子层面纳微结构药物颗粒自聚体的构建机理研究[D].北京化工大学,化学工程与技术,2013,硕士.
[31]赵颖.基于六维控制器飞行仿真虚拟现实系统的研究与开发[D].河北工业大学,计算机应用技术,2004,硕士.
[32]王志桐.柔性胎架控制网络架构及曲面拟合算法的研究[D].江苏科技大学,信号与信息处理,2014,硕士.
[33]隋艳娜.弗吉尼亚·伍尔芙的“双性同体”理论在《波比》中角色的体现[D].河北师范大学,英语语言文学,2012,硕士.
[34]郝丽丽.铝合金表面Ni-P-β-SiC化学复合镀层制备及应用[D].西安科技大学,材料物理与化学,2013,硕士.
[35]陈姚耀.中国上市银行资本缓冲周期性行为及其信贷影响研究[D].浙江工商大学,金融(专业学位),2014,硕士.
[36]陈文欣.“挨”字句的多角度考察[D].广西师范大学,汉语言文字学,2013,硕士.
[37]王超.基于精益生产的BS公司生产管理流程再造研究[D].北京交通大学,工业工程(专业学位),2013,硕士.
[38]康耀文.慢性间歇低氧对大鼠肝细胞SOCS3表达的影响[D].山西医科大学,呼吸内科,2013,硕士.
[39]耿合员.人冠状病毒NL63中国株全基因组的测序与感染性克隆构建[D].中国疾病预防控制中心,病原生物学,2014,博士.
[40]张小琴.褐飞虱flightin和TnC4基因初步分析[D].浙江大学,植物保护,2013,硕士.
[41]易丹.新媒体背景下高校思想政治教育研究[D].中南民族大学,思想政治教育,2013,硕士.
[42]李晓江.黏弹性层状多孔介质中地震波传播方程的传递矩阵解法[J].石油地球物理勘探,2008,04:410-414+365.
[43]闫爱华.45米回转窑燃烧控制技术研究[D].山东大学,控制理论与控制工程,2012,硕士.
[44]刘庆云.ERCC1和β-tubulinⅢ在胃癌组织中的表达及其临床意义[D].大连医科大学,肿瘤学,2012,硕士.
[45]孙立,李福林,施群英.地域特色项目引入高职体育课程研究——以“南湖船拳”为例[J].教育理论与实践,2015,06:59-61.
[46]周新宇.WS—9发动机试车性能计算分析[D].西北工业大学,航空宇航推进理论与工程,2004,硕士.
[47]卢明宇.生态平等:对《密洛陀》的一种解读[D].广西民族大学,美学,2013,硕士.
[48]王旭东.用于尼龙6的磷腈阻燃剂的合成、表征及其性能研究[D].长春工业大学,应用化学,2013,硕士.
[49]赵芳芳.抵抗与收编—武汉摇滚乐队SMZB(生命之饼)个案研究[D].华中师范大学,民族音乐学,2014,硕士.
[50]谢琳.上海服务业增长的结构特征研究[D].上海大学,产业经济学,2012,硕士.

相关推荐
更多