数据挖掘技术在联网审计中的应用研究

数据挖掘技术在联网审计中的应用研究

作者:师大云端图书馆 时间:2015-06-23 分类:期刊论文 喜欢:1268
师大云端图书馆

【摘要】随着信息系统的发展,各大型国有企业、中央部委、海关等部门积累了大量业务信息,审计署每年要花大量的精力审计这些业务数据,以期发现这些部门是否有违规行为并上报中央,对其进行监督整改。由于这些业务数据日益巨大,因此有必要利用相关技术对这些重要信息进行分析处理。数据挖掘是广泛应用于大数据分析处理的技术之一,采用数据挖掘技术可以通过对大量业务数据的分析处理,挖掘出有疑点的数据,从而重点对这些疑点数据进行审计分析,降低数据量,减少审计分析处理工作量,排除人为因素的干扰,得到的审计结果有着较好的客观性。本文以数据挖掘技术为基础,以海关、社保和国税单位的数据为载体,通过分析数据特征,从数据预处理、可疑审计数据集的形成以及审计方法匹配三个方面,对审计数据进行深入分析研究,为最终审计提供辅助决策。本文首先分析了当前国有企业、中央部委等部门的数据分布特点,根据审计组网要求,提出了数据采集局域网、数据传输局域网、数据存储局域网的网络拓扑结构,在数据采集局域网通过设置前置数据采集机进行数据采集,为保证被审计单位和审计署之间的系统安全性,设置了双开关的网络开关,保证两个系统的物理隔离;在数据传输局域网中,采用当前成熟的数据传输方法,采取SDH/ATM/ADSL等技术进行数据传输,并通过构建审计专网VPN进行安全性构建;在数据存储局域网中,通过不同单位数据特点,设置了集中式、分散式以及共享式的存储局域网,并且根据各个单位的数据分布特点,提出了三种典型的组网模式,即集中式组网、分布式组网以及点对点式组网。面向有噪声的审计数据,通过分析比较数据降维方法,本文提出融合L2.1主成分分析的半监督降维去噪算法,由于PCA对数据中的噪声敏感,将L2.1范数对PCA进行改进,同时由于L2.1范数的PCA算法是通过降低矩阵的秩实现维数约简,而秩的计算复杂。本文针对这一问题,提出利用迹范数代替矩阵的秩来简化L2,1-PCA的计算,提高算法效率,进行数据降维。为获得算法的最优解,本文在此基础上提出了基于半监督的融合L2,1-PCA的除噪优化模型,模型利用迹范数以及矩阵变化,利用特征方程方法以及李雅普诺夫方程方法,求取模型的最优解,并证明了模型的稳定性。实验结果表明,该模型具有良好的降维除噪效果。由于审计数据大部分是时序数据,为分析可疑审计数据,本文提出了去峰值的显著连续序列算法,该算法通过分析以往时序序列异常数据发现算法,在显著连续序列算法的基础上,进一步减少显著序列组的计算,提高运算效率,算法以海关数据进行实验,发现了数据集中的显著数据序列,在此基础上,对这些数据进行进一步的审计可以提高审计效率。为提高审计效率,借鉴以往的审计方法,本文提出了构建审计方法库的基本方法。在进行审计方法的匹配中,本文提出了基于hownet的语句匹配算法,该算法在分析了以往匹配方法不考虑词语频率的问题,构建了频率函数以及权重函数,将频率函数加入匹配算法中,充分考虑了不同词语的权重。实验表明,这种方法具有更有效的匹配度。在审计规则应用中,将这种匹配算法引入到审计方法的查找匹配中,有效率较高。论文最后总结了全文的创新点,提出了今后将继续进行的研究方向。图46幅,表31个,参考文献137篇。
【作者】谢岳山;
【导师】樊晓平;廖志芳;
【作者基本信息】中南大学,计算机应用技术,2013,博士
【关键词】联网审计;组网模式;融合L_(2,1)-PCA半监督数据降维;去峰值显著连续序列;词语相似度;

【参考文献】
[1]王梦莹.铜纳米线的制备及在有机太阳能电池中的应用[D].天津理工大学,2014.
[2]黄炳辉.政府良性媒介形象构建研究[D].西南政法大学,新闻学,2012,硕士.
[3]郭志强.禾肾丸治疗慢性肾小球肾炎脾肾气虚证的临床观察[D].湖南中医药大学,中医内科学,2013,硕士.
[4]刘鹏.基于双吡啶双酰胺配体的配位聚合物的组装及其性能研究[D].渤海大学,无机化学,2013,硕士.
[5]郭婧.黑龙江省甘南县太平湖水库生态旅游规划及景观设计研究[D].东北农业大学,园林植物与观赏园艺,2013,硕士.
[6]黄钦华.饲粮中不同电解质平衡值对银香麻鸡生产性能及血液理化指标的影响[D].广西大学,动物营养与饲料科学,2004,硕士.
[7]乔苹.我国城市公共危机治理中的公民参与机制研究[D].首都经济贸易大学,行政管理,2013,硕士.
[8]路世瑞.数字控制系统中的数据预处理[J].冶金自动化,1989,05:49-53.
[9]王勇,杨治楷,杨智仁.射线变速深度偏移[J].石油地球物理勘探,1993,02:127-132+248.
[10]杨天权.MicroRNA-16调控BCL2表达和NF-κB1/MMP-9信号通路抑制胶质瘤生长和侵袭的机制研究[D].苏州大学,神经外科学(专业学位),2014,硕士.
[11]夏超英.多综合点误差模型及其稳定性充分条件的一个猜想[J].自动化学报,2002,02:183-191.
[12]孙喆.La_(0.8)Sr_(0.2)FeO_3薄膜的激光感生热电电压效应随温度变化规律的研究[D].首都师范大学,材料物理与化学,2014,硕士.
[13]邓长辉,王姝,王福利,毛志忠,王嘉铮.真空感应炉终点碳含量预报[J].控制与决策,2006,02:210-212+216.
[14]李鹏.柔性印刷贴片天线的力学性能研究[D].哈尔滨工业大学,航天工程与力学,2014,硕士.
[15]钱晨语.新农村建设的政府职能问题研究[D].南京农业大学,公共管理,2013,硕士.
[16]李标峰,李敬勇.铝船建造工艺及回转胎架的应用[J].舰船科学技术.1993(06)
[17]山文斌.有序介孔炭基固体酸的制备及其催化双酚A合成的研究[D].天津大学,化学工艺,2013,硕士.
[18]曾永乐.中国高校应急管理机制问题研究[D].吉林大学,行政管理,2012,硕士.
[19]包术颖.普通高校蒙古语授课大学生思想政治教育有效性研究[D].内蒙古师范大学,思想政治教育,2013,硕士.
[20]张国栋.微量A1对EW75合金组织及力学性能的影响[D].北京有色金属研究总院,材料科学与工程,2014,硕士.
[21]江涛.胍基乙酸的合成及其对肉鸡生长性能和血液理化指标的影响[D].安徽农业大学,动物营养与饲料科学,2012,硕士.
[22]胡建茹.我国创业板企业IPO抑价影响因素的实证分析[D].首都经济贸易大学,企业管理,2014,硕士.
[23]卫志月.n-强Gorenstein内射模及其推广[D].安徽大学,基础数学,2014,硕士.
[24]马颖莉.大规模定制环境下服装企业分散采购策略及绩效评价研究[D].江苏科技大学,工业工程(专业学位),2013,硕士.
[25]黄俊华.有机小分子太阳能电池界面修饰的研究[D].西南大学,凝聚态物理,2013,硕士.
[26]施先锋.光伏发电技术推广应用路径分析[D].浙江工业大学,工商管理,2012,硕士.
[27]王涛.中国英语学习者的外国口音研究[D].江南大学,英语语言文学,2012,硕士.
[28]常杰,葛滢.松嫩平原西部林网生态场中玉米光合生态研究[J].植物生态学报,1995,02:137-143.
[29]林一平.伯克级及其弟妹型导弹驱逐舰[J].飞航导弹.2001(07)
[30]李林.基于K-匿名技术的隐私保护研究[D].杭州电子科技大学,信号与信息处理,2014,硕士.
[31]张滨生.充油电气设备带电加油技术的研究与实践[D].华北电力大学(河北),电气工程,2004,硕士.
[32]李中.“两型社会”建设背景下湖南新型城镇化路径研究[D].中南大学,工商管理,2014,博士.
[33]李万里.研究型大学重点研究基地管理体制改革研究[D].兰州大学,公共管理,2012,硕士.
[34]朱李.中国联通长沙分公司预算管理体系优化研究[D].湖南大学,工商管理,2013,硕士.
[35]赵海妍.微区限制下的ZnO融合生长及性质研究[D].北京交通大学,2014.
[36]费菲.惟愿齐心奋斗,擦出交叉创新的火花——著名神经生物学家、浙江大学医学院院长段树民院士专访[J].中国医药科学,2014,01:1-3.
[37]白朝阳.石墨资源消耗过快相关概念股集体逆市大涨[J].中国经济周刊,2014,24:67.
[38]张烨,廖怡,陈尚武,马会勤.文冠果一、二年生植株根系内生菌的分离、鉴定和固氮活性[J].植物生态学报,2010,07:839-844.
[39]于洋.氧热法电石反应器设计与性能模拟[D].北京化工大学,化学工程与技术,2013,硕士.
[40]张学强.论共有人优先购买权与承租人优先购买权的竞合[D].山东大学,法律(专业学位),2013,硕士.
[41]胡卫静.大豆杂交后代耐盐性及9002稳定系组织培养研究[D].内蒙古农业大学,作物遗传育种,2013,硕士.
[42]陈红霞.农民工法律援助的制度困境及解决路径研究[D].华东理工大学,公共管理(专业学位),2014,硕士.
[43]陈建业.意识生成中的主体性向度[D].华侨大学,哲学,2014,硕士.
[44]路怀玉.2.5维编织复合材料的强度研究[D].哈尔滨工业大学,航天工程,2014,硕士.
[45]薛亚茹,陆文凯,陈小宏,黄饶,刘志鹏.基于正交多项式的高精度零炮检距地震道拟合[J].石油地球物理勘探,2008,02:213-216+127+246.
[46]闫莎莎.铁路强电磁干扰对信号系统的影响[D].北京交通大学,2014.
[47]高秀娟.集中供热系统室温控制策略研究[D].浙江大学,控制理论与控制工程,2013,硕士.
[48]丁磊.达芬奇机器人系统与开放手术在高龄重度梗阻性黄疸患者中的临床对比研究[D].辽宁医学院,外科学,2012,硕士.
[49]王志伟.不确定广义系统的正实性和耗散性分析与控制[D].东北大学,运筹学与控制论,2010,硕士.
[50]郝莉莉.中国河南两个先天性白内障家系致病基因的突变筛查[D].郑州大学,眼科学,2013,硕士.

相关推荐
更多