首页

基于改进TANC的机器学习文本分类方法研究 08月13日

【摘要】随着计算机的兴起及飞速发展,人们从计算机中得到的数据不断扩大。有效的对数据进行分类、从中得到对用户有用的信息是提高工作效率以及对数据进行管理的关键。文本分类中的数据一般具有规模大、复杂性高及变量多等特点。当采用传统的方法对数据进行处理时,一般都是凭借经验而得到,但是经验知识有限,这就使得数据分类的结果产生偏差,限制了数据分类在实际生活中的应用。而基于机器学习的文本分类算法,既不需要建立复杂 […]

【论文下载 - 中国知网/万方数据/维普/读秀/超星/国研/龙源/博看等资源库】

概率数据检索、挖掘及多层文本分类问题的研究 12月31日

【摘要】数据检索与挖掘是一门不断发展的综合性交叉学科,涉及数据的存储、索引、检索、查询以及分析等多个方面。本文主要针对其中的三个重要问题进行了研究,主要内容和结论可以归纳如下:第一,研究针对概率空间数据的文本检索技术。不间断地跟踪、分析了Twitter数据在地理位置上和时间上的分布特征,发现存在大量空间文本检索的请求。从2011年11月至2012年5月,连续地收集带有地理位置标签的Twitter数 […]