首页

基于梯度提升模型的负相关学习算法的研究与应用 09月09日

【摘要】论文的第一个工作是关于集成学习的研究。在机器学习领域,我们把具备从经验知识中学习能力的系统或者模型叫做学习器。一般来说训练出一个学习能力较弱的模型比训练出一个学习能力较强的模型所要耗费的代价小得多。集成学习是一类特殊的机器学习方法,其思想是不直接训练一个强学习器,而是通过组合一批弱学习器来得到一个学习能力强的集成学习器。集成学习算法性能好坏主要取决于两个因素:基学习器自身的性能好坏以及基学 […]

【论文下载 - 中国知网/万方数据/维普/读秀/超星/国研/龙源/博看等资源库】

基于多视图的半监督学习分类算法的研究 03月22日

【摘要】机器学习作为计算机学科领域的热门研究方向一直备受关注。在过去,机器学习主要采取的学习方法为有监督的学习和无监的督学习,目标数据集一般针对类标号齐全的训练集和完全无类标号的训练集,数据属性集的维度一般不高。但是,随着近年来对机器学习的技术不断地研究,数据采集技术也得到了飞快的发展,采集到的数据属性维度变多、属性之间相关度变高,再加上有类标号的数据较少,无类标号数据飞速增加,所以面对当今的数据 […]

基于集成学习的蛋白质结晶偏好性预测 01月19日

【摘要】基于蛋白质结晶的X射线晶体成像技术是目前主要分析蛋白质结构的实验技术,目前大多数已被解析出来结构的蛋白质均使用这个方法,但是这种实验技术存在成功率较低的问题。因此,对于一个给定蛋白质,预测其是否能够结晶或者是有多大结晶可能性具有很强的实际意义。本文针对该问题,首先在网上数据库中下载了最近最新的数据,构建了训练数据集,之后在对相关文献研究的基础上选择了较为全面的特征集合,最后使用集成学习的方 […]

集成学习多样性研究 12月12日

【摘要】集成学习是机器学习领域中的研究热点问题,其通过组合多个学习器来解决一个问题。对比普通的机器学习算法在训练数据上生成一个学习器,集成学习生成一组学习器并通过各类方式组合它们,从而取得比单个学习器更好的泛化能力及分类准确性。而在提高集成学习准确性方面,由于集成分类器各分类器的多样性与准确性之间存在一定关系。因此,深入研究准确性同多样性之间的关系,并通过增强多样性来提升分类器准确性则变得至关重要 […]

基于差异的半监督学习中有关算法和理论研究 11月25日

【摘要】传统的机器学习中,要获得一个良好的分类器需要足够的有标号数据。然而在很多现实任务中,如生物基因分析、Web数据挖掘等领域,随着数据收集和存储技术的发展,获得大量无标号的数据相当容易,而对数据进行标注却非常困难或者代价高昂。因此,如何在少量有标号数据上提高分类器的泛化能力,成为了当前机器学习领域倍受关注的重要问题之一半监督学习在有标号数据的基础上,结合无标号数据进行学习,可以有效地克服标注瓶 […]

邻近隐私保护与集成k-匿名算法的研究 11月24日

【摘要】数据挖掘和数据发布是当前数据库应用的两个重要领域。一方面,数据挖掘和知识发现在各类数据应用范围中都起到非常重要的作用。数据挖掘的目的是从大量的无规律的数据中抽取出潜在的、有价值的知识、模型、规则等;另一方面,数据发布是把数据库中的数据通过相应的方式提供给用户,但在各种数据应用中,如果在数据发布过程中没有相应的方法对隐私数据进行保护,那么很有可能导致敏感信息的泄漏,因此会给数据所有者带来负面 […]

基于贪婪优化和投影变换的集成分类器算法研究 10月09日

【摘要】随着计算机科学的不断发展,人们对机器学习的性能精度要求越来越高,同时需要处理的问题也越来越复杂,这意味着单一的学习模式已经不能完全满足人们对更高性能的需求。因此,集成学习作为一种新的机器学习算法被提出,即通过结合多个学习器来改善单个学习器的性能。由于集成学习能够明显地改善单个学习器的性能,因此从20世纪90年代起,集成学习成为机器学习领域的一个研究热点,而分类器集成相当于集成学习在有监督分 […]

基于过程数据的建模方法研究及应用 09月12日

【摘要】为了保证电站的安全经济运行,需要获得一些重要热工参数的信息。由于技术和资金的限制,只利用硬件传感器很难实现这些参数的可靠、准确和快速测量。基于数据的软测量建模方法是解决此问题的途径之一,而且近年来电站信息化的发展使过程数据的获取变得越来越容易,这为构建数据模型提供了良好的研究平台。数据软测量建模已经成为热工过程检测和控制领域的一个新的研究热点。一般构建模型采用的数据来源主要有两种:对过程进 […]