【精品推荐】一种改进的ICF算法PPT课件报告讲义图文_图文

一种改进的ICF算法 一种改进的ICF算法 ?基于实例的学习方法 ?样本子集挑选方法 ?ICF算法 ?改进的ICF算法 ?实验结果 ?待研究工作 ?参考文献 基于实例的学习方法 是一种lazy学习, 这种方法只是简单的把训练样例存 储起来,每当学习器遇到一个新的查询实例,他分析这个 新的实例与以前存储的实例的关系,并据此把一个目标函 数值赋给新实例。 这种方法有一个关键的优点,即它不是在整个实例空间 上一次性的估计目标函数,而是针对每个待分类新实例做 出局部的和相异的估计。 基于实例的学习方法 基于实例的学习方法存在一个明显的不足:分类新实例 的开销可能很大。 因为几乎所有的计算都发生在分类时,而不是在第一次 遇到训练样例时。而如果存储所有的训练样例,训练所需 的存储空间和分类所需的查询时间开销就会很大。 样本子集挑选方法 针对基于实例的学习方法存在的不足,众多学者提出了 许多挑选样本子集的方法,也就是用训练集的一个子集来 进行分类,而不是存储整个训练集。希望通过减少查询时 间和存储量的方式来解决这一问题。 挑选样本子集的方法有很多,像CNN,RNN,RT1-3, IB1-4,ICF,MCS等等。这些方法可以大体上分为三类: 1.提高分类精度。如Wilson-Editing,All k-nn。 2.保持分类能力。如CNN,RNN,MCS等。 3.混合方法。如RT1-3,IB1-4,ICF。 ICF算法-简介 ICF算法是一种混合方法。1999年,Brighton和Melli sh提出了迭代样例过滤算法(Iterative Case Filtering), 将去除噪声和去除冗余样例的过程结合起来,选取一个样 本子集,用这个子集进行分类,达到了比较理想的分类效 果。 ICF算法使用了覆盖集(Coverage)和可达集(Reachable) 的概念。来表示一个样本分对其他样本和被其他样本分对 的情况。 ICF算法-过程 【原创】定制代写 r/python/s pss/matlab/WEKA/sas/sql/ C++/stata/eviews 数据挖掘 和统计分析可视化调研报告等 服务(附代码数据),咨询邮 箱: glttom@tecdat.cn 有问题到 淘宝找“大数据部落”就可以了 改进的ICF算法-过程 改进的ICF算法,我将它称为ISS算法(Iterative Sam ple Selecting),它的过程是这样的: 1: 对原始训练集用Wilson-Editing进行除噪,得到训练集T; 2:初始化SelectSet={NULL}; 3:对于T中每一个未被标记为被覆盖的点P,寻找|Coverag ei|/|Reachablei|最大的点Pi,加入SelectSet。将Pi及C overagei 中的点标记为被覆盖,更新T中每个未被标记点的 Coverage和Reachable; 4:若T中所有点都被标记为被覆盖,转5;否则转3; 5:若T=SelectSet,转6,否则令T=SelectSet,且将T中每 个点设为未标记,转3; 6:算法结束,输出SelectSet; 改进的ICF算法-启发式对比 ICF的启发式: Reserve(p∈{pi , when|Coveragei|>=|Reachablei|}) 存在的问题: 当|Coveragei|=|Reachablei|时,即便是冗余点,pi 仍被保留。 图 改进后的启发式: Reserve(p ∈ {pi , argmaxi (|Coveragei|/|Reachablei|)}) 对于所有绿色的圆点而言, |Coverage|=|Reachable| 在最后的样本子集中,他们 全被保留下来。Iris就是这 种情况。 改进的ICF算法-更新策略对比 ICF算法在每步迭代之时的更新策略是这样的: 1.每找到一个|Coveragei|<|Reachablei|的点pi,就将pi 标记为removal。 2.找完当前训练集中所有符合启发式规则的点后,将标记为re moval的点删除,更新训练集。 3.计算更新之后训练集中各个点的Coverage和Reachable。 问题: 这种更新策略在遇到一个点的|Coverage|=|Reachabl e|的情况下会造成迭代次数的增加。 图 ICF: 1 step:标记C为待去除点,第一次迭代终止。删除C,计算: C(A)={A,B}, C(B)={B}, C(D)={D}, R(A)=(A) , R(B)={A,B} , R(D)={D} 2 step: 标记B为待去除点,第二次迭代中止。删除B,计算: C(A)={A}, R(A)=(A), C(D)={D}, R(D)={D} 3 step: 没有点可以删除,算法终止。 ISS: 1 step: ①选择A并保存,标记A及Coverage(A)中的B,C, 更新所有未标记点的Coverage , Reachable: C(D)={D},R(D)={D} ②选择D并保存,标记D,发现所有点已被标记为覆 盖,第一次迭代终止。更新训练集,这时T={A,D}; 2 step: 选择A,D后更新T,发现T’={A,D};算法终止. 实验结果 待研究工作 ICF是Wilson-Editing和启发式去除冗余两种方法的结 合。即在算法的开始先用Wilson-Editing做了去除噪声的 工作,然后再用启发式进行去除冗余的工作。能否将去除 噪声的工作结合到启发式中来,使ICF可以不用单独去噪, 在去除冗余点的过程中就可以去除噪声。 参考文献 [1] H Brighton, C Mellish. Advances in Instance Selectio n for Instance-Based Learning Algorithms [J]. Data Mining and Knowledge Discovery

相关文档

【精品推荐】PSO(ParticleSwarmOptimization)算法的改进研究PPT课件报告讲义图文
【精品推荐】时间序列分析_图文PPT课件报告讲义图文
【精品推荐】决策树算法及应用拓展PPT课件报告讲义图文
【精品推荐】R语言提升方法PPT课件报告(获奖作品) 图文
【精品推荐】时间序列预测PPT课件报告讲义图文
【精品推荐】平稳时间序列ARMA预测法PPT课件报告讲义图文
【精品推荐】程序设计PPT课件报告讲义(附代码数据)
【精品推荐】神经网络-BP算法PPT课件报告讲义
【精品推荐】第六章时间序列分析PPT课件报告讲义图文
【精品推荐】层次分析法建模PPT课件报告讲义图文
电脑版