精编制作基于遗传算法的特征选择PPT课件
22页1、基于遗传算法的特征选择 WhatWhyHow 回答什么是遗传算法 什么是特征选择 遗传算法是模拟进化论 搜索优化问题最优解的一种算法 它采用群体搜索策略 一代一代逐步进化 直到收敛到问题的最优解 群体是个体的集合 个体模拟一个问题的一个解 关键问题 个体如何表示 方法 问题编码如何产生下一代 方法 遗传操作如何评价种群的质量 方法 适应度函数 What 什么是特征选择 就是从一个特征集合中选择一个最优子集 遗传算法流程图 How 1 问题编码对于特征选择问题 问题编码很简单 采用0 1编码即可 任何一个n元0 1串 都表示问题的一个解 2 如何产生下一代通过选择 交叉 变异三种遗传操作产生下一代 前两种操作每一次都要用的 而第三种则不一定 但没有规则 选择是用来选择交叉的父本 交叉 模拟有性繁殖 产生新的个体 变异是某一位的变异 3 如何评价种群的质量适应度函数设计 对于特征选择问题可采用如下的类别可分离性准则 设计适应度函数 适应度函数为 需要注意的是这种适应度函数 只适用于连续值数据库的情况 下面如何计算 Iris数据库 选择的特征子集应使类内散度尽可能小 而使类间散度尽可能大 设
2、xk i 和xl j 分别为 i类和 j类中的D维特征向量 xk i xk j 为这两个向量间的距离 则类间平均距离为 其中 Pi和Pj为先验概率 通常采用欧氏距离 JD称为各类之间的平均平方距离 定义类均值向量为和总均值向量分别为 和 定义类间散度矩阵Sb的估计为 定义类内散度矩阵Sw的估计为 其中 i为类协方差矩阵 其他需要说明的问题还有 Q1初始种群的产生主要涉及到 1 群体的规模N 2 初始化种群 种群的规模N越大 种群的多样性越好 GA陷入局部极小的可能性越小 但N太大 计算量会很大 收敛速度也会降低 N太小 GA搜索的空间被限制在一个较小的范围内 可能导致早熟 应根据问题的维数和难度来设定N 一般地 维数和难度越高 N应越大 建议N一般取为几十到几百之间 初始化种群一般用随机化方法产生 a 选择 Selection 算子依据每个染色体的适应值大小 适应值越大 被选中的概率就越大 其子孙在下一代产生的个数就越多 选择操作是建立在群体中个体的适应值评估基础上的 目前常用的选择算子有赌轮选择方法 保留最佳个体选择法 期望值选择方法等 a 1 赌轮方法 准备步 S1 按如下公式计算
《精编制作基于遗传算法的特征选择PPT课件》由会员ahu****ng2分享,可在线阅读,更多相关《精编制作基于遗传算法的特征选择PPT课件》请在金锄头文库上搜索。
某销售公司专业培训资料(ppt 64页)
某公司市场营销策略研究(PPT 46页)
网络营销导向的企业网站建设(powerpoint 32页)
整合营销传播的设计与管理(powerpoint 58页)
某地产营销策略报告(PPT 114页)
网络营销基础(powerpoint 80页)
网络营销的理论基础(powerpoint 35页)
基于数据挖掘的数据业务精确营销(powerpoint 44页)
社区宽带综合业务系统(powerpoint 32页)
某公司市场营销策略研究(PPT 46页)
某地产营销策略报告(PPT 114页)
营销策略案例汇总(2个powerpoint 1个pdf 29个doc)
华为Sx700交换机销售策略指导书(PPT 51页)
信托业务政策汇编(powerpoint 195页)
消费者期望及感知动机的作用研讨(powerpoint 78页)
电视台汽车栏目营销策略研究(powerpoint 55页)
微信营销概述(powerpoint 89页)
销售计划管理讲义课件(powerpoint 73页)
某含片营销策略研究报告(powerpoint 82页)
贵金属网络营销方案(powerpoint 45页)
2023-09-09 110页
2023-09-09 107页
2023-03-07 70页
2023-03-07 178页
2022-07-14 64页
2022-07-14 95页
2022-07-14 52页
2022-07-14 56页
2022-07-13 43页
2022-07-13 44页