PCA降维度实验报告
10页1、PCA降维题 目(22) PCA成 员2014年6月1日摘要为了提高统计模式识别的正确识别率,人们通常需要采集数量巨大的数据特 征,使得原始空间或输入空间的维数可能高达几千维或万维。如果直接在输入空 间上进行分类器训练,就可能带来两个棘手的问题:(1)很多在低维空间具有良 好性能的分类算法在计算上变得不可行;(2)在训练样本容量一定的前提下,特 征维数的增加将使得样本统计特性的估计变得更加困难,从而降低分类器的推广 能力或泛化能力,呈现所谓的“过学习”或“过训练”的现象。要避免出现“过 学习”的情况,用于统计分类器训练的训练样本个数必须随着维数的增长而呈指 数增长,从而造成人们所说的“维数灾难”。这一问题可以通过降维来解决。因 为高维数据中包含了大量的冗余并隐藏了重要关系的相关性,降维的目的就是消 除冗余,减少被处理数据的数量,同时还能保持数据的特征完整性,本次实验使 用 26 维度的语音参数 MFCC 验证 PCA 降维算法。关键字:降维、PCA、MFCC1. 算法分析1.1 PCA 简介PCA 的目标是为了发现这种特征之间的线性关系,检测出这些线性关系,并 且去除这线性关系。PCA
2、称为主成分分析或者主元分析。是一种数据分析的降维 方法,一般常用于图像处理,它可以从多元事物中解析出主要影响因素,揭示事 物的本质,简化复杂的问题。计算主成分的目的是将高维数据投影到较低维空间。 一类事物的特征会很多,而每个特征也有很高的维数。但有些维数之间有很大的 相似性,相同的维数难以区分特性,所以 PCA 的目标是为了发现这种特性维度 之间的线性关系,检测出这些线性关系,并且去除这线性关系。1.2 PCA 算法设XI、X2:,Xp为原始变量,Fl、F2,Fm为m个主成分因子F a X + a X +. + a X1 11 1 21 2p 1 p其使方差Var(Fl)越大,表示F1包含的信息越多,故称F1为第一主成分。F a X + a X +. + a X1 11 112 21 ppF a X + a X +. + a X2 2112222 p pF a X + a X +. + a Xmm11m 2 2mp p(1) Fi 与 Fj 互不相关,Cov(Fi, Fj) = 0(2) F1是Xl,X2,,Xp的一切线性组合中方差最大的,,即Fm是与F1, F2,,Fm-1都不相关的
3、Xl,X2,,XP的所有线性组合中方差最大者。 Fl,F2,,Fm(mWp)为构造的新变量指标,即原变量指标的第一、第二、 第 m 个主成分。1.3 PCA降维步骤(1)计算原变量协方差矩阵、工(s )1 n_ij pxP _i, j = 1,2,ps = y (x - X.)(x - x.)j n 1 ki i j k=1(2)求出工的特征值 及相应的正交化单位特征向量为的前m个较大的特征值12m0,就是前m个主成分对应的方差,对应的单位特征向量 就是原来变量在主成分Fi上的载荷系数(数学上可以证 明),则原变量的第i个主成分Fi为:F = aTXi i i主成分的方差(信息)贡献率用来反映信息量的大小,为:(3)选择主成分最终要选择几个主成分,即F1,F2,Fm中m的确定是通过方差累计贡献区九G (m) = i=1 率G(m)来确定Y九kk=1当累积贡献率大于85%时,就认为能足够反映原来变量的信息了,对应的m就 是抽取的前m个主成分。2. 实验过程2.1实验环境MATLAB 2014a+windows 8 操作系统MATLAB是一种用于算法开发、数据可视化、数据分析以及数值计算的
4、高级技术计算语言和交互式环境。除了矩阵运算、绘制函数/数据图像等常用功能外, MATLAB还可以用来创建用户界面及与调用其它语言(包括C,C+和FORTRAN) 编写的程序。而2014a是第一个支持中文的MATLAB版本。Windows 8是由微软公司于2012年10月26日正式推出的操作系统。系统 独特的 metro 开始界面和触控式交互系统,旨在让人们的日常电脑操作更加简单 和快捷,为人们提供高效易行的工作环境。其支持来自Intel、AMD的芯片架构, 被应用于个人电脑和平板电脑上。该系统具有更好的续航能力,且启动速度更快、 占用内存更少,并兼容 Windows 7所支持的软件和硬件。2.2 实验步骤1. 打开 MATLAB 2014a,点击_,将MATLAB的工作文件夹定位到mfcc.mat所在目录下,如下图:命令行窗口 *宙込J. C: Users Jackeven De&lctop data当前文件夹窖称bank-data.arff i_jj bank-new.arFf i i mfcc.mat图 2-12. 双击mfcc.mat,将数据加载到工作区。3. 在命令行窗口输入命
《PCA降维度实验报告》由会员汽***分享,可在线阅读,更多相关《PCA降维度实验报告》请在金锄头文库上搜索。
R语言基本操做
销量增长动力模型创建谈
2023年解除劳动协议书186范文.docx
工厂消防安全教育培训制度
2023年可行性研究报告范文2.docx
2023工作方案5268范文.docx
销售业务员个人总结范文(2篇).doc
黄鹤楼送孟浩然之广陵的阅读答案
2023年老婆道歉信五篇.docx
吊篮租赁安拆协议书
2023年课前三分钟演讲稿279范文.docx
2023年合资购房合同范文.docx
一年级数学教师的述职报告.docx
2023年下飞行棋日记.docx
地区代理合同
《什么是最好的教育》的启发
洪湖初中地理坊作品集.doc
浙江宁波北仑大碶街道招考聘用编外工作人员押题卷(第4版)
2023年策划公司岗位职责.docx
热闹的小吃店+王巧红+晋中市第一幼儿园
2023-02-24 4页
2022-11-01 1页
2023-11-04 5页
2023-02-22 5页
2023-01-27 16页
2022-09-26 13页
2023-11-24 4页
2024-01-21 10页
2022-10-29 15页
2023-10-20 16页