电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本
换一换
首页 金锄头文库 > 资源分类 > DOC文档下载
分享到微信 分享到微博 分享到QQ空间

R语言作图之PCA作图和散点图

  • 资源ID:471783818       资源大小:55.50KB        全文页数:8页
  • 资源格式: DOC        下载积分:15金贝
快捷下载 游客一键下载
账号登录下载
微信登录下载
三方登录下载: 微信开放平台登录   支付宝登录   QQ登录  
二维码
微信扫一扫登录
下载资源需要15金贝
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

 
账号:
密码:
验证码:   换一换
  忘记密码?
    
1、金锄头文库是“C2C”交易模式,即卖家上传的文档直接由买家下载,本站只是中间服务平台,本站所有文档下载所得的收益全部归上传人(卖家)所有,作为网络服务商,若您的权利被侵害请及时联系右侧客服;
2、如你看到网页展示的文档有jinchutou.com水印,是因预览和防盗链等技术需要对部份页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有jinchutou.com水印标识,下载后原文更清晰;
3、所有的PPT和DOC文档都被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;下载前须认真查看,确认无误后再购买;
4、文档大部份都是可以预览的,金锄头文库作为内容存储提供商,无法对各卖家所售文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;
5、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据;
6、如果您还有什么不清楚的或需要我们协助,可以点击右侧栏的客服。
下载须知 | 常见问题汇总

R语言作图之PCA作图和散点图

PCA分析和散点图 今天主要跟大家演示一下简单的PCA分析,并且以散点图的形式将结果展示出来。 首先在进行PCA分析之前,先跟大家稍微讨论下什么是PCA分析.PCA分析又叫主成分分析,其实从字面上来理解我们可以发现它其实是和样品分组相关的.举个简单的例子,我们观察了某种植物的株高、叶片大小、果实大小等等多种性状,并记录每种性状对应的数值。这时候我们想看看根据这些性状信息看看我们观察的样本是否明显的分组现象。每一种性状相当于一个维度。利用PCA分析可以将结果投影到一个低维的向量空间(具体计算就不详述了)。类似的比如我们多个样本的表达谱数据,每个基因在各个样品的表达情况就可以算作一个维度。如果大家对PCA算法感兴趣的话,可以自行百度,在这里就不进行太多的描述了.毕竟今天主要是教大家怎么利用R进行PCA分析和结果展示。 还是第一步,我们先准备好我们用来分析的数据。setwd("C:/Users/gaom/Desktop”)#打开文件所在路径,并将文件所在目录作为工作目录data-read.table(file = ”test_data.txt”,header = T,sep = ”t")读取数据,并将首行作为列名dim(data)# 1 2999 13head(data) ID_REF T01 T02 T03 T04 T05 T06# 1 1007_s_at 10.198586 11.805676 10。867953 11.763660 12。072232 12。108312 2 1053_at 9。594074 8。713108 9。247096 9。433265 9.092329 9。005518# 3 117_at 8。581763 8.603680 8.804425 8.661700 8。634979 8。606976# 4 121_at 12。022315 12。655329 12.627334 12.791390 12.961761 12.885307 5 1255_g_at 7。228569 7。214600 7.237131 7。293417 7.276799 7。268233# 6 1294_at 8。828487 9。380277 9.297989 8。858985 8。995772 9.126825# T07 T08 T09 T10 T11 T12 1 10.646868 10.852744 10。675898 11.137663 10.796737 11。102408# 2 9.087681 9。027208 8。965283 8。958309 9.275010 8。940965# 3 8.625838 8。577244 8。646751 8.625843 8.625164 8.522129# 4 13。402044 13。240126 13。088883 13.234099 13.382903 13。472223# 5 7。197440 7.262662 7。289796 7。232249 7.202364 7。306229# 6 9。002385 9.003561 9。006278 9。006721 9。018183 9。164313 上述数据为从GEO数据库随意找的基因表达.其中第一列为基因探针号,后续几列则为T01到T12的12个样品对应的表达量数据,每三个样品为一组。因为数据是拼凑的,所以这里不关注探针具体信息了。 准备好数据之后我们就开始进行PCA计算了.其实代码非常简单.pca< prcomp(t(data,1), scale=T)head(pca$x)# PC1 PC2 PC3 PC4 PC5 PC6# T01 43。457435 44。950031 8.305571 3。210563 -7.4280481 14。818150 T02 42.067255 19.142248 -25.574041 21.120294 -5.7930990 14.702922# T03 -2.123455 -21.512488 11.192474 17.583006 15.2149034 34.730308 T04 8.166077 -4.774814 22.837578 -11。364128 8.4021038 -6.921738 T05 18。214073 5.836807 18。522768 -10。941626 0.6183613 5.548845# T06 27.219529 5.519328 26。649872 -11。054961 -4。1480413 5。097715 PC7 PC8 PC9 PC10 PC11 PC12# T01 -1.966342 9.2181269 -1.520882 -1。060835 3.048498 2.731227e-13# T02 5。832197 8.9793018 9.386187 1。668761 1.705474 2。674666e13# T03 5.168168 9。7483411 -11。570320 2.618203 -4。221456 2。738955e13# T04 27。782986 7.5829007 9.726761 3.391763 -21.900485 2.730871e13# T05 7.039535 -8.9173716 -2.239005 -17。514433 29。700906 2.736544e-13 T06 30。026232 -0.8253129 5.207037 12.349414 8.900676 2。681674e13summary(pca)# Importance of components: PC1 PC2 PC3 PC4 PC5 PC6# Standard deviation 21.9980 21。7992 18。5932 16。67518 16。1346 15。16897# Proportion of Variance 0.1614 0.1585 0.1153 0.09272 0。0868 0.07672# Cumulative Proportion 0.1614 0.3198 0.4351 0.52780 0.6146 0.69133# PC7 PC8 PC9 PC10 PC11# Standard deviation 14.48695 14。01978 13。4814 13。09112 12.8896 Proportion of Variance 0.06998 0.06554 0。0606 0.05714 0.0554# Cumulative Proportion 0。76131 0。82685 0。8875 0。94460 1.0000# PC12# Standard deviation 2.859e13# Proportion of Variance 0。000e+00# Cumulative Proportion 1。000e+00 上述数据中,pca$x就是后面我们画pca图要用的数据。而在summary(pca)中我们看到的Proportion of Variance就是各个主成分的方差占所有方差的比值,即对应的贡献率.而Cumulative Proportion则对应的百分比累积值。从上述结果看这组数据pca结果并不是很好,所以应该肯定会有一些分组的结果不太好。不过我们今天主要是展示结果,就不在意这些细节了。 做完上述的计算,下面就进入我们的结果展示阶段. 首先用基本画图函数展示。plot(pcax,1:2 )group <- factor(c(rep("A1”, 3), rep("A2", 3),rep("B1”, 3),rep(”B2", 3))这里我们添加分组信息colour_group<rainbow(length(unique(group)))#利用rainbow函数选择颜色colour<-colour_groupas.numeric(factor(group))#创建颜色向量colour# 1 ”FF0000FF" "#FF0000FF" "#FF0000FF" ”80FF00FF” ”#80FF00FF"# 6 "80FF00FF” "#00FFFFFF" ”#00FFFFFF” "00FFFFFF" "#8000FFFF"# 11 ”#8000FFFF” ”#8000FFFF”plot(pcax,1:2,col = colour ,pch = c(21,22,23,24)group)在plot函数中我们把分组信息和颜色方案添加进去legend("topleft", legend = levels(group),col = colour_group, pch = c(21,22,23,24)添加legendtitle("test”) 这是我们用基本函数对pca分析结果的展示。除此外我们也可以利用ggplot2包进行相同的图片绘制.示例如下:library(ggplot2)group2<data.frame(group)pca_reusltas.data.frame(pca$x)pca_reuslt<cbind(pca_reuslt,group2)p<-ggplot(pca_reuslt)+geom_point(aes(x=pca_reuslt,1,y=pca_reuslt,2,color=pca_reuslt$group,shape = pca_reusltgroup),size=5)pp+theme(legend.title =element_blank())+labs(x=”PCA1”,y="PCA2”)p 好了,上面那些基本的结果展示我们已经结束了。下面我们开始把这个图的档次再提高一点。比如,我们画了二维的,现在我们画个三维的PCA结果吧.library(scatterplot3d)par(mar=c(5。1, 4。1, 4。1, 8。1), xpd=TRUE)scatterplot3d(pca_reuslt,1:3

注意事项

本文(R语言作图之PCA作图和散点图)为本站会员(壹****1)主动上传,金锄头文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即阅读金锄头文库的“版权提示”【网址:https://www.jinchutou.com/h-59.html】,按提示上传提交保证函及证明材料,经审查核实后我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.