
非参数统计R软件参考答案.doc
18页1、内容:A.3, A.10, A.12A.3 上机实践:将MASS数据包用命令library(MASS)加载到R中,调用自带“老忠实”喷泉数据集geyer,它有两个变量:等待时间waiting和喷涌时间duration,其中(1) 将等待时间70min以下的数据挑选出来;(2) 将等待时间70min以下,且等待时间不等于57min的数据挑选出来;(3) 将等待时间70min以下喷泉的喷涌时间挑选出来;(4) 将喷涌时间大于70min喷泉的等待时间挑选出来。解:读取数据的R命令:library(MASS);#加载MASS包data(geyser);#加载数据集geyserattach(geyser);#将数据集geyser的变量置为内存变量(1) 依题意编定R程序如下:sub1geyser=geyserwhich(waiting70),1;#提取满足条件(waiting70)的数据,which(),读取下标sub1geyser1:5;#显示子数据集sub1geyser的前5行1 57 60 56 50 54(2) 依题意编定R程序如下:Sub2geyser=geyserwhich(wait
2、ing70)&(waiting!=57),1;#提取满足条件(waiting70& (waiting!=57)的数据.Sub2geyser1:5;#显示子数据集sub1geyser的前5行1 60 56 50 54 60 原数据集的第1列为waiting喷涌时间,所以用which(waiting70),2(3) Sub3geyser=geyserwhich(waiting70),2;#提取满足条件(waiting70)的数据,which(),读取下标Sub3geyser1:5;#显示子数据集sub1geyser的前5行1 4.000000 4.383333 4.833333 5.450000 4.866667原数据集的第2列为喷涌时间,所以用which(waiting70),1;#提取满足条件(waiting70)的数据,which(),读取下标Sub4geyser1:5;#显示子数据集sub1geyser的前5行1 80 71 80 75 77.A.10如光盘文件student.txt中的数据,一个班有30名学生,每名学生有5门课程的成绩,编写函数实现下述要求:(1) 以data.f
3、rame的格式保存上述数据;(2) 计算每个学生各科平均分,并将该数据加入(1)数据集的最后一列;(3) 找出各科平均分的最高分所对应的学生和他所修课程的成绩;(4) 找出至少两门课程不及格的学生,输出他们的全部成绩和平均成绩;(5) 比较具有(4)特点学生的各科平均分与其余学生平均分之间是否存在差异。先将数据集读入R系统student=read.table(,header=T)class(student):#显示数据集student的类型,1 data.frame#student是数据框names(student);#显示数据框student的变量1 name math physics chem literat english mean#输出显示,数据框student有7个变量,第7个变量是平均值mean。(1)write.table(student,F:gzmu非参数统计data2014各章数据附录Ax.txt,col.names=T)打开x.txtname math physics chem literat english1 Katty 65 61 72 84 792 Leo 7
《非参数统计R软件参考答案.doc》由会员cl****1分享,可在线阅读,更多相关《非参数统计R软件参考答案.doc》请在金锄头文库上搜索。