S快速入门 - 浙江大学电子邮件系统.doc

  1. 1、本文档共90页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
S快速入门 - 浙江大学电子邮件系统.doc

S快速入门 背景介绍 S语言是由ATT贝尔实验室开发的一种用来进行数据探索、统计分析、作图的解释型语言。它的丰富的数据类型(向量、数组、列表、对象等)特别有利于实现新的统计算法,其交互式运行方式及强大的图形及交互图形功能使得我们可以方便的探索数据。 目前S语言的实现版本主要是S-PLUS。它基于S语言,并由MathSoft公司的统计科学部进一步完善。作为统计学家及一般研究人员的通用方法工具箱,S-PLUS强调演示图形、探索性数据分析、统计方法、开发新统计工具的计算方法,以及可扩展性。 S-PLUS可以直接用来进行标准的统计分析得到所需结果,但是它的主要的特点是它可以交互地从各个方面去发现数据中的信息,并可以很容易地实现一个新的统计方法。 S-PLUS有微机版本和工作站版本,它是一个商业软件。Auckland大学的Robert Gentleman 和 Ross Ihaka 及其他志愿人员开发了一个R系统,其语法形式与S语言基本相同,但实现不同,两种语言的程序有一定的兼容性。R是一个GPL自由软件,现在的版本是1.00版,它比S-PLUS 还少许多功能,但已经具有了很强的实用性。我们在这里尽量介绍S-PLUS和R都能使用的功能,且以R为主。下面我们用S统称S-PLUS和R。 入门实例 S的基本界面是一个交互式命令窗口,命令提示符是一个大于号,命令的结果马上显示在命令下面。S命令主要有两种形式:表达式或赋值运算(用-表示)。在命令提示符后键入一个表达式表示计算此表达式并显示结果。赋值运算把赋值号右边的值计算出来赋给左边的变量。可以用向上光标键来找回以前运行的命令再次运行或修改后再运行。 S是区分大小写的,所以x和X是不同的名字。 我们用一些例子来看S-PLUS的特点。假设我们已经进入了S-PLUS(或R)的交互式窗口。如果没有打开的图形窗口,在R中,用: x11() 在S-PLUS Windows版中用: win.graph() 可以打开一个作图窗口。然后,输入以下语句: x1 - 0:100 x2 - x1*2*pi/100 y - sin(x2) plot(x,y, type=l) 这些语句可以绘制正弦曲线图。其中,“-”是赋值运算符。0:100表示一个从0到100 的等差数列向量。从第二个语句可以看出,我们可以对向量直接进行四则运算,计算得到的x2 是向量x1的所有元素乘以常数2*pi/100的结果。从第三个语句可以看到函数可以以向量为输入,并可以输出一个向量,结果向量y的每一个分量是自变量x2的每一个分量的正弦函数值。从最后一个语句可以看出函数的调用也很自由,可以按位置给出自变量,也可以用“自变量名=”的形式指定自变量值,这样可以使用缺省值。 下面我们看一看S的统计功能。 marks - c(10, 6, 4, 7, 8) mean(marks) [1] 7 sd(marks) [1] 2.236068 median(marks) [1] 7 min(marks) [1] 4 max(marks) [1] 10 boxplot(marks) 第一个语句输入若干数据到一个向量,函数c()用来把数据组合为一个向量。后面用了几个函数来计算数据的均值、标准差、中位数、最小值、最大值。最后的函数绘制数据的盒形图。例中sd()是R中才有的函数,在S-PLUS中要用sqrt(var())来计算。在S命令方式中要显示一个表达式的值只要键入它。 为了演示S的回归计算,我们把SAS中的例子数据SASUSER.CLASS输出到了一个文本文件CLASS.TXT,SAS程序如下: data _null_; set sasuser.class; file class.txt; put name sex age height weight; run; 我们在R中把这个文件读入为为一个数据框(data frame,相当于SAS中的数据集),并进行回归,绘制数据散点图和回归直线。假设图形窗口已经打开,程序及结果如下: cl - read.table(c:/work/class.txt, + s=c(Name, Sex, Age, Height, Weight)) cl Name Sex Age Height Weight 1 Alice F 13 56.5 84.0 2 Becka F 13 65.3 98.0 3 Gail F 14 64.3 90.0 4 Karen F 12 56.3 77.0 5 Kathy F 12 59.8 84.5 6 Mary F

文档评论(0)

kunpengchaoyue + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档