教你用R进行数据挖掘.docx

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

教你用R进行数据挖掘

R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的RStudio(用户的界面体验更好)。也正是由于全世界越来越多的数据科学社区和用户对R包的慷慨贡献,让R语言在全球范围内越来越流行。其中一些R包,例如MASS,SparkR,ggplot2,使数据操作,可视化和计算功能越来越强大。

我们所说的机器学习和R有什么关系呢?我对R的第一印象是,它只是一个统计计算的一个软件。但是后来我发现R有足够的能力以一个快速和简单的方式来实现机器学习算法。这是用R来学习数据科学和机器学习的完整教程,读完本文,你将有使用机器学习的方法来构建预测模型的基本能力。

注:这篇文章对于之前没有很多数据科学知识的同学们是特别值得一看的,同时

注:这篇文章对于之前没有很多数据科学知识的同学们是特别值得一看的,同时掌握一定的代数和统计知识将会更有益于您的学习。

一、初识R语言

1

1、为什么学R?

事实上,我没有编程经验,也没有学过计算机。但是我知道如果要学习数据科学

事实上,我没有编程经验,也没有学过计算机。但是我知道如果要学习数据科学,一个人必须学习R或Python作为开始学习的工具。我选择了前者,同时在学习过程中我发现了一些使用R的好处:

用R

用R语言编码非常的简单;

R是一个免费的开源软件,同时它可以直接在官网上下载;

R语言中有来自于全世界爱好者贡献的即时访问超过7800个用于不同计算的R包。

?

?

R语言还有遍布全世界的学习社区及论坛,你能很轻松的获取帮助;

R语言还有遍布全世界的学习社区及论坛,你能很轻松的获取帮助;

我们凭借R包能够获得高性能的计算体验;

它是,数据分析公司高度寻求技能之一。

2、如何安装R/Rstudio?

?

?

你可以/官网下载并安装R,需要注意的是R的更新速度很快,下载新版本的体验会更好一些。

另外

另外,我建议你从RStudio开始,因为RStudio的界面编程体验更好一些。你可以通过/products/rstudio/download/在“支持的平台上安装”部分中,根据您的操作系统选择您需要的安装程序。点击桌面图标RStudio,就开始你的编程体验,如下图所示:

让我们快速的了解一下

让我们快速的了解一下R界面

Rscript::在这个空间里可以写代码,要运行这些代码

Rscript::在这个空间里可以写代码,要运行这些代码,只需选择的代码行和按下Ctrl+R即可或者,你可以点击“运行”按钮位置在右上角R的脚本。

Rconsole

Rconsole:这个区域显示的输出代码运行:,同时你可以在控制台直接写代码。但是代码直接进入R控制台无法追踪。

R环境:这个空间是显示设置的外部元素补充道。这里面包括数据集、变量向量,还可以检查R数据是否被正确加载。

图形输出窗口:这个空间显示图表中创建的探索性数据分析。不仅仅输出图形,您可以选择包,寻求帮助和嵌入式R的官方文档。

3、如何安装包?

?

?

R的计算能力在于它拥有强大的R包。在R中,大多数数据处理任务可以从两方面进行,使用R包和基本功能。在本教程中,我们将介绍最方便的和强大的R包。特别的,一般不太建议直接在R软件的中直接安装加载包,因为这样可能会影响你的计算速度。我们建议你直接在R的官网上下载好您所需要的R包,通过本地安装的形式进行安装,如下:

在软件中安装:install.packages(“packagename”)

本地安装:install.packages(“E:/r/ggplot2_2.1.0.zip”)

4

4、用R进行基本的统计计算

让我们开始熟悉

让我们开始熟悉R的编程环境及一些基本的计算,在R编程脚本窗口中输入程序,如下:

安装脚本

安装脚本

类似地

类似地,您也可以自己尝试各种组合的计算形式并得到结果。但是,如果你做了太多的计算,这样的编程未免过于麻烦,在这种情况下,创建变量是一个有用的方法。在R中,您可以创建变量的形式来简化。创建变量时使用-或=符号,例如我想创建一个变量x计算7和8的总和,如下:

变量总和

变量总和

特别的,一旦我们创建一个变量

特别的,一旦我们创建一个变量,你不再直接得到的输出,此时我们需要输入对应的变量然后再运行结果。注意,变量可以是字母,字母数字而不是数字,数字是不能创建数值变量的、

二、编程基础慨念及R包

1、R中的数据类型和对象

数据类

文档评论(0)

tianya189 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体阳新县融易互联网技术工作室
IP属地湖北
统一社会信用代码/组织机构代码
92420222MA4ELHM75D

1亿VIP精品文档

相关文档