R学习笔记系列—R语言基础知识概述
0.3 R基本知识
本书以数据分析逻辑为框架,并不专门讲 R 语言,只有在讲到相关的数据分析知识的时候,才会涉及到 R 语言本身。因此我们在此简单介绍一些 R 的基本概念,方便读者迅速掌握相关知识,熟悉 R 的使用。
0.3.1 函数
函数(function)是一个可供使用者调用的方法,其定义包括函数名和函数参数。比如,求平均数的函数 mean() ,其调用格式如下:
其中 mean 是函数名,括号里的 x 、trim、na.rm 为参数,有些参数有 = 号,后面跟着默认值,意思是若调用时不指定该参数,则默认使用等号后面的值。对于参数的使用,可以按照顺序,也可以根据名称,根据名称时顺序可以随便。本书推荐的做法是,在第一个有默认值的参数前面的参数不使用名称,根据顺序直接赋值;之后的用名称赋值。
在上面的例子中,有的行前面有 > 号,其实 R 命令行的提示符,意思是该行为调用 R 语句;行前面有 # 表示该行是注释,用于说明其下面的语句;其余的为结果行,即 调用 R 语句后输出的结果。比如 [1] 4.9。
0.3.2 使用帮助
R 的帮助系统非常强大,在 R 控制台键入相应的函数即可获得帮助,非常方便。在使用R的过程中,一定要养成经常使用 R 帮助系统查看相应文档的习惯,只有这样才能事半功倍。
常见的R帮助函数如下表所示。
帮助函数 | 功能 |
---|---|
help.start() | 打开R帮助首页 |
help(package="vcd") | 打开包 vcd 的帮助页 |
?min | 查看 min 函数或数据集的帮助 |
??min | 在本地文档中查找 min 关键词 |
example("min") | 显示 min 函数的使用示例 |
data() | 显示当前已经加载的数据集 |
0.3.3 安装和使用包
与其说 R 是一个统计分析软件,倒不如说 R 是一个包含了诸多功能的计算平台。在 R 中,基本的数学运算和统计分析功能集成在底层,能够直接使用。但绝大部分功能,是通过包(Package)的形式提供的。R 基础安装包含了约 25个包,被称之为标准或推荐包,其余的需要使用者自行安装。R 拥有一个庞大的社区,截至2017年8月8日,共有11203个包供开发者使用,几乎囊括了数据分析所需的一切工具。而且,若真的找不到需要的包,R还提供了非常方便的机制,让你快速编写自己的函数和包!
包的安装和使用非常简单,一些主要的用法如下所示。
需要注意的是,在安装包时,应选择国内的镜像,可以加快包的下载速度。在R自带的 RGui 中首次调用 install.packages() 时,会自动弹出镜像选择框。但在 RStudio 中需要使用者手动设置镜像。可以通过 Tools => Global Options 打开对话框设置。
0.3.4 配置 R 环境参数
R 有一些全局的参数,比如数值显示的位数、包镜像地址、超时时间等等,使用者可以根据实际需要用 options() 函数定义。
在 R 基础安装中,大致有 50 多个可定义的参数 ,大家可以使用
> ?options
查看文档了解详细信息。
0.3.5 R语言的一些规则说明
R 语言是区分大小写的,比如上一节安装包的命令 install.packages() 就不能写成 Install.Packages()。
R 语言中 "." 号没有特殊的含义,在其语法规则中,与别的字符一样是普通字符。但在变量或 者函数命名时,通常会一般用于做语义的分割,比如 install.packages()。如果熟悉 Java、C# 等编程语言,就发现这和其它编程语言有较大的区别。
R 语言不支持 C 风格语言那样的多行注释功能,只能通过 # 符号进行单行注释。
R 中赋值符号有两种,一种是 <-,一种是 = ,在大部分情况下,两者是相同的。但是在某些情况下,两者的行为有差别,比如:
本书使用 = 号,一是因为简单,和别的编程语言一致;二是本书建议要养成良好的编程风格,其中之一就是语句尽量简单,不赞成在函数参数赋值过程中创建新变量的编程风格。关于什么是好的编程习惯,以后会专门介绍到。
喜欢闲适安静的生活,懂一点统计学和数据分析,懂一点计算机编程。(爱编程爱统计)