R学习笔记系列—R语言基础知识概述

0.3 R基本知识

本书以数据分析逻辑为框架,并不专门讲 R 语言,只有在讲到相关的数据分析知识的时候,才会涉及到 R 语言本身。因此我们在此简单介绍一些 R 的基本概念,方便读者迅速掌握相关知识,熟悉 R 的使用。

0.3.1 函数

函数(function)是一个可供使用者调用的方法,其定义包括函数名和函数参数。比如,求平均数的函数 mean() ,其调用格式如下:

R学习笔记系列—R语言基础知识概述

其中 mean 是函数名,括号里的 x 、trim、na.rm 为参数,有些参数有 = 号,后面跟着默认值,意思是若调用时不指定该参数,则默认使用等号后面的值。对于参数的使用,可以按照顺序,也可以根据名称,根据名称时顺序可以随便。本书推荐的做法是,在第一个有默认值的参数前面的参数不使用名称,根据顺序直接赋值;之后的用名称赋值。

R学习笔记系列—R语言基础知识概述

在上面的例子中,有的行前面有 > 号,其实 R 命令行的提示符,意思是该行为调用 R 语句;行前面有 # 表示该行是注释,用于说明其下面的语句;其余的为结果行,即 调用 R 语句后输出的结果。比如 [1] 4.9。

0.3.2 使用帮助

R 的帮助系统非常强大,在 R 控制台键入相应的函数即可获得帮助,非常方便。在使用R的过程中,一定要养成经常使用 R 帮助系统查看相应文档的习惯,只有这样才能事半功倍。

常见的R帮助函数如下表所示。

帮助函数功能
help.start()打开R帮助首页
help(package="vcd")打开包 vcd 的帮助页
?min查看 min 函数或数据集的帮助
??min在本地文档中查找 min 关键词
example("min")显示 min 函数的使用示例
data()显示当前已经加载的数据集

0.3.3 安装和使用包

与其说 R 是一个统计分析软件,倒不如说 R 是一个包含了诸多功能的计算平台。在 R 中,基本的数学运算和统计分析功能集成在底层,能够直接使用。但绝大部分功能,是通过包(Package)的形式提供的。R 基础安装包含了约 25个包,被称之为标准或推荐包,其余的需要使用者自行安装。R 拥有一个庞大的社区,截至2017年8月8日,共有11203个包供开发者使用,几乎囊括了数据分析所需的一切工具。而且,若真的找不到需要的包,R还提供了非常方便的机制,让你快速编写自己的函数和包!

包的安装和使用非常简单,一些主要的用法如下所示。

R学习笔记系列—R语言基础知识概述

需要注意的是,在安装包时,应选择国内的镜像,可以加快包的下载速度。在R自带的 RGui 中首次调用 install.packages() 时,会自动弹出镜像选择框。但在 RStudio 中需要使用者手动设置镜像。可以通过 Tools => Global Options 打开对话框设置。

R学习笔记系列—R语言基础知识概述

0.3.4 配置 R 环境参数

R 有一些全局的参数,比如数值显示的位数、包镜像地址、超时时间等等,使用者可以根据实际需要用 options() 函数定义。

R学习笔记系列—R语言基础知识概述

在 R 基础安装中,大致有 50 多个可定义的参数 ,大家可以使用

> ?options

查看文档了解详细信息。

0.3.5 R语言的一些规则说明

  • R 语言是区分大小写的,比如上一节安装包的命令 install.packages() 就不能写成 Install.Packages()。

  • R 语言中 "." 号没有特殊的含义,在其语法规则中,与别的字符一样是普通字符。但在变量或 者函数命名时,通常会一般用于做语义的分割,比如 install.packages()。如果熟悉 Java、C# 等编程语言,就发现这和其它编程语言有较大的区别。

  • R 语言不支持 C 风格语言那样的多行注释功能,只能通过 # 符号进行单行注释。

  • R 中赋值符号有两种,一种是 <-,一种是 = ,在大部分情况下,两者是相同的。但是在某些情况下,两者的行为有差别,比如:

R学习笔记系列—R语言基础知识概述

本书使用 = 号,一是因为简单,和别的编程语言一致;二是本书建议要养成良好的编程风格,其中之一就是语句尽量简单,不赞成在函数参数赋值过程中创建新变量的编程风格。关于什么是好的编程习惯,以后会专门介绍到。


喜欢闲适安静的生活,懂一点统计学和数据分析,懂一点计算机编程。(爱编程爱统计)

相关推荐