R数据接口_Excel文件
Microsoft Excel是使用最广泛的电子表格程序,它是以.xls
或.xlsx
格式存储数据。 R可以使用某些excel特定的包直接读取这些文件的内容。一些常用的软件包有 - XLConnect
,xlsx
,gdata
等。在这个篇文章中,我们将使用xlsx
软件包。 R也可以使用这个包写入excel
文件。
安装xlsx
软件包
可以在R控制台中使用以下命令来安装xlsx
软件包。它可能会要求安装一些这个包所依赖的附加包。按照相同的命令与所需的包名来安装附加的包。
install.packages("xlsx")
验证并加载“xlsx
”软件包
使用以下命令来验证和加载xlsx
包。参考以下代码 -
# Verify the package is installed. any(grepl("xlsx",installed.packages())) # Load the library into R workspace. library("xlsx")
当脚本运行时,得到以下输出 -
[] TRUE Loading required package: rJava Loading required package: methods Loading required package: xlsxjars
注: 如果第一个输出结果为:FALSE
,请 install.packages("xlsx")
语句重新加载安装。
准备xlsx
文件用作为输入
打开Microsoft excel
。将以下数据复制并粘贴到名为sheet1
的工作表中。
id name salary start_date dept 1 Rick 623.3 1/1/2012 IT 2 Dan 515.2 9/23/2013 Operations 3 Michelle 611 11/15/2014 IT 4 Ryan 729 5/11/2014 HR 5 Gary 843.25 3/27/2015 Finance 6 Nina 578 5/21/2013 IT 7 Simon 632.8 7/30/2013 Operations 8 Guru 722.5 6/17/2014 Finance
如下所示 -
还将以下数据复制并粘贴到另一个工作表,并将此工作表重命名为city。
name city Rick Seattle Dan Tampa Michelle Chicago Ryan Seattle Gary Houston Nina Boston Simon Mumbai Guru Dallas
如下所示 -
将Excel文件另存为“input.xlsx”,应该将此文件保存在R工作区的当前工作目录中。
读取Excel文件
使用read.xlsx()
函数读取input.xlsx,如下所示,结果作为数据帧存储在R环境中。
# Read the first worksheet in the file input.xlsx. data <- read.xlsx("input.xlsx", sheetIndex = ) print(data)
当我们执行上述代码时,会产生以下结果 -
id name salary start_date dept Rick 623.30 2012-01-01 IT Dan 515.20 2013-09-23 Operations Michelle 611.00 2014-11-15 IT Ryan 729.00 2014-05-11 HR NA Gary 843.25 2015-03-27 Finance Nina 578.00 2013-05-21 IT Simon 632.80 2013-07-30 Operations Guru 722.50 2014-06-17 Finance
相关推荐
xceman 2020-09-22
bcbeer 2020-08-27
风萧萧梦潇 2020-08-17
夕加加 2020-07-20
LuckyDeng 2020-07-08
huangchunxia 2020-07-08
lbPro0 2020-07-05
葉無聞 2020-07-05
万里之书 2020-07-04
冰蝶 2020-07-04
yuzhongdelei0 2020-07-04
meiseeny 2020-06-28
RuoShangM 2020-06-28
bianxq 2020-06-28
80327065 2020-06-28
Codeeror 2020-06-28
somyjun 2020-06-25
xuanlvhaoshao 2020-06-16