R 语言 简单介绍
一.统计分析软件说明
统计分析软件有:SPSS, SAS、R语言,Matlab,S-PLUS,S-Miner。
SPSS: 最简单的,都是菜单操作,不过不利于二次程序开发。
SAS: 需要购买,该软件录入语言要非常精确,不能出错,难操作。
R语言:免费软件,可以菜单操作,不过一般要编程的,二次程序开发。
Matlab:基本是程序操作,和R语言差不多,不过功能比较强大。
S-PLUS: 需要购买,基本也是菜单操作,和SPSS差不多。
R与SPSS、SAS相比较,拥有非常突出的优势:
1)产品线齐全。在功能与产品线齐全上已经远远超出SPSS,而与SAS不相上下。有些R的包,比如基因分析常用的Bioconductor在在线基因数据库连接等众多功能上甚至已经远远超出商业软件。
2)免费。请注意,标记为TM或者®符号的软件均需要在SPSS、SAS的基础模块基础之上另行购买,费用往往在千元美元以上。而R的一切功能均是免费。
3)开放。由于R本身是一个统计语言环境,再新的统计模型也很快能实现,所以在结构方程模型、项目反应理论、认知诊断等众多心理测量所使用的功能上,没有现成的统计软件包,使用R则完全可以自己编写算法。同样,由于R是完全开源,我们可以很快地基于研究者已经开发出的算法编写更适合自己情况的算法。
表:R与SAS、SPSS之比较
主题 | SAS产品线 | SPSS产品线 | R语言相关包 |
高级模块 | SAS/STAT® | SPSS Advanced Models™ | stat, MASS及众多扩展包 |
基础模块 | SAS® | SPSS Base™ | R |
联合分析 | SAS/STAT®: Transreg | SPSS Conjoint™ | homals, psychoR , bayesm |
对应分析 | SAS/STAT®: Corresp | SPSS Categories™ | homals, MASS, FactoMineR |
自定义表格 | SAS Base® Report、SQL, Tabulate | SPSS Custom Tables™ | reshape |
数据接口 | SAS/ACCESS® | SPSS Data Access Pack™ | DBI, foreign, RODBC |
数据挖掘 | Enterprise Miner™ | Clementine® | rattle, arules, FactoMineR |
数据校验 | Various procedures | Various procedures, | dprep, various functions |
Exact Tests | SAS/STAT®: various | SPSS Exact Tests™ | coin, elrm, exactLoglinTest, |
基因分析 | SAS/Genetics®, | 无 | Bioconductor |
GIS | SAS/GIS®, | SPSS Maps™ | maps, mapdata, mapproj, |
交互图 | Enterprise Guide® | SPSS Base™ | JGR, R Commander, pmg, |
SAS/INSIGHT® | 无 | GGobi via rggobi | |
统计图 | SAS/GRAPH® | SPSS Base™ | ggplot, gplots, graphics, grid, gridBase, hexbin, lattice, plotrix, scatterplot3d, vcd, lot, geneplotter, Rgraphics |
分析向导 | SAS/LAB® | 无 | 无 |
矩阵数学 | SAS/IML®, SAS/IML | SPSS Matrix™ | R, matlab, Matrix, sparseM |
缺省值分析 | SAS/STAT®: MI | SPSS Missing Values Analysis™ | aregImpute (Hmisc), EMV, |
统筹研究 | SAS/OR® | 无 | glpk, linprog, LowRankQP, TSP |
统计效力检验 | SAS® Power and | SamplePower™ | asypow, powerpkg, pwr, |
品质控制 | SAS/QC® | SPSS Base™ | qcc, spc |
回归模型 | SAS/BASE® | SPSS Regression | R, Hmisc, Design, lasso, VGAM, pda |
抽样及调查 | SAS/STAT®: | SPSS Complex Samples™ | pps, sampfling, sampling, |
结构方程模型 | SAS/STAT®: Calis | Amos™ | sem |
文本分析 | Text Miner | SPSS Text Analysis for | Rstem, lsa, tm |
时间序列 | SAS/ETS® | SPSS Trends™ Expert | 大量的包可完成 |
时间序列分析预测 | SAS Forecast | SPSS Trends, | 无 |
决策树 | Enterprise Miner™ | SPSS Classification | ada, adabag, BayesTree, |