能够用来做统计分析的软件和程序很多,目前应用比较广泛的包括:SPSS, SAS、R语言,Matlab,S-PLUS,S-Miner等。下面我们来看一下各应用的特点:
SPSS: 最简单的,都是菜单操作,不过不利于二次程序开发。
SAS: 需要购买,该软件录入语言要非常精确,不能出错,难操作。
R语言:免费软件,可以菜单操作,不过一般要编程的,二次程序开发。
Matlab:基本是程序操作,和R语言差不多,不过功能比较强大。
S-PLUS: 需要购买,基本也是菜单操作,和SPSS差不多。
R与SPSS、SAS相比较,拥有非常突出的优势:
1)产品线齐全。在功能与产品线齐全上已经远远超出SPSS,而与SAS不相上下。有些R的包,比如基因分析常用的Bioconductor在在线基因数据库连接等众多功能上甚至已经远远超出商业软件。
2)免费。请注意,标记为TM或者®符号的软件均需要在SPSS、SAS的基础模块基础之上另行购买,费用往往在千元美元以上。而R的一切功能均是免费。
3)开放。由于R本身是一个统计语言环境,再新的统计模型也很快能实现,所以在结构方程模型、项目反应理论、认知诊断等众多心理测量所使用的功能上,没有现成的统计软件包,使用R则完全可以自己编写算法。同样,由于R是完全开源,我们可以很快地基于研究者已经开发出的算法编写更适合自己情况的算法。
表:R与SAS、SPSS之比较
主题
SAS产品线
SPSS产品线
R语言相关包
高级模块
SAS/STAT®
SPSS Advanced Models™
stat, MASS及众多扩展包
基础模块
SAS®
SPSS Base™
R
联合分析
SAS/STAT®: Transreg
SPSS Conjoint™
homals, psychoR , bayesm
对应分析
SAS/STAT®: Corresp
SPSS Categories™
homals, MASS, FactoMineR ade4, PTAk, cocorresp, vegan, made4, PsychoR
自定义表格
SAS Base® Report、SQL, Tabulate
SPSS Custom Tables™
reshape
数据接口
SAS/ACCESS®
SPSS Data Access Pack™
DBI, foreign, RODBC
数据挖掘
Enterprise Miner™
Clementine®
rattle, arules, FactoMineR
数据校验
Various procedures
Various procedures, SPSS Data Preparation™
dprep, various functions
Exact Tests
SAS/STAT®: various
SPSS Exact Tests™
coin, elrm, exactLoglinTest, exactmaxsel, exactRankTests,及其他许多包
基因分析
SAS/Genetics®, SAS/Microarray® Solution®, JMP Genomics®
无
Bioconductor
GIS
SAS/GIS®, SAS/Graph®
SPSS Maps™
maps, mapdata, mapproj, GRASS via spgrass6, RColorBrewer及其他包的部分功能
交互图
Enterprise Guide®
SPSS Base™
JGR, R Commander, pmg, Sciviews
SAS/INSIGHT®
无
GGobi via rggobi iPlots, Mondrian via Rserve
统计图
SAS/GRAPH®
SPSS Base™
ggplot, gplots, graphics, grid, gridBase, hexbin, lattice, plotrix, scatterplot3d, vcd, lot, geneplotter, Rgraphics
分析向导
SAS/LAB®
无
无
矩阵数学
SAS/IML®, SAS/IML
SPSS Matrix™
R, matlab, Matrix, sparseM
缺省值分析
SAS/STAT®: MI
SPSS Missing Values Analysis™
aregImpute (Hmisc), EMV, fit.mult.impute (Design), mice, mitools, mvnmle
统筹研究
SAS/OR®
无
glpk, linprog, LowRankQP, TSP
统计效力检验
SAS® Power and Sample Size Application, SAS/STAT: Power, GLM Power
SamplePower™
asypow, powerpkg, pwr, MBESS
品质控制
SAS/QC®
SPSS Base™
qcc, spc
回归模型
SAS/BASE®
SPSS Regression Models™
R, Hmisc, Design, lasso, VGAM, pda
抽样及调查
SAS/STAT®: surveymeans,等
SPSS Complex Samples™
pps, sampfling, sampling, spsurvey, survey
结构方程模型
SAS/STAT®: Calis
Amos™
sem
文本分析
Text Miner
SPSS Text Analysis for Surveys™, Text Miner for Clementine®
Rstem, lsa, tm
时间序列
SAS/ETS®
SPSS Trends™ Expert Modeler
大量的包可完成
决策树
Enterprise Miner™
SPSS Classification Trees™, AnswerTree™
ada, adabag, BayesTree, boost, GAMboost, gbev, gbm, maptree, mboost, mvpart, party, pinktoe, quantregForest, rpart, rpart.permutation, randomForest, randomForests, tree