Pearson相关用于双变量正态分布的资料,其相关系数称为积矩相关系数(coefficient of product-moment correlation)。进行相关分析时,我们一般会同时对两变量绘制散点图,以更直观地考察两变量之间的相互变化关系。
例7-1 某医生为了探讨缺碘地区母婴TSH水平的关系,应用免疫放射分析测定了160名孕妇(15-17周)及分娩时脐带血TSH水平(mU/L),现随机抽取10对数据,见表7.6,试对母血TSH水平与新生儿脐带血TSH水平进行相关分析。
表7.6 10名孕妇及其分娩时脐带血TSH水平
母血TSH
1.21
1.30
1.39
1.42
1.47
1.56
1.68
1.72
1.98
2.10
脐带血TSH
3.90
4.50
4.20
4.83
4.16
4.93
4.32
4.99
4.70
5.20
对资料进行相关分析之前,我们可以先对其绘制散点图,以考察两变量的真实变化关系,我们可以应用第二章中介绍过的plot过程或gplot过程来执行绘制散点图的功能。散点图完成后再计算变量之间的相关系数,对相关系数进行假设检验,以量化形式表示变量间的相关关系。
为方便起见,此处我们将绘制散点图和相关分析一次完成。此处将母血TSH水平用x1来表示,脐带血TSH水平用x2来表示,编制SAS程序如下。
data temp;
input x1 x2@@;
datalines;
1.21 3.90 1.30 4.50 1.39 4.20 1.42 4.83 1.47 4.16
1.56 4.93 1.68 4.32 1.72 4.99 1.98 4.70 2.10 5.20
;
proc gplot;
plot x2*x1=\'*\';
run;
proc corr;
var x1 x2;
run; quit;
进行Pearson相关分析是Corr过程的默认方式,故无需再在proc corr语句后指定pearson选项。
将以上程序提交执行,结果如下。
(1)两变量散点图,见图7.1。
图7.1 变量x1与x2之散点图
(2)两变量相关分析结果
The SAS System 19:34 Monday, December 23, 2002 4
The CORR Procedure
2 Variables: x1 x2
Simple Statistics
Variable N Mean Std Dev Sum Minimum Maximum
x1 10 1.58300 0.28856 15.83000 1.21000 2.10000
x2 10 4.57300 0.42277 45.73000 3.90000 5.20000
Pearson Correlation Coefficients, N = 10
Prob > |r| under H0: Rho=0
x1 x2
x1 1.00000 0.68073
0.0303
x2 0.68073 1.00000
0.0303
结果中首先给出两变量的描述性统计量,然后给出变量的相关系数矩阵(var语句所列变量中任两者之间的相关系数),对于检验假设为H0:
的假设检验结果(仅给出P值)列在相应相关系数的下面。本例中,散点图表现出明显的椭圆形,说明两变量间存在一定的直线相关,相关分析的结果也验证了这一点,相关系数不为零(P=0.0303<0.05)。
另外,用with语句可以对特定的变量对进行相关分析,此例可将corr过程中间的语句改为:
var x1;
with x2;
因此例仅有两个变量,原程序显得更为简便,但在变量较多时,with语句可发挥很好的作用。
2. Spearman秩相关
\'s_rank_correlation_coefficient