当两变量不符合双变量正态分布的假设时,需用Spearman秩相关来描述变量间的相互变化关系。此时,散点图上散点的分布形态不能完全描述两变量间的相关关系,故此时一般不需再绘制散点图。
例7-2 用60Co对狗造成急性放射病,对照射后5天时的健康状况进行综合评分,并记录其存活天数,见表7.7。试作等级相关分析。
表7.7 狗急性放射病综合评分及其存活天数
综合评分
79
80
91
90
70
87
92
存活天数
45
30
16
24
28
25
14
将综合评分和存活天数分别用变量x和y表示,编制程序如下。
data temp;
input x y@@;
datalines;
79 45 80 30 91 16 90 24
70 28 87 25 92 14
;
proc corr spearman nosimple;
var x y;
run; quit;
Proc corr语句的spearman选项即要求用Spearman秩相关来进行数据分析,nosimple选项则用来禁止对变量描述性统计量的输出。
提交上述程序,结果如下。
The SAS System 19:34 Monday, December 23, 2002 6
The CORR Procedure
2 Variables: x y
Spearman Correlation Coefficients, N = 7
Prob > |r| under H0: Rho=0
x y
x 1.00000 -0.89286
0.0068
y -0.89286 1.00000
0.0068
SAS仍旧给出相关系数矩阵,其内容和Pearson相关分析的完全一样,只不过相关系数的计算方法不同而已。
3. 对于kendall tau correlation coefficient,可参考
这里所指的单变量,是针对自变量个数而言的,在不特别说明的情况下,应变量均为单个变量。单变量线性回归为回归分析中最为简单的情形,也是其它类型回归分析的基础。
例7-3 针对例7-1资料,分娩时脐带血TSH水平(mU/L)受母血TSH水平的影响,试进行回归分析。
此例资料中,脐带血TSH水平随母血TSH水平的变化而变化,前者应被看作为应变量,用y表示,后者为自变量,用x表示。编制如下程序。
data temp;
input x y@@;
datalines;
1.21 3.90 1.30 4.50 1.39 4.20 1.42 4.83 1.47 4.16
1.56 4.93 1.68 4.32 1.72 4.99 1.98 4.70 2.10 5.20
;
proc reg;
model y=x;
run; quit;
虽然reg过程选项、语句复杂,但我们经常用到的一般比较简单,此例即为最简单的情形,达到了reg过程程序代码的最低限度。提交上述程序,结果如下。
The SAS System 10:35 Wednesday, December 25, 2002 1
The REG Procedure
Model: MODEL1
Dependent Variable: y
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F