pearson, kendall 和spearman三种相关分析方法的区别 (2)

当两变量不符合双变量正态分布的假设时,需用Spearman秩相关来描述变量间的相互变化关系。此时,散点图上散点的分布形态不能完全描述两变量间的相关关系,故此时一般不需再绘制散点图。

例7-2  用60Co对狗造成急性放射病,对照射后5天时的健康状况进行综合评分,并记录其存活天数,见表7.7。试作等级相关分析。

表7.7  狗急性放射病综合评分及其存活天数

综合评分

 

79

 

80

 

91

 

90

 

70

 

87

 

92

 

存活天数

 

45

 

30

 

16

 

24

 

28

 

25

 

14

 

将综合评分和存活天数分别用变量x和y表示,编制程序如下。

data temp;

 

input x y@@;

 

datalines;

 

79 45 80 30 91 16 90 24

 

70 28 87 25 92 14

 

;

 

proc corr spearman nosimple;

 

var x y;

 

run; quit;

 

Proc corr语句的spearman选项即要求用Spearman秩相关来进行数据分析,nosimple选项则用来禁止对变量描述性统计量的输出。

提交上述程序,结果如下。

The SAS System      19:34 Monday, December 23, 2002   6

The CORR Procedure

2  Variables:    x        y

Spearman Correlation Coefficients, N = 7

Prob > |r| under H0: Rho=0

x             y

x        1.00000        -0.89286

0.0068

y       -0.89286         1.00000

0.0068

SAS仍旧给出相关系数矩阵,其内容和Pearson相关分析的完全一样,只不过相关系数的计算方法不同而已。

3. 对于kendall tau correlation coefficient,可参考

对于上述三个相关性分析,有篇简单介绍计算的:

三、不同类型资料的回归分析

1. 单变量线性回归分析

这里所指的单变量,是针对自变量个数而言的,在不特别说明的情况下,应变量均为单个变量。单变量线性回归为回归分析中最为简单的情形,也是其它类型回归分析的基础。

例7-3  针对例7-1资料,分娩时脐带血TSH水平(mU/L)受母血TSH水平的影响,试进行回归分析。

此例资料中,脐带血TSH水平随母血TSH水平的变化而变化,前者应被看作为应变量,用y表示,后者为自变量,用x表示。编制如下程序。

data temp;

 

input x y@@;

 

datalines;

 

1.21 3.90 1.30 4.50 1.39 4.20 1.42 4.83 1.47 4.16

 

1.56 4.93 1.68 4.32 1.72 4.99 1.98 4.70 2.10 5.20

 

;

 

proc reg;

 

model y=x;

 

run; quit;

 

虽然reg过程选项、语句复杂,但我们经常用到的一般比较简单,此例即为最简单的情形,达到了reg过程程序代码的最低限度。提交上述程序,结果如下。

The SAS System   10:35 Wednesday, December 25, 2002   1

The REG Procedure

Model: MODEL1

Dependent Variable: y

Analysis of Variance

Sum of           Mean

Source                   DF        Squares         Square    F Value    Pr > F

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zgdjjw.html