Survival Manual for Statistical Analysis
(통계분석 생존지침서)


by Byung Gil Choi, MD, PhD.
SPSS Simple correlation analysis
(단순상관분석, Bivariate correlation analysis, 이변량 상관분석, Pearson correlation coefficient, Pearson 상관계수)
개념
2개군의 선형 관련성 분석(모수적방법)

연속변수로 구성된 두변수간의 선형 관련성이 있는가에 대한 분석방법으로 독립변수와 종속변수의 개념이 없다. 즉, 원인과 결과에 대한 개념이 없는 data를 분석하고자 하는 경우 이용된다.

예를 들어 키와 발의 크기가 선형상관관계를 이루고 있다는 상관분석 결과가 나왔을 경우 키가 크면 발이 큰 것인지, 발이 크면 키가 큰 것인지는 알 수 없다. 그러므로 원인과 결과에 대한 설명이 확실한 경우는 다른 분석법(회귀분석, Regression analysis)을 택하여야 한다. - 즉, 독립변수과 종속변수의 개념이 모호한 경우 사용함.

제3의 교란요인(Confounding factor)에 대한 고려가 필요한 경우가 있다. 예를 들어 경찰관의 숫자와 범죄발생율의 관련성을 알고자 하는 경우, 해당 지역의 인구수(제3의 교란요인)를 고려하지 않을 경우 경찰관 수가 많으면 ?죄발생율이 증가한다는 잘못된 결론에 도달할 수 있다. 그러므로 제3의 교란요인이 있을 경우 편상관 분석(Partial correlation analysis)를 이용하여야 한다.
예제
Systole BP, Diastole BP, Body Temperature, Pulse Rate, Respiration Rate, O2 Saturation 간의 관련성이 있는가?

즉 어떤 값이 증가하면 다른 값도 증가하는지 또는 감소하는지? (2개 군씩 비교하고자 한다.) DownLoad simple_correlation_analysis.sav
방법
1. Data 입력

systole (Systole BP)
diastole (Diastole BP)
BT (Body Temperature)
PR (Pulse Rate)
RR (Respiration Rate)
SpO2 (O2 Saturation)

2. 선택

[MENU]-[Analyze]-[Correlate]-[Bivariate]

3. 설정

[Variables]에 비교하고자 하는 변수를 넣고,

[Pearson]을 선택한다.

[OK]를 누른다.
결과해석


Pearson correlation coefficient를 [ r ]로 표기한다.

r 는 -1.0 에서 + 1.0사이의 값이고, -1.0 또는 +1.0에 가까워 질수록 2군간의 선형 상관관계가 강해지는 것을 의미한다.

Systole BP vs. Diastole BP r = 0.973 p = 0.000 2군간에 강한 양(+)적 선형 상관관계가 있으며, 통계적으로 유의하다.
Body Temperature vs. Pulse Rate r = 0.549 p = 0.000 2군간에 중등 양(+)적 선형 상관관계가 있으며, 통계적으로 유의하다.
Respiration Rate vs. O2 Saturation r = 0.826 p = 0.000 2군간에 강한 양(+)적 선형 상관관계가 있으며, 통계적으로 유의하다.


나머지는 유의한 선형 상관관계가 없다.
Graph

1. 선택

[MENU]-[Graphs]-[Legacy Dialogs]-[Scatter/Dot]

2. 선택

[Simple Scatter]를 선택하고

[Define]을 누른다.
3. 설정

[Y Axis]와[X Axis]에 원하는 변수를 넣고

[OK]를 누른다.
4. 결과

화면의 그래프를 [double click]한다.
5. Chart Editor

[MENU]

-[Elements]

-[Fit Line at Total]

6. Properties

[Linear]를 선택하고 [Close]를 누른다.

[Chart Editor]를 닫는다.

7. Graph

선형 상관관계를 반영하는 Fit Line이 추가된다.

그래프의 우측 상단의 R2 는 [위의 결과 해석에 있는 r의 제곱]을 의미하며,
1 (=100%)에 가까울수록 '설명력이 좋다' 라는 의미이다.

여기서 '설명력이 좋다'라는 것은 통계적 유의성을 의미하는 것이 아니고,
'선형의 상관성이 좋다'라는 뜻이다.

이 그래프를 풀이하면,

Systole BP와 Diastole BP는 통계적으로 유의한 선형 상관관계를 가지고 있으며 (p=0.000),
설명력은 94.8%이다(R2=0.948).

또는 위에 있는 r 값을 인용하는 경우

Systole BP와 Diastole BP는 통계적으로 유의한 선형 상관관계를 가지고 있으며 (p=0.000),
강한 양적 선형상관관계를 가지고 있다.(r=0.973)
유의사항
Pearson correlation coefficient를 [ r ]로 표기한다.

r 는 -1.0 에서 + 1.0사이의 값이고, -1.0 또는 +1.0에 가까워 질수록 2군간의 선형 상관관계가 강해지는 것을 의미한다.

r 선형관계 설명
-1.0 ~ -0.7 강한 음(-)적 선형관계 둘중 하나가 증가하면, 다른 하나는 감소한다.
-0.7 ~ -0.3 중등 음(-)적 선형관계
-0.3 ~ -0.1 약한 음(-)적 선형관계
-0.1 ~ +0.1 거의 무시될 만한 선형관계
+0.1 ~ +0.3 약한 양(+)적 선형관계 둘중 하나가 증가하면, 다른 하나도 증가한다.
+0.3 ~ +0.7 중등 양(+)적 선형관계
+0.7 ~ +1.0 강한 양(+)적 선형관계
by Byung Gil Choi, MD, PhD.   cbg@catholic.ac.kr  Department of Radiology, College of Medicine, The Catholic University of Korea.