Survival Manual for Statistical Analysis
(통계분석 생존지침서)


by Byung Gil Choi, MD, PhD.
SPSS in r x r table
Gamma, Kappa (Degree of agreement, 일치도)
개념
r x r 표 A방법 1 A방법 2 A방법 3
B방법 1 ... ... ...
B방법 2 ... ... ...
B방법 3 ... ... ...
r x r table로 구성된 비연속 변수간의 유의한 일치성이 있는지에 대한 분석
예제
Blood Total
B1
(1)
B2
(2)
B3
(3)
B4
(4)
B5
(5)
Urine U1
(1)
14
(1)(1)
0
(2)(1)
3
(3)(1)
3
(4)(1)
1
(5)(1)
21
U2
(2)
3
(1)(2)
15
(2)(2)
2
(3)(2)
3
(4)(2)
0
(5)(2)
23
U3
(3)
4
(1)(3)
6
(2)(3)
18
(3)(3)
3
(4)(3)
3
(5)(3)
34
U4
(4)
7
(1)(4)
5
(2)(4)
3
(3)(4)
14
(4)(4)
0
(5)(4)
29
U5
(5)
1
(1)(5)
4
(2)(5)
2
(3)(5)
4
(4)(5)
9
(5)(5)
20
Total 29 30 28 27 13 127
혈액진단법과 소변진단법은 서로 일치하는가?

Blood (B1 = 1, B2 = 2, B3 = 3, B4 = 4, B5 = 5)

Urine (U1 = 1, U2 = 2, U3 = 3, U4 = 4, U5 = 5)

(다른 예, A 의사의 판독과 B 의사의 판독은 일치하는가?, 2가지에서만 가능함)

DownLoad gamma_kappa.sav
DownLoad gamma_kappa_weight.sav
방법
1-1. Data 입력 (무모한 방법)

총 127개의 자료를 입력한다. 즉,
(1)(1) 14번
(1)(2) 3번
(1)(3) 4번
(1)(4) 7번
(1)(5) 1번
(2)(1) 0번
(2)(2) 15번...


1-2. Data 입력 (현명한 방법)

[MENU]-[Data]-[Weight Cases]

[Weight cases by]를 선택하고,

[Freguency VAriables]에 [weight]를 넣는다.

[OK]를 누른다.
2. 선택

[MENU]-[Analyze]-[Descriptive Statistics]-[Crosstabs]


3. 설정

[Row][Colums]에 각각의 변수를 넣고, [Statistics]를 누른다.

4. [Statistics]

[Gamma], [Kappa]를 선택하고, [Continue]-[OK]를 누른다.
결과해석
Data의 입력이 잘 되었다면,

예제와 같은 모양이 된다.

만일 이 모양이 다르다면 data 입력 과정을 재점검한다.


r (gamma) = 0.441 (p=0.000) : -1 - +1 사이의 값을 가지며, -1 또는 +1에 가까울수록 일치도가 높은 것을 의미한다.

k (kappa) = 0.436 (p=0.000) : 0 - 1 사이의 값을 가진다. 1인 경우 100% 일치를 의미한다.

최종 표현은 k = 0.436 (p=0.000) 으로 두 진단법은 유의한 중등도 일치도를 보인다
유의사항1
[Data 입력 (현명한 방법)]에서 weight값을 "0"으로 입력하는 경우 나타나는 경고문이다.
그러나 실제 통계에는 영향이 없다.
weight값이 "0"이라는 의미는 그 값이 존재하지 않는다는 의미이므로 "0"에 해당하는 [행]을 삭제하면 경고문이 사라지게 된다.
유의사항2
r x c chi-square test 로는 다음과 같은 통계분석을 시행할 수 있다.

1. Pearson's chi-square test (독립성 분석, 군간의 유의한 차이가 있는가?)

다음과 같은 전제 조건이 성립되어야 한다.

1) 어떤 하나의 셀이라도 1 이하의 값이 있으면 안된다.

2) 셀수(Cell count)의 20% 이상의 셀에서 5이하의 값이 있으면 안된다. (예: 3x3 table의 경우 9개의 셀을 갖게 된다. 이중의 20% (1.8개 셀) 이상에서는 5이하의 값이 있으면 안된다. 부연설명하면, 1개의 셀은 5이하의 값이라도 가능하지만 만약에 2개의 셀이 5이하의 값을 갖는 경우 통계적이 오류가 발생할 수 있다.)

          해결 방안: 각 셀들 적당히 합쳐서 각 셀의 값이 5이상이 되도록 조절하고 난 후에 분석을 함.

2. Linear-by-linear association (경향성 분석, 추세나 경향성이 있는가?)

독립성 분석과는 달리 셀들에 대한 제한이 없다.

독립성 분석과는 달리 군간에 어떤 연관성을 가지고 있다. 예를 들면 연령의 증가, 결석의 크기 등등..

3. Gamma, Kappa (일치도, 군간에 어느 정도 일치성이 있는가?)

독립성 분석과는 달리 셀들에 대한 제한이 없다.

가로, 세로의 숫자가 같아야 한다.

r x c table을 가진 data를 처리하고자 하는 경우 Pearson's chi-square, Linear-by-linear association을 적절히 이용하면 원하는 결과에 좀 더 가까워질 수 있다.
유의사항3
Value of k (kappa) Strength of agreement
< 0.20 Poor
0.21 - 0.40 Fair
0.41 - 0.60 Moderate
0.61 - 0.80 Good
0.81 - 1.00 Very good
by Byung Gil Choi, MD, PhD.   cbg@catholic.ac.kr  Department of Radiology, College of Medicine, The Catholic University of Korea.