Survival Manual for Statistical Analysis
(통계분석 생존지침서)


by Byung Gil Choi, MD, PhD.
MedCalc in 2 x k table
Interval likelihood ratio (간격우도비)
SPSS를 이용하는 통계방법이 아니므로 프로그램 MedCalc 가 설치되어 있어야 한다.
개념
2 x k 표 Disease(+) Disease(-)
0-10 .. ..
10-20 .. ..
20-30 .. ..
30-40 .. ..
40-50 .. ..
ROC curve과 Peason's chi-square test를 융합하는 개념

독립변수 (이분된 비연속변수)
종석변수 (연속변수 또는 순위변수)

종속변수를 간격변수로 변환하여 2 x k table로 만들어 실행함 (자동 또는 수동).

연속 또는 순위변수를 간격변수로 변환함으로 좀 더 의미 있는 결과를 도출할 수 있다.
예제
질환(disease)을 진단하는 새로운 검사(new_study)가 도입되어, 질환에 따라 새로운 검사결과가 나왔다.

새로운 검사결과를 간격으로 나누고 각 간격의 우도비(likelihood ratio)와 95% 신뢰구간을 알아 보고자 한다. DownLoad interval_likelihood_ratio.mc1
방법

1. Data 입력

disease (Negative = 0, Positive =1)

new_study (연속변수)

**SPSS와 차이점
각 변수를 상세 설명할 수 있는 Label을 넣을 수 없다.
첫 번째줄에 변수명을 넣도록 되어 있고, 실제 data는 두 번째줄부터 입력하여야 한다.

2. 선택

[MENU]-[Statistics]-[ROC Curves]-[Interval likelihood ratios]

3. 설정

[Variable]에 분석하고자 하는 검사(new_study)을 넣고,

[Classification variable]에 확진(disease)을 넣는다.

[OK]를 누른다.

4. [Define data intervals]

new_study의 값을 자동으로 간격변수(interval)로 변환하고, 우측에 각 간격별로 개체수(n)을 보여준다.

[OK]를 누른다.

연구자가 임의로 간격을 조정할 수 있고, 조정후에 우측 상단의 [n]단추를 누르면 해당 간격의 개체수를 재 계산하여 보여준다.

만일 간격변수를 2가지로 구분하면 2 x 2 table이 되므로, sensitivity, specificity를 구하는 2 x 2 table과 같은 의미가 된다.
결과해석
위에서 제시한 간격에 따라 disease (+), disease(-)의 숫자를 보여주고, 각각의 likelihood ratio와 likelihood ratio의 95% CI를 보여준다.

disease(-)가 0 인 경우 계산이 안되므로 무한대(∞)로 표기된다.

예제를 중심으로 설명하면

new_study의 결과가 280-300인 경우 disease(-)보다 disease(+)가 될 확률이 9배 높아진다는 의미다.
95%CI가 2.235-36.239이므로 최소 2.2배, 최대 36.2배 높다라는 의미다.

결과를 전체적으로 보면
260 이상인 경우 likelihood ratio가 1보다 크므로 new_study결과가 260 이상인 경우 disease(+)가 될 확률이 높다고 해석할 수 있다.
유의사항1
likelihood ratio는 0 이상의 값을 가지며

1보다 작은 경우 disease(-)에 비해 disesase(+)가 될 확률이 낮다는 의미이고

1보단 큰 경우는 disease(-)에 비해 disesase(+)가 될 확률이 높다는 의미이다.

유의사항2
위의 예제를 그대로 사용하여 ROC curve를 그리면 좌측과 같다.

연속변수를 그대로 이용하게 되므로 하나의 결과값(point)에 중점을 둔 해석만 가능하다.
그러나 Interval likelihood ratio를 이용하면 결과값을 일정한 group으로 나눌 수 있으므로 결과 해석에 융통성을 발휘할 수 있다.

예를 들면 당뇨병의 경우 임상적 판단기준이 위의 예제와 같은 간격변수로 이루어 진다.

즉, 공복혈당이
100 미만 - 정상
100-125 - 경계형 당뇨병
125 이상 - 당뇨병

이처럼 의학관련 판단근거는 상당 부분 간격변수로 이루어져 있으므로 Interval likelihood ratio를 잘 이용하면 보다 융통성 있는 통계 결과를 얻을 수 있다.
그러나, 간격변수를 어떻게 지정하느냐에 따라서 결과 해석에 많은 변수로 작용할 수 있다. 즉 연구자의 결정에 따라 연구의 결과가 달라질 수 있다는 단점이 있다.

그러므로 간격변수를 어떻게 결정하느냐는 연구의 목적과 연구자의 의도에 따라서 결정되어져야 한다.
참고자료
통계 방법이 인용된 논문: Sonis J. How to Use and Interpret Interval Likelihood Ratios. Fam Med 1999;31(5):432-7. DownLoad interval_likelihood_ratio.pdf
by Byung Gil Choi, MD, PhD.   cbg@catholic.ac.kr  Department of Radiology, College of Medicine, The Catholic University of Korea.