Survival Manual for Statistical Analysis
(통계분석 생존지침서)


by Byung Gil Choi, MD, PhD.
MedCalc Sample size (표본크기)
SPSS를 이용하는 통계방법이 아니므로 프로그램 MedCalc 가 설치되어 있어야 한다.
개념
연구에 필요한 sample size(표본크기) 산출

연구의 표본(data, 대상)이 많을수록 신뢰할 수 있는 결과가 나오겠지만, 현실적인 여건상 무제한 표본을 늘리는 것은 불가능하다. 그러므로 적절한 표본을 알맞는 숫자로 추출하여 연구를 시행하는 것이 필요한데, 이때 주어진 조건 내에서 sample size를 결정하여야 한다.

Null hypothesis = TRUE Null hypothesis = FALSE
Reject null hypothesis Type I error (α) Correct decision
Accept null hypothesis Correct decision Type II error (β)

정의:
Type I error (alpha, α): 귀무가설이 [참]이나 이를 채택하지 못할 확률 ([참]을 [거짓]이라고 할 확률) ...α = significant level
Type II error (beta, β): 귀무가설이 [거짓]이나 이를 채택할 확률 ([거짓]을 [참]이라고 할 확률) ... 1- β = power
Null hypothesis (귀무가설): 2군을 대상으로 실험을 했을 때 각 집단에서 동일한 결과가 나올 것이라는 가설
  cf) Alternative hypothesis (대립가설): 2군을 대상으로 실험을 했을 때 각 집단에서 다른 결과가 나올 것이라는 가설

이상적인 연구는 Type I error (alpha, α) = 0, Type II error (beta, β) = 0 인 경우이다.

즉, [참]을 [거짓]이라 하지 않고, [거짓]을 [참]이라는 하는 것이 0% 일때를 의미한다.

그러므로 α 와 β가 작을수록 좋은 연구일 것이다.

예) α = 0.05, β=0.10 이란?

... significant level = 0.05, power= 0.90 이라는 의미로

... [참]을 [거짓]이라고 할 확률이 5% 이내이고, [거짓]을 [참]이라고 할 확률이 10% 이내라는 것이다.

예제1. Single mean
고혈압 환자 10명에게 신약을 투여한 결과,
systole BP의 평균 = 128mmHg, 표준편차 = 24였다.

기존의 약을 투여 받은 환자들의
systole BP의 평균 = 138mmHg 이었다.

그러면 α = 0.05, β=0.20 (power=0.80)으로 정하는 경우,
신약이 기존의 약보다 효과가 있는가를 증명하기 위해서는 몇 명의 환자가 필요한가?
1. 선택

[MENU]

-[Sampling]

-[Single mean]

2. 설정

[Type I error - Alpha] = 0.05
[Type II error - Beta] = 0.20
[Mean] = 128
[Standard deviation] = 24
[Null Hypothesis value] = 138 을 입력하고,

[Calculate]를 누른다.

3. 결과

Minimal required sample size=46 으로 연구에 필요한 최소 환자수는 46명이 된다.

하단 표에 α 와 β를 달리할 경우에 대한 sample size가 참고치로 제시된다.

대상 환자를 모으는 것이 비교적 쉽다면, 보다 나은 연구를 위하여 표를 참조하여 α 와 β값을 낮추는 방향으로 sample size를 조정할 필요가 있을 것이다.
예제2. Single proportion
고혈압 환자 10명에게 신약을 투여한 결과,
systole BP가 30% 낮아졌다.

기존의 약을 투여 받은 환자들의
systole BP는 25% 낮아졌다.

그러면 α = 0.05, β=0.20 (power=0.80)으로 정하는 경우,
신약이 기존의 약보다 효과가 있는가를 증명하기 위해서는 몇 명의 환자가 필요한가?
1. 선택

[MENU]

-[Sampling]

-[Single proportion]

2. 설정

[Type I error - Alpha] = 0.05
[Type II error - Beta] = 0.20
[Proportion(%)] = 30
[Null Hypothesis value (%)] = 25 를 입력하고,

[Calculate]를 누른다.

3. 결과

Minimal required sample size=610 으로 연구에 필요한 최소 환자수는 610명이 된다.

하단 표에 α 와 β를 달리할 경우에 대한 sample size가 참고치로 제시된다.

대상 환자를 모으는 것이 비교적 쉽다면, 보다 나은 연구를 위하여 표를 참조하여 α 와 β값을 낮추는 방향으로 sample size를 조정할 필요가 있을 것이다.
예제3. Etc

위의 2예를 포함하여 총 7개의 sample size 산출 방법이 있다.

방법을 선택한 후 해당 항목을 입력하면 sample size를 산출할 수 있다.

Comparison of two means

Comparison of two proportions

Correlation coefficient

Area under ROC curve

Comparison of two ROC curve
유의사항
대부분의 임상 연구에서는
... α = 0.05, β=0.20 (power=0.80)으로 정하는 경우가 많지만, 이는 연구자의 연구 목적에 맞추어 조절할 수 있으며, 이에 따라 sample size가 달라지게 된다.

너무 드문 환자를 대상으로 연구를 하는 경우
... α, β를 낮추면 sample size가 커지므로 아예 환자를 sample size 만큼 모으는 것이 불가능할 수도 있으므로 이런 경우 적절한 수준으로 α 와 β값을 조정할 필요가 있다.

α, β를 낮추면 sample size는 커지고,
α, β를 높이면 sample size는 작아진다.

Effective size: 기존의 방법과 새로운 방법의 차이를 의미함.

... Effective size가 클수록 sample size는 작아지고,
... Effective size가 작을수록 sample size는 커진다.
by Byung Gil Choi, MD, PhD.   cbg@catholic.ac.kr  Department of Radiology, College of Medicine, The Catholic University of Korea.