Survival Manual for Statistical Analysis
(통계분석 생존지침서)


by Byung Gil Choi, MD, PhD.
SPSS 변수설정 및 파일관리
모든 변수는 숫자로 입력한다.
Male = 1
Female = 2
Control Group = 1
Treated Group = 2
Normal = 1
Borderline = 2
Abnormal = 3
Yes = 1
No = 2
증가하거나 정도가 심해지는 방향으로 큰 숫자를 배열한다.
없다 = 0
있다 = 1
Stage I = 1
Stage II = 2
Stage III = 3
Stage IV = 4
+ = 1
++ = 2
+++ = 3
low = 0
High = 1
가능하면 연속변수를 사용한다.
FBS Cholesterol
130 200
99 290
89 190
78 176
... ...
연속변수의 경우 언제든지 상황에 따라서 비연속변수로 변환하여 처리할 수 있으므로 보다 다양한 통계 방법을 동원할 수 있어 원하는 결과를 얻는데 도움이 될 수 있다.
예제 FBS Chole. 설명 통계방법
FBS과 Cholesterol 간에는 연관성이 있는가? 연속 연속 두 연속변수간의
상관성 분석
Correlation analysis
FBS와 Cholesterol 간에 연관성을 방정식으로 나타낼 수 있는가? 연속 연속 두 연속변수간의
직선적 함수관계 검정
Regression analysis
FBS 120을 기준으로 나누어 당뇨환자군과 정상군으로 나눈다.
이 2군간의 cholesterol 치는 유의한 차이가 있는가?
비연속 연속 2 군간의 평균치 비교 t-test
FBS를
120 이하 = 정상군,
120-140 = 내당성 장애군,
140 이상 = 당뇨환자군 으로 나눈다.
3군간의 cholesterol 치는 유의한 차이가 있는가?
비연속 연속 3 군간의 평균치 비교 One-way ANOVA
Cholesterol도
240 이하=정상군,
240-270 = 위험군,
270 이상 = 환자군으로 나눈다.
비연속 비연속 3 x 3 table Chi-square test
Group (군)도 변수로 입력하여야 한다.
SPSS를 이용하여 통계분석을 하는 경우 Group(군)을 변수로 생각하지 않아 간혹 당혹스러운 경우가 있을 수 있다.
그러므로 group A = 1, group B = 2 .. 등으로 입력하여야 한다.
A군 B군
130 200
122 250
190 198
78 176
보통 data를 정리하는 표
(A, B 군의 혈당치)
SPSS에 data를 입력하는 형식
- 군을 변수의 개념
즉, (A군 = 1, B군 = 2)으로 생각하여 다음과 같이 입력하여야 한다.
SPSS에서 변수 입력 예제
다음의 간단한 예제를 SPSS에 입력하는 경우, 다루어야 하는 변수는 총 4개 (군별, 성별, 나이, 암병기)이다.

군별 Control Group Treated Group
No. 성별 나이 암병기 성별 나이 암병기
1 79 stage I 59 stage III
2 88 stage I 69 stage III
3 46 stage II 71 stage III
4 57 stage II 43 stage IV
모든 자료는 숫자로 입력하기 위해 다음과 같은 정의를 한다.
Control Group = 1, Treated Group = 2
남 = 1, 여 = 2
나이 = 자체가 숫자이므로 그대로 입력
stage I = 1, stage II = 2, stage III = 3, stage IV = 4
SPSS을 실행하고 화면하단의 [Variable View]를 누른다.
변수의 특성을 지정하고자 하는 것이다.

위와 같이 입력을 한다.
입력하기전에 각 항목의 의미를 확인해 보자.
항목 입력방법 설명
Name 직접입력 한글입력 가능. 특수문자와 공백(space)는 포함 할 수 없음. 숫자로 시작할 수 없음.
결론적으로 영어로 입력하는 것이 가장 무난하다.
혹시 의미의 전달상 띄어쓰기가 필요한 경우 "_" (underbar)를 사용할 수 있다. (예, ca_stage)
Type 선택 기본값이 "Numeric"으로 되어 있으며, 특별한 경우가 아니면 그대로 둔다.
Width 직접입력 또는 선택 group의 경우 2개의 군이므로 1과 2로 표기할 것이므로 자릿수는 "1"이 될 것이고,
age의 경우 대개 999세까지 사는 사람은 몹시 드물기 때문에 자릿수를 "3"으로 지정함.
나머지 예제의 항목도 같은 의미이다.
Decimal 직접입력 또는 선택 예제로 다루는 자료가 모두 소숫점 이하의 값을 갖이 않으므로 "0"으로 지정함.
Label 직접입력 대부분 변수 이름(Name)으로 자료의 구분이 가능하지만, 좀더 구체적인 표현이 필요한 경우 사용한다.
변수의 종류가 다양하고 영문으로 만든 변수 이름으로 구분하기 힘이 드는 경우 사용한다.
Values 아래 입력방법 참조 변수를 숫자로 지정하는 경우 필수 항목이 된다.
이곳을 입력하지 않는 경우 추후 결과 해석 과정에서 많은 혼란이 야기되므로 반드시 입력하는 것을 권장한다.
Missing 아래 입력방법 참조 많은 자료를 모으는 경우, 빠지는 값들이 생긴다.
예를 들면 다른 항목들은 자료가 있는데 "성별"에 대한 일부 자료가 없는 경우 이 자료를 버리는 것보다는 일단 Missing으로 처리하면 추후 성별과 관련이 없는 분석을 하는데 전체 자료를가 유용하게 사용될 수 있다.
Columns 직접입력 또는 선택 그냥 둔다.
Align 선택 그냥 둔다.
Measure 선택 Scale, Ordinal, Nominal로 구분되며, 선택이 가능하다.
Scale: 연속변수인 경우 선택한다. (예, 나이)
Ordinal: 순위를 의미하는 경우 선택한다. (예, 암병기)
Nominal: 그룹을 의미하는 경우 선택한다. (예, 성별, 군별)
Role 선택 그냥 둔다.
[Values]입력 방법
Control Group = 1, Treated Group = 2로 정하고 이를 SPSS에 입력하는 것을 의미한다.
화면의 순서대로 진행하면 좌측과 같은 모습을 볼 수 있다.
[Missing]입력 방법


남 = 1, 여= 2로 입력을 하고자 하지만 상황에 따라 자료가 없는 경우가 있을 수 있다.
이럴 경우 "9", "99", "999"를 입력하면 SPSS에서 자동으로 Missing data로 분석을 해 준다.

이때 유의하여야 하는 것은 자료값에 있는 숫자를 사용하면 예기치 못한 결과가 있을 수 있다.
예를들면 나이의 Missing data가 있는 경우 위와 같은 숫자를 입력하면 심각한 분석 오류가 생길 수 있다.
즉 실제 나이가 9세 또는 99세인 사람의 자료는 입력이 안된 Missing date로 간주되어 버릴 수 있다.
그러므로 이런 경우는 도저히 있을 수 없는 나이를 입력하면 될 것이다. 예를 들면 "999".
[Data]입력

변수항목에 대한 특성을 완료하면
화면 하단의 [Data View]를 누른다.
예제의 값을 입력한다.

상단의 [Value Labels]라는 아이콘을 눌러본다.
변수의 특성에서 지정한 대로
변수의 [Label]이 나타난다.
파일 관리
주요하게 다루어야 할 file은 모두 3가지로 하나의 분석에 대해서 3가지(*.sav, *.sps, *.spv)의 file을 저장하여 두는 것이 좋다.
*.sav : data를 저장하는 file
*.sps : syntax를 저장하는 file

복잡한 통계분석을 하는 경우 시간이 지나면 그 당시에 어떤 option을 주었는지, 또는 어떤 분석 방법을 이용하였는지 재현이 불가능할 수도 있다.

특히 논문 제출후 통계에 대한 수정 요청(길게는 2-3개월후에야 결과가 나오므로)이 있는 경우 처음에 시행한 통계방법을 기억하기란 쉽지 않을 수 있다.

이때 각각의 분석 설정 화면에서 [Paste]를 누르면
[Syntax1]이라는 창이 열리고 현재까지 진행된 사항이 명령어로 정리가 되어 있다.

추후에 같은 분석 방법을 이용하고자 하는 경우에는 이 syntax file을 open하여 사용할 수 있다.
이전에 저장한 syntax file을 다시 사용하려면,

[MENU]-[File]-[Open]-[Syntax]에서 원하는 파일을 불러오면 된다.

Syntax 화면이 열리면 [MENU]-[Run]-[All]을 누르면 이전에 시행한 통계방법과 옵션이 그대로 시행되어 동일한 결과를 얻을 수 있다.
*.spv : 분석 결과를 저장하는 file
by Byung Gil Choi, MD, PhD.   cbg@catholic.ac.kr  Department of Radiology, College of Medicine, The Catholic University of Korea.