Male = 1 Female = 2 |
Control Group = 1 Treated Group = 2 |
Normal = 1 Borderline = 2 Abnormal = 3 |
Yes = 1 No = 2 |
없다 = 0 있다 = 1 |
Stage I = 1 Stage II = 2 Stage III = 3 Stage IV = 4 |
+ = 1 ++ = 2 +++ = 3 |
low = 0 High = 1 |
|
연속변수의 경우 언제든지 상황에 따라서 비연속변수로 변환하여 처리할 수 있으므로 보다 다양한 통계 방법을 동원할 수 있어 원하는 결과를 얻는데 도움이 될 수 있다. |
예제 | FBS | Chole. | 설명 | 통계방법 |
---|---|---|---|---|
FBS과 Cholesterol 간에는 연관성이 있는가? | 연속 | 연속 | 두 연속변수간의 상관성 분석 |
Correlation analysis |
FBS와 Cholesterol 간에 연관성을 방정식으로 나타낼 수 있는가? | 연속 | 연속 | 두 연속변수간의 직선적 함수관계 검정 |
Regression analysis |
FBS 120을 기준으로 나누어 당뇨환자군과 정상군으로 나눈다. 이 2군간의 cholesterol 치는 유의한 차이가 있는가? |
비연속 | 연속 | 2 군간의 평균치 비교 | t-test |
FBS를 120 이하 = 정상군, 120-140 = 내당성 장애군, 140 이상 = 당뇨환자군 으로 나눈다. 3군간의 cholesterol 치는 유의한 차이가 있는가? |
비연속 | 연속 | 3 군간의 평균치 비교 | One-way ANOVA |
Cholesterol도 240 이하=정상군, 240-270 = 위험군, 270 이상 = 환자군으로 나눈다. |
비연속 | 비연속 | 3 x 3 table | Chi-square test |
|
보통 data를 정리하는 표 (A, B 군의 혈당치) |
![]() - 군을 변수의 개념 즉, (A군 = 1, B군 = 2)으로 생각하여 다음과 같이 입력하여야 한다. |
|
모든 자료는 숫자로 입력하기 위해 다음과 같은 정의를 한다. Control Group = 1, Treated Group = 2 남 = 1, 여 = 2 나이 = 자체가 숫자이므로 그대로 입력 stage I = 1, stage II = 2, stage III = 3, stage IV = 4 |
||||||||||||||||||||||||||||||||||||||||||
![]() 변수의 특성을 지정하고자 하는 것이다. |
항목 | 입력방법 | 설명 |
---|---|---|
Name | 직접입력 |
한글입력 가능. 특수문자와 공백(space)는 포함 할 수 없음. 숫자로 시작할 수 없음. 결론적으로 영어로 입력하는 것이 가장 무난하다. 혹시 의미의 전달상 띄어쓰기가 필요한 경우 "_" (underbar)를 사용할 수 있다. (예, ca_stage) |
Type | 선택 | 기본값이 "Numeric"으로 되어 있으며, 특별한 경우가 아니면 그대로 둔다. |
Width | 직접입력 또는 선택 |
group의 경우 2개의 군이므로 1과 2로 표기할 것이므로 자릿수는 "1"이 될 것이고, age의 경우 대개 999세까지 사는 사람은 몹시 드물기 때문에 자릿수를 "3"으로 지정함. 나머지 예제의 항목도 같은 의미이다. |
Decimal | 직접입력 또는 선택 | 예제로 다루는 자료가 모두 소숫점 이하의 값을 갖이 않으므로 "0"으로 지정함. |
Label | 직접입력 |
대부분 변수 이름(Name)으로 자료의 구분이 가능하지만, 좀더 구체적인 표현이 필요한 경우 사용한다. 변수의 종류가 다양하고 영문으로 만든 변수 이름으로 구분하기 힘이 드는 경우 사용한다. |
Values | 아래 입력방법 참조 |
변수를 숫자로 지정하는 경우 필수 항목이 된다. 이곳을 입력하지 않는 경우 추후 결과 해석 과정에서 많은 혼란이 야기되므로 반드시 입력하는 것을 권장한다. |
Missing | 아래 입력방법 참조 |
많은 자료를 모으는 경우, 빠지는 값들이 생긴다. 예를 들면 다른 항목들은 자료가 있는데 "성별"에 대한 일부 자료가 없는 경우 이 자료를 버리는 것보다는 일단 Missing으로 처리하면 추후 성별과 관련이 없는 분석을 하는데 전체 자료를가 유용하게 사용될 수 있다. |
Columns | 직접입력 또는 선택 | 그냥 둔다. |
Align | 선택 | 그냥 둔다. |
Measure | 선택 |
![]() Scale: 연속변수인 경우 선택한다. (예, 나이) Ordinal: 순위를 의미하는 경우 선택한다. (예, 암병기) Nominal: 그룹을 의미하는 경우 선택한다. (예, 성별, 군별) |
Role | 선택 | 그냥 둔다. |
![]() |
![]() |
![]() |
![]() |
![]() |
Control Group = 1, Treated Group = 2로 정하고 이를 SPSS에 입력하는 것을 의미한다. 화면의 순서대로 진행하면 좌측과 같은 모습을 볼 수 있다. |
![]() 변수항목에 대한 특성을 완료하면 화면 하단의 [Data View]를 누른다. |
![]() |
![]() 상단의 [Value Labels]라는 아이콘을 눌러본다. |
![]() 변수의 [Label]이 나타난다. |
![]() |
![]() 복잡한 통계분석을 하는 경우 시간이 지나면 그 당시에 어떤 option을 주었는지, 또는 어떤 분석 방법을 이용하였는지 재현이 불가능할 수도 있다. 특히 논문 제출후 통계에 대한 수정 요청(길게는 2-3개월후에야 결과가 나오므로)이 있는 경우 처음에 시행한 통계방법을 기억하기란 쉽지 않을 수 있다. 이때 각각의 분석 설정 화면에서 [Paste]를 누르면 |
![]() 추후에 같은 분석 방법을 이용하고자 하는 경우에는 이 syntax file을 open하여 사용할 수 있다. |
![]() [MENU]-[File]-[Open]-[Syntax]에서 원하는 파일을 불러오면 된다. |
![]() Syntax 화면이 열리면 [MENU]-[Run]-[All]을 누르면 이전에 시행한 통계방법과 옵션이 그대로 시행되어 동일한 결과를 얻을 수 있다. |
![]() |