콘텐츠로 건너뛰기

(간호연구) 변수와 코딩

(간호연구) 변수와 코딩

이산형 변수(Discrete Variable)

– 정의 : 셀 수 있는 값만 가지는 변수. 값 사이에 간격이 존재하며, 중간값은 없음.

– 특징

• 정수 단위로만 측정 가능

• 범주형 변수(명목, 서열)와 일부 계수형 변수 포함

– 예시

• 성별(남/여) → 명목

• 학년(1학년, 2학년, 3학년…) → 서열

• 자녀수(0명, 1명, 2명…) → 비율이지만 이산형

– 분석활용

• 빈도분석, 카이제곱 검정

• 비모수 검정(Mann-Whitney, Kruskal-Wallis)

– 예

분포정의예시평균분산
이항분포(Binomial)성공/실패 두 가지 결과를 𝑛번 반복했을때 성공횟수의 분포동전 10번 던져 앞면 횟수𝑛𝑝𝑛𝑝1−𝑝
포아송분포(Poisson)일정 시간 · 공간 내 사건 발생 횟수의 분포1시간 동안 콜센터 전화 수𝜆𝜆
기하분포(Geometric)첫 성공이 나올 때까지 시행 횟수의 분포동전 던져 처음 앞면이 나올 때까지 횟수1/𝑝1−𝑝/𝑝2
초기하분포(Hypergeometric)모집단에서 비복원 추출 시 성공 횟수의 분포카드 뽑기에서 특정 무늬 카드 개수𝑛𝐾/𝑁𝑛𝐾(𝑁−𝐾)(𝑁−𝑛)/𝑁2(𝑁−1)

이항분포

연속형 변수

– 정의 : 특정구간내에서 무한히 많은 값을 가질 수 있는 변수. 값 사이에 중간값 존재.

– 특징

• 소수점 단위까지 측정 가능

• 등간, 비율 변수 대부분 포함

– 예시

• 키(cm), 몸무게(kg) → 비율

• 시험점수(0~100) → 등간

• 온도(℃) → 등간

– 분석활용

• 평균, 표준편차

• t-검정, ANOVA

• 상관분석, 회귀분석

요약

구분정의특징예시분석활용
이산형셀 수 있는 값정수 단위, 중간값 없음성별, 학년, 자녀수빈도, 카이제곱, 비모수검정
연속형구간 내 무한 값소수점 가능, 중간값 존재키, 몸무게, 시험점수, 온도평균, t-검정, ANOVA, 상관 · 회귀
변수유형정의예시이산형/연속형분류분석활용
명목(Nominal)범주 구분만 가능, 순서 없음성별, 혈액형, 전공이산형빈도분석, 카이제곱 검정
서열(Ordinal)순서 있음, 간격 불명확학년, 만족도(1~5점)이산형(순서만 있음)순위 상관분석, 비모수 검정
등간(Interval)간격 동일, 절대적0 없음시험 점수, 섭씨 온도연속형평균, t-검정, ANOVA, Pearson 상관
비율(Ratio)간격 동일, 절대적0 있음키, 몸무게, 소득연속형(단, 자녀수 같은 경우는 이산형)모든 통계 기법 가능

명목 변수(Nominal Variable)

정의 : 범주(category)만 구분하는 변수, 순서 없음.

– 특징

• 단순 구분만 가능 (같다/다르다)

• 수학적 연산 불가능 (평균, 합계 등 무의미)

– 코딩방법

• 성별: 남=0, 여=1

• 혈액형: A=1, B=2, O=3, AB=4

• 숫자는 단순 라벨일뿐, 크기 비교 불가능

– 분석활용

• 빈도분석, 교차분석

• 카이제곱검정(χ² test)

• 로지스틱회귀분석(종속변수가 명목일 때)

– 주의점

• 숫자를 부여해도 “순서”나 “크기” 의미 없음

서열 변수(Ordinal Variable)

– 정의 : 순서(서열)는 있으나 간격은 일정하지 않음.

– 특징

• 순서 비교 가능 (예: 만족도가 더 높다/낮다)

• 간격 불명확 → 평균계산은 부적절

– 코딩방법

• 만족도 : 매우불만족=1, 불만족=2, 보통=3, 만족=4, 매우만족=5

• 학년: 1학년=1, 2학년=2, …

– 분석활용

• 순위 상관분석(Spearman, Kendall)

• 비모수검정(Mann-Whitney U, Kruskal-Wallis H)

– 주의점

• 평균 · 분산을 쓰는 것은 엄밀히는 부적절하지만, 실무에서는 등간으로 취급하기도 함

등간 변수(Interval Variable)

– 정의 : 값 사이의 간격이 동일하지만, 절대적 ‘0’ 없음.

– 특징

• 덧셈 · 뺄셈가능

• 비율 계산 불가능 (0이 절대적 의미가 아님)

– 코딩방법

• 시험점수 : 그대로 입력 (0~100점)

• 온도 : 섭씨 온도 (0℃는 온도의 부재가 아님)

– 분석활용

• 평균, 표준편차

• t-검정, ANOVA

• Pearson상관분석, 회귀분석

– 주의점

• 리커트척도(1~5점)는 본질적으로 서열이지만, 연구편의상 등간으로 취급하는 경우 많음

비율변수(Ratio Variable)

– 정의 : 간격동일+ 절대적 ‘0’ 존재 → 비율 계산 가능

– 특징

• 모든 수학적 연산 가능

• 가장 강력한 측정 수준

– 코딩방법

• 키(cm), 몸무게(kg), 소득(원) → 그대로 입력

– 분석 활용

• 모든 통계기법 가능 (상관, 회귀, 분산분석, 다변량 분석 등)

– 주의점

• 0은 ‘없음’을 의미 → 비율 계산 가능 (예: 180cm는 90cm의 두배)

요약

변수유형특징코딩방법분석활용주의점
명목범주 구분, 순서 없음라벨링(남=0, 여=1)빈도, 카이제곱숫자는 단순 라벨
서열순서 있음, 간격 불명확순서대로 점수화순위상관, 비모수평균계산 부적절
등간간격 동일, 절대 0 없음점수 그대로 입력평균, t-검정, ANOVA, Pearson 상관비율계산 불가능
비율간격 동일, 절대 0 있음측정값 그대로 입력모든 통계 가능0은 ‘없음’ 의미

코딩방법

• 명목변수 : 범주를 숫자로 라벨링(남=0, 여=1)

• 서열변수 : 순서에 따라 점수 부여 (매우불만족=1 ~ 매우만족=5)

• 등간변수: 점수 그대로 사용 (시험점수 0~100)

• 비율변수: 측정값 그대로 사용(키 cm, 소득 원)

Pearson 상관분석

(1) 등간/비율변수

– 예:

• 혈압

• 체중

• 연령

• 소진점수

(2) 선형관계

• 직선관계여야좋음.

• 비선형이면Pearson이 약하게 나올 수 있음.

(3) 정규성(보통 가정)

• 특히 추론(p-value)할 때 고려

(4) 이상치확인

• 극단값 하나가 r 크게 왜곡 가능

Spearman 상관분석 (서열로 취급)

– 서열 변수(ordinal variable)

• 만족도 (1~5점)

• 통증 정도 (경증-중등도-중증)

• 석차, 등수

– 정규분포 가정이 어려울 때

• 이상치(outlier)가 있을 때

• 관계가 직선(linear)은 아니지만 증가/감소 경향이 있을 때

이상치 존재

비선형이지만 단조 관계

표본 작음

일반적 특성

1. 일반적 특성 문항

• 응답자의 인구통계학적 · 사회적 배경을 파악하기 위한 기본 정보입니다.

• 성별: 남 / 여

• 연령: 만 ○○세

• 학년: 1학년 / 2학년 / 3학년 / 4학년

• 전공: (자유 기입)

• 거주 형태: 자취 / 기숙사 / 부모님과 거주

• 특징: 대부분 명목변수(성별, 전공, 거주 형태)와 서열변수(학년)로 구성됩니다.

변수

• 연구 목적에 맞게 심리척도나 태도 측정을 위한 문항을 포함합니다.

• 자아존중감 (Rosenberg Self-Esteem Scale 예시)

• “나는 나 자신을 존중한다.” → 전혀 그렇지 않다(1) ~ 매우 그렇다(4)

• 우울증 (CES-D 척도 예시)

• “지난 일주일 동안 슬펐던 적이 많았다.” → 전혀 그렇지 않다(0) ~ 거의 항상 그렇다(3)

• 특징: 리커트 척도 기반 → 서열변수이지만 연구에서는 등간으로 취급하는 경우 많음.

순서

– 연구 목적 명확히 하기

• 무엇을 알고 싶은가? (예: 자아존중감과 우울증의 관계)

– 변수 정의하기

• 독립변수: 자아존중감

• 종속변수: 우울증

• 통제변수: 성별, 학년

– 문항 설계하기

• 일반적 특성 → 인구통계학적 정보

• 연구 변수 → 척도 문항 (리커트 척도 활용)

– 코딩 방법 정하기

• 성별: 남=0, 여=1

• 만족도: 1~5 점수화

• 척도 문항: 점수 합산 또는 평균

– 파일화 및 실습 준비

• 엑셀/구글시트에 입력 → SPSS, R, Python 등으로 분석

분석

– 설문지 → 직접 응답

– 코딩 실습 → 긍정/역문항 처리, 점수 합산

– 데이터 입력 → 엑셀/SPSS/R에 입력

– 분석 실습

• 자아존중감과 우울증 상관분석 (Pearson vs Spearman)

• 성별에 따른 자아존중감 차이 (t-검정 vs Mann-Whitney U)

• 학년에 따른 우울증 차이 (ANOVA vs Kruskal-Wallis)