(간호연구) 기술통계 02
중심경향치(Central Tendency) – 데이터의 중심 위치
평균(Mean)
– 장점 : 모든 데이터 활용, 수학적 다루기 쉬움
– 단점 : 이상치(outlier)에 민감
– 중앙값(Median) : 데이터를 정렬했을때 가운데 위치한 값.
– 이상치에 강건(Robust)함
– 최빈값(Mode): 가장 자주 나타나는 값.
– 여러 개 존재 가능
산포도(Dispersion) – 데이터의 퍼짐 정도
범위(Range) : 최대값-최소값

– 단점: 이상치에 매우 민감
분산(Variance) :

표준편차(Standard Deviation) :

– 평균을 중심으로 데이터가 얼마나 퍼져있는지 나타냄. 평균과 같은 단위로 해석 가능
사분위수범위(IQR, Interquartile Range) : Q3-Q1
– 중앙 50% 데이터의 퍼짐. 이상치에 강건함.
질적, 연속변수
| 항목 | 질적변수 | 연속변수 |
| 측정수준 | 명목, 순서 | 등간, 비율 |
| 대표값 | 최빈값(주로), 중앙값(순서형일때) | 평균, 중앙값, 최빈값 |
| 산포도 | 없음(비율 차이 정도) | 분산, 표준편차, 범위, IQR |
| 주요 그래프 | 막대, 원, 파레토 | 히스토그램, 상자그림, 줄기-잎그림 |
| 수치요약 | 도수, 상대도수, 누적도수 | 5요약(최소, Q1, 중앙, Q3, 최대), 평균±SD |
기술통계(descriptive statistics)

| 종 류 | 설 명 |
| 표, 그래프 | – 주로 질적변수(명목척도)로 이루어진 자료의 요약에 이용 – 돗수 또는 비율로 표시 – 도수분포표, 히스토그램, 막대그래프 등 |
| 기술통계량(수치) | – 주로 연속변수(등간 및 비율척도)로 이루어진 자료의 요약에 이용 – 대표치: 평균, 중위수, 최빈수 – 산포도: 표준편차, 분산, 범위, 사분위수 범위 등 – 분포도: 왜도, 첨도 등 |
그래프
– 데이터의 전체적인 구조를 시각적으로 표현
– 자료의 척도에 따라 적절한 그래프를 선택
| 종 류 | 적합한 그래프 |
| 질적변수 | 막대도표, 선도표/면적도표, 원도표, 상한-하한 도표 |
| 연속변수 | 산점도, P-P도표/Q-Q도표, 상자도표/오차막대도표,순차도/시계열도표, 히스토그램 |
질적도표
(1) 막대도표(Bar chart)
• 비유 : 여러 과일 바구니의 높이 비교
• 각 막대가 서로 떨어져 있음(범주 사이에 순서 없음)
(2) 선도표/ 면적도표
• 비유 : 시간에 따른 과일 소비량 변화(선으로 연결)
• 질적변수라도 순서가 있는 범주(예: 학년, 만족도)일때 사용
(3) 원도표(Pie chart)
• 비유 : 하나의 원형 케이크를 과일 종류별로 조각 나눔
• 전체대비 각 범주의 비율 표시
(4) 상한-하한도표
• 비유 : 각 과일 바구니의 최대/최소 개수 범위
• 예: “사과바구니는 5~10개, 바나나는 3~8개”

연속형 도표
– 연속변수는 숫자의 흐름을 가집니다.
– 비유: 수온계의 눈금이 연속적으로 변하는 것
(1) 산점도(Scatter plot)
• 비유: 친구들의 키vs 몸무게를 점으로 찍어서 관계 보기
• 두 연속변수간 상관관계 확인
(2) P-P도표/ Q-Q도표
• 비유: 내 데이터가 정규분포라는 이론적 모형과 얼마나 닮았는지 비교
• 점들이 대각선에 가까우면 “잘 닮음”
(3) 상자도표(Box plot) / 오차막대도표
• 비유: 시험점수를상자로요약(최소, 1사분위, 중앙, 3사분위, 최대)
• 이상치를 점으로 표시, 여러 그룹 비교에 탁월
(4) 순차도/ 시계열도표
• 비유: 일별주가그래프(시간순서대로연결)
• 시간에 따른 추세,계절성 파악
(5) 히스토그램(Histogram)
• 비유: 키가 150~160cm인 사람수, 160~170cm인 사람수를 막대가 붙어서 표시
• 연속데이터의 분포형태(좌우대칭, 치우침 등) 확인
요약
| 변수종류 | 그래프 종류 | 그림 비유(이미지로상상) |
| 질적 | 막대도표 | 각각 높이가 다른 막대(떨어져 있음) |
| 원도표 | 파이 조각으로 비율 표시 | |
| 상한-하한도표 | 각 범주의 최대-최소 범위 막대 | |
| 연속 | 산점도 | (점들이 모여서 직선/곡선 형태) |
| Q-Q도표 | 점들이 대각선에 붙어 있음 | |
| 상자도표 | 선(수염) + 이상치점 | |
| 시계열도표 | 시간 순서대로 올라갔다 내려갔다 | |
| 히스토그램 | 막대가 붙어 있음 (계급 구간) |
기술통계
• 도수분포표(frequencytable)
– 처음 조사된 원자료는 그 자료의 특징 및 분표를 파악하기 어려움
– 처음 조사된 원자료를 구간을 나누거나 돗수를 세거나 해서 정리하여 자료의 구조적 특징을 파악함
– 질적자료 정리 및 연속변수를 질적자료로 변환해서 사용할 경우에 사용
| 빈도 | 퍼센트 | ||
| 학력 | 3년제 | 191 | 90.1 |
| 4년제 | 13 | 6.1 | |
| 방통대 | 8 | 3.8 | |
| 합계 | 212 | 100.0 | |
질적변수
빈도분석




연속변수
기술통계량
– 주로 연속변수의 데이터를 요약할 때
– 대표치
• 평균(연속), 중위수(서열), 최빈수(명목)
– 산포도
• 분산, 표준편차
– 분포형태
• 왜도, 첨도
– 방법
• Analyze → Descriptive Statistics → Frequencies / Explore / Descriptives
산포도
– 분산(variance)
• 자료들이 평균으로부터 흩어져 있는 정도
– 표준편차(standarddeviation)
• 분산과 같이 자료들이 평균으로부터 흩어져 있는 정도
– 사분위수범위(quartilerange)
• 전체자료를 크기 순서대로 나열한 후 전체를 4등분
분포도
– 자료분포의 모양과 특성을 나타내는 수치
– 왜도(skewness) : 자료 분포의 기울어진 정도와 방향
– 첨도(kurtosis) : 자료분포의 뾰족한 정도


기술통계




데이터 탐색

| 종류 | 설명 |
| 기술통계(Descriptives) | 대표치, 산포도, 분포도, 신뢰구간을 다 나타냄 대표치 : 평균, 중위수, 5% 절삭 평균 산포도 : 표준오차, 분산, 표준편차, 최소값, 최대값, 범위 사분위수 범위 분포도 : 왜도, 첨도 평균에 대한 95% 수준의 신뢰구간 |
| M-추정량(M-estimators) | M-통계량 |
| 이상값(Outliers) | 값이 가장 높은 것과 낮은 것을 5개씩 표시 |
| 백분위수(Percentiles) | 5, 10, 25, 50, 75, 90, 95 백분위수값 표시 |

1) 대상자의 일반적 특성은 실수와 백분율, 평균과 표준편차로 분석할 것이다.
2) 대상자의 임종간호 스트레스와 죽음불안, 자아존중감 및 임종간호 수행정도는 평균, 평균평점 표준편차, 최댓값, 최솟값으로 분석할 것이다.

대상자의 일반적 특성
• 대상자의 연령은 평균43.18±9.60세로, 40대가 79명(37.3%)으로 가장 많았다. 결혼상태는 기혼이 176명(83.0%)으로 가장 많았으며, 교육수준은 전문대졸업자가 158명(74.5%)로 가장 많았다.
• 종교가 있다고 응답한 경우가 159명(75.0%)으로 가장 많았으며, 총 임상경력은 평균 150.91±92.54개월로, 6년이상이 169명(79.7%)으로 가장 많았다.
• 해당 근무부서의 경력은 평균 37.64±42.04개월로, 2년 미만이 98명(46.2%)으로 가장 많았으며, 요양병원의 경력은 평균 50.13±36.43개월로, 6년 이상이 60명(28.3%)으로 가장 많았다.
• 근무부서는 일반병동이 171명(80.7%)으로 가장 많았으며, 현재 직위는 일반 간호사가 137명(64.6%)으로 가장 많았다.
• 최근 1년 이내 담당한 환자의 죽음경험은 1-5회가 69명(32.5%)으로 가장 많았으며, 최근 1년이내 가족 및 지인의 죽음경험은 없는 경우가 108명(50.9%)으로 가장 많았다. 임종간호에 대한 교육경험은 8시간 미만이 92명(43.4%)으로 가장 많았다(Table1)
임종간호 스트레스와 죽음불안, 자아존중감 및 임종간호수행 정도

• 대상자의 임종간호 스트레스는 5점 만점에 3.47±0.59점으로 하위영역별로 살펴보면 환자 및 보호자의 임종에 대한 부정적인 태도가 3.66±0.70점으로 가장 높았고, 그 다음으로 임종환자에 대한 시간할애의 어려움 3.54±0.72점, 의료한계에 대한 갈등 3.53±0.66점, 업무량과중 3.53±0.73점, 임종환자와의 인간적 갈등 3.46±0.68점, 이종환자간호에 대한 부담감 3.21±0.72점 순으로 나타났으며, 전문지식과 기술부족이 3.15±0.80점으로 가장 낮게 나타났다. 죽음불안은 5점 만점에 3.38±0.73점, 자아존중감은 4점 만점에 2.91±0.36점, 임종간호 수행은 4점 만점에 2.62±0.42점이었다(Table2).
주요 통계량
1) 자료의 중심경향을 나타내는 통계량
• 평균(Average) : 표본자료의 중심무게
• 중앙값(Median) : 극단값에 덜 영향받음
• 최빈수(Mode) : 대단위 자료에 유용
• 기대값(ExpectedValue) : 확률분포의 중심
2) 자료의 산포(분포)를 나타내는 통계량
• 분산(Variance)
• 표준편차(StandardDeviation)
• 범위 등
3) 자료의 형태를 나타내는 통계량
• 왜도(Skewness) : 치우침 정도
• 첨도(Kurtosis) : 뾰족함 정도
기술통계량 SPSS
