crossorigin="anonymous">
외과전담간호사의 조용한 복습시간

카테고리 없음

비모수 검정(Nonparametric Test): 정규분포 가정 없이 통계적 차이를 비교하는 방법?

bluefrog 2025. 4. 30. 09:00
반응형

많은 통계 분석은 평균, 표준편차 등 **모수(모집단의 특성)**를 기반으로 진행된다. 대표적인 것이 T검정이다.
하지만 모든 데이터가 정규분포를 따르지는 않으며, 표본 수가 적거나 이상치가 많은 경우에는 이러한 가정을 만족하지 않게 된다.
이때 사용하는 것이 바로 **비모수 검정(nonparametric test)**이다.


1. 비모수 검정이란?

비모수 검정은 데이터가 정규분포를 따른다는 가정을 하지 않고도 두 집단 간의 차이를 비교할 수 있는 통계적 방법이다.

주로 다음과 같은 경우에 사용된다.

  • 표본 수가 매우 적은 경우 (예: n < 30)
  • 정규성 검정(Shapiro-Wilk 등)에서 p < 0.05로 나타나 정규분포가 아님이 확인된 경우
  • 순위 데이터(서열척도), 범주형 자료 등에서 평균 대신 중앙값이나 순위를 비교해야 하는 경우

2. 왜 비모수 검정을 사용하는가?

T검정이나 ANOVA 같은 모수 검정은 정규분포와 분산의 동질성을 기본 가정으로 한다.
이러한 가정이 충족되지 않으면, 검정 결과는 신뢰성을 잃게 된다.

예를 들어 다음과 같은 경우에는 비모수 검정을 고려한다.

  • 자료의 왜곡: 극단값(이상치)이 포함되어 분포가 비대칭일 때
  • 척도 문제: 수면 질 평가처럼 등간척도가 아닌 서열척도일 때
  • 측정의 한계: 혈압이 아닌 통증의 강도와 같이 정확한 숫자보다는 "크다/작다"로 비교하는 경우

3. 주요 비모수 검정 방법

검정명사용 조건비교 대상예시
Wilcoxon Signed-Rank Test 대응표본 / 짝지어진 데이터 두 조건 간 순위 차이 수면제 투여 전후 수면 시간
Mann–Whitney U Test 독립된 두 집단 두 집단의 순위 분포 생산직 vs 사무직 근로자의 혈당 수준 비교
Kruskal–Wallis Test 독립된 세 집단 이상 세 집단 이상 평균 비교 환자군 A, B, C의 통증 점수 비교
Friedman Test 세 시점 이상의 대응표본 반복 측정된 서열 자료 치료 1주차/2주차/3주차 효과 비교

4. Wilcoxon 부호순위 검정 예시 해석

주제: 수면제와 위약을 복용한 뒤 수면 시간이 달라지는가?

가설 설정

  • 귀무가설(H₀): 수면제와 위약 복용 후 수면 시간은 차이가 없다
  • 대립가설(H₁): 수면제 복용 후 수면 시간이 위약과 다르다

분석 내용

  • 수면제 투여 평균 수면 시간: 7.06시간
  • 위약 투여 평균 수면 시간: 5.28시간
    → 평균은 차이가 있어 보이지만, 데이터가 정규분포를 따르지 않거나 표본 수가 적을 경우 평균만으로 판단할 수 없음

Wilcoxon 부호순위 검정을 실시

  1. 수면 시간 차이(수면제 – 위약)를 계산
  2. 차이의 절댓값을 기준으로 순위를 매김
  3. 부호(+, -)를 고려하여 T+ (양의 순위 합), T- (음의 순위 합) 구함
  4. 두 값 중 더 작은 값 T값을 선택
  5. T값이 기준치보다 작고 p-value < 0.05이면 → 유의미한 차이 있음

결과 해석

  • 계산된 T = 5.0, 임계값 Tₐ = 4.5
  • 유의확률(p-value) = 0.019 → 유의수준 0.05보다 작음
  • 결론: 귀무가설을 기각 → 수면제 복용이 위약보다 수면 시간 연장에 유의한 효과가 있음

5. Mann–Whitney U 검정 예시 해석

주제: 사무직과 생산직 근로자의 혈당 수치에 차이가 있는가?

가설 설정

  • 귀무가설(H₀): 두 집단의 혈당 수준에 유의미한 차이가 없다
  • 대립가설(H₁): 두 집단의 혈당 수준에 차이가 있다

분석 내용

  • 두 집단(사무직, 생산직)의 혈당 수치를 한꺼번에 묶고 순위를 매김
  • 각각의 집단에 속한 값들이 받은 순위의 총합을 비교
  • 순위합을 기반으로 U값 계산
  • U값이 작을수록 두 집단 간 차이가 큼을 의미

→ SPSS 또는 수식으로 U1, U2 계산 → 더 작은 U값을 검정 통계량으로 사용
→ 유의확률(p-value)와 비교

결과 해석

  • 계산된 U = 72, p-value = 0.171
  • 유의수준 0.05보다 큼 → 귀무가설 기각할 수 없음
  • 결론: 사무직과 생산직의 혈당 분포에 유의미한 차이는 없음

다만, 사무직 평균이 생산직보다 높다는 경향은 확인되었으며, 표본 수를 늘리거나 다른 변수 통제를 통해 추가 분석이 가능함


6. 결론

비모수 검정은 정규분포 가정을 만족하지 못하거나, 평균 비교보다는 중앙값이나 순위 기반 비교가 더 적절한 경우에 매우 유용한 도구이다.

  • 평균과 표준편차를 중심으로 하는 모수 검정이 신뢰할 수 없을 때
  • 데이터의 척도가 등간척도나 비율척도가 아닐 때
  • 극단값이나 이상치가 많은 경우
    Wilcoxon, Mann-Whitney U, Kruskal-Wallis 등 비모수 검정이 대안이 될 수 있다

통계 해석은 단순히 p값을 기준으로 귀무가설을 기각하는 것에 그치지 않는다.
그 차이가 실제 현상적으로 어떤 의미가 있는지, 해석의 맥락은 무엇인지 함께 판단해야 한다.

반응형