카테고리 없음

T검정(T-test)이란? – 평균 차이 검정의 원리와 실제 적용

bluefrog 2025. 4. 28. 09:00

통계학에서 가장 기본이자 널리 사용되는 분석 기법 중 하나가 바로 **T검정(T-test)**이다. 실험군과 대조군, 전후 변화, 질환군과 비질환군 등 두 집단 간의 차이를 비교하고자 할 때, 우리는 단순히 숫자의 차이를 보는 것이 아니라 그 차이가 ‘우연’이 아닌지를 판단해야 한다. T검정은 이 질문에 대한 답을 제시하는 수단이다.


1. T검정의 개념

T검정은 두 집단의 평균이 통계적으로 유의한 차이가 있는지를 검정하는 방법이다.
즉, 관찰된 평균 차이가 단순한 우연이나 표본 추출 오차 때문이 아니라, 실제로 모집단 간 차이가 존재하는지를 판별하는 통계적 절차다.

T검정은 다음과 같은 상황에서 사용된다.

  • 서로 독립된 집단 간 평균 비교
  • 한 집단의 전/후 변화 비교
  • 한 집단의 평균이 특정 기준값과 다른지 비교

T검정의 주요 목적은 ‘차이가 있다’라는 판단을 객관적, 수치적으로 뒷받침할 수 있도록 하는 것이다.


2. 왜 귀무가설을 설정하는가?

통계 분석에서는 항상 **‘귀무가설(H₀)’과 ‘대립가설(H₁)’**이라는 두 개의 가설을 먼저 세운다.

  • 귀무가설(H₀): “차이가 없다”, “효과가 없다”는 전제를 두는 가설
  • 대립가설(H₁): “차이가 있다”, “효과가 존재한다”는 가설

이는 분석자가 갖는 선입견이나 기대를 배제하고, 통계적 검증을 통해 객관적인 결론에 도달하기 위한 기본 원칙이다. 분석은 항상 귀무가설이 옳다고 가정한 상태에서 시작되고, 충분한 증거가 있을 때에만 그것을 기각한다.

이처럼 통계는 기본적으로 보수적인 접근을 취한다. 괜히 성급하게 ‘차이가 있다’고 판단하여 잘못된 결론을 내리는 일을 방지하기 위함이다.


3. 유의수준 0.05의 의미

T검정에서 중요한 기준 중 하나가 바로 **유의수준(α)**이다.
통계적으로 가장 일반적으로 사용되는 유의수준은 0.05, 즉 **5%**다.

이는 다음을 의미한다.

  • 귀무가설이 사실임에도 불구하고, 우연히 지금과 같은 결과가 나올 확률이 5% 미만이라면,
  • 우리는 그 귀무가설을 기각하고 대립가설을 채택하겠다는 판단 기준이다.

즉, p-value가 0.05 미만이면
→ “이 정도의 차이는 단순한 우연이라고 보기 어렵다”
→ “차이가 실제로 존재한다고 봐야 한다”

이 5% 기준은 학계와 산업계에서 오랜 경험과 합의에 따라 형성된 일종의 관습적 기준이며, 상황에 따라 더 엄격한 기준(예: 0.01)도 사용할 수 있다.


4. T검정의 종류

T검정은 비교하려는 데이터의 구조에 따라 아래와 같이 구분된다.

1) 단일표본 T검정 (One-sample t-test)

  • 하나의 집단의 평균이 특정 기준값과 다른지 검정
  • 예: 학생들의 평균 키가 170cm와 다른지 확인

2) 독립표본 T검정 (Independent samples t-test)

  • 서로 독립된 두 집단의 평균 비교
  • 예: 뇌질환 있는 집단 vs 없는 집단의 콜레스테롤 수치 비교

3) 대응표본 T검정 (Paired samples t-test)

  • 동일한 집단의 전후 변화 비교
  • 예: 입원 시 vs 퇴원 시 혈압 변화

5. T검정 수행 절차

  1. 가설 설정
    • H₀: 두 집단의 평균은 같다
    • H₁: 두 집단의 평균은 다르다
  2. 정규성 확인
    • 샤피로-윌크 검정 등으로 정규 분포 여부 확인
    • 표본 수가 많으면 중심극한정리에 의해 생략 가능
  3. 분산 동질성 검정
    • Levene's Test 등을 통해 두 집단의 분산이 동일한지 확인
    • 결과에 따라 일반 T검정 또는 Welch 보정 사용
  4. T값 계산 및 p-value 확인
    • 검정통계량(t) 산출
    • p-value와 유의수준 비교
  5. 결론 도출
    • p < 0.05 → 귀무가설 기각 → 평균 차이 존재
    • p ≥ 0.05 → 귀무가설 채택 → 평균 차이 없음

6. 실제 사례: 독립표본 T검정

연구 주제

“뇌질환이 있는 집단과 없는 집단 사이의 평균 콜레스테롤 수치에 차이가 있는가?”

가설 설정

  • 귀무가설(H₀): 뇌질환 유무에 따른 평균 콜레스테롤 수치 차이는 없다
  • 대립가설(H₁): 뇌질환 유무에 따른 평균 콜레스테롤 수치 차이가 있다

분석 결과

  • 뇌질환군 평균: 193.40
  • 대조군 평균: 145.55
  • 등분산 가정 검정 p = 0.142 (동질성 만족)
  • T값 = -2.877, p-value = 0.001

해석

p-value가 0.001로 유의수준 0.05보다 작으므로, 귀무가설을 기각한다.
즉, 두 집단의 평균 콜레스테롤 수치에는 통계적으로 유의한 차이가 있다고 판단된다. 뇌질환이 있는 집단의 평균 수치가 더 높다는 것은, 뇌질환과 콜레스테롤 수치 간에 관계가 있을 수 있음을 시사한다.


7. 또 다른 사례: 대응표본 T검정

주제

“입원 시 혈압과 퇴원 시 혈압은 차이가 있는가?”

가설 설정

  • H₀: 입원 전후 평균 혈압 차이는 없다
  • H₁: 입원 전후 평균 혈압 차이는 있다

결과

  • 입원 시 평균 혈압: 160.82 mmHg
  • 퇴원 시 평균 혈압: 150.18 mmHg
  • T값 = 2.728, p = 0.009

해석

p-value < 0.05이므로 귀무가설을 기각하고, 입원 전보다 퇴원 후 혈압이 유의하게 감소했다고 볼 수 있다. 즉, 치료 효과가 있었음을 의미한다.


8. 결론

T검정은 “두 집단 간 평균이 같다고 가정했을 때”, 실제 관측된 차이가 우연일 확률이 얼마나 되는지를 평가하는 검정이다.
이론적으로는 단순하지만, 정규성 가정, 분산 동질성, 표본 수의 영향, 효과 크기, 실질적 해석 등 실전에서는 고려해야 할 요소가 많다.

분석을 시작할 때는 늘 귀무가설을 기본으로 설정하고, 통계적으로 얼마나 설득력 있는지를 p-value를 통해 판단한다.
유의수준 0.05는 이러한 판단의 기준점이며, 이를 넘지 못하는 결과는 ‘우연의 범위 안’이라 판단하는 것이 현재 통계학의 일반적인 합의다.

T검정은 단순히 “차이가 있다/없다”를 넘어서, 그 차이를 어떻게 해석하고 실무에 반영할 것인가까지 이어져야 진정한 분석이라 할 수 있다.