본문 바로가기
데이터/방통대 - 바이오통계학

[방통대 통계데이터과학과] 바이오통계학 - 연속형데이터의 비교 (이표본 T검정/ 대응표본 T검정)

by 단단_SINCE 2023 2024. 12. 2.

 

 

이표본 t검정 vs 대응표본 t검정: 차이를 이해하자! 📊🤔

이표본 t검정대응표본 t검정에 대해 쉽게 이해할 수 있도록 설명해보자 📚✨ 두 검정 모두 평균 차이를 비교하는 데 사용되지만, 각각의 적용 상황은 다르다. 이를 알아두면 통계 분석에서 어떤 검정을 선택해야 할지 확실히 알 수 있다. 😊👍

 


1. 이표본 t검정이란? 🧮

이표본 t검정두 독립된 집단의 평균 차이를 비교할 때 사용하는 방법이다. 여기서 "독립된 집단"이란 서로 영향을 주지 않는 그룹을 뜻한다.

🛠 예시:

  • 그룹 A 학생들과 그룹 B 학생들의 시험 평균 점수 비교 📝
  • 남성과 여성의 평균 키 비교 👫

✅ 주요 가정:

  1. 집단 간 독립성: 두 집단은 서로 독립적이어야함
  2. 정규성: 데이터가 정규분포를 따라야함. 📈
  3. 분산 동질성: 두 집단의 분산이 같아야 한다고 가정(필요 시 Welch t검정 사용 가능).

🔢 분석 과정:

  1. 가설 설정:
    • H0H_0: 두 집단의 평균이 같다.
    • H1H_1: 두 집단의 평균이 다르다.
  2. t값 계산 후 유의수준(예: α=0.05\alpha = 0.05)과 비교 🔍
  3. pp-값 해석: pp-값이 유의수준보다 작으면 H0H_0 기각 🚨

🌟 장점:

  • 독립된 두 집단 간의 차이를 간단히 비교 가능! 😎

2. 대응표본 t검정이란? 🔄

대응표본 t검정같은 집단의 사전-사후 변화를 비교하거나 짝을 이루는 데이터의 평균 차이를 비교할 때 사용한다. 쌍으로 연결된 데이터 분석에 적합하다 💡

🛠 예시:

  • 같은 학생의 시험 전후 점수 변화 🏫
  • 동일 제품을 두 가지 조건에서 테스트한 결과 📦
  • 쌍둥이 간 신체적 차이 분석 👯

✅ 주요 가정:

  1. 짝을 이루는 데이터: 두 값이 쌍으로 연결되어 있어야 함. 🔗
  2. 정규성: 두 값의 차이가 정규분포를 따라야 함. 📈

🔢 분석 과정:

  1. 가설 설정:
    • H0H_0: 두 시점(또는 조건)의 평균 차이가 없다.
    • H1H_1: 두 시점(또는 조건)의 평균 차이가 있다.
  2. 차이에 대한 t값 계산
  3. pp-값 해석: pp-값이 유의수준보다 작으면 H0H_0 기각 🚨

🌟 장점:

  • 같은 집단에서 변화가 있었는지 평가 가능!
  • 집단 내 변동을 통제해 더 민감한 분석 가능 💪

3. 이표본 t검정 vs 대응표본 t검정: 주요 차이점 비교 🔍

항목 이표본 t검정 대응표본 t검정

데이터 관계 독립된 두 집단 같은 집단(짝을 이루는 데이터)
사용 예시 두 집단 간 평균 비교 사전-사후 변화, 쌍둥이 간 비교
데이터 특성 서로 독립된 데이터 쌍으로 연결된 데이터
가정 독립성, 정규성, 분산 동질성 짝 데이터의 차이 정규성
장점 두 집단 비교가 간단 집단 내 변동 통제로 분석 민감도 ↑

4. 언제 어떤 검정을 써야 할까? ❓

  • 두 개의 독립된 그룹(예: 남성과 여성, 두 약물 실험 그룹)이라면? → 이표본 t검정 👫
  • 같은 집단에서 사전-사후 변화(예: 운동 전후 체중)라면? → 대응표본 t검정 🏋️‍♀️
  • 쌍을 이루는 데이터(예: 쌍둥이 비교, 동일 조건에서 제품 테스트)라면? → 대응표본 t검정 👯

(연습문제)

4. 위고비 투약그룹 VS 플라시보 그룹  이표본 t검정 👫(둘은 독립된 그룹이기 때문)

5. 위고비 투약그룹 3개월전 VS 3개월후  대응표본 t검정 🏋️‍♀️ (같은 집단 내 변화) 


5. Python을 활용한 간단한 예제 코드 🐍

이표본 t검정:

from scipy.stats import ttest_ind

# 예제 데이터
group1 = [85, 90, 88, 78, 92]
group2 = [80, 84, 82, 76, 85]

# 이표본 t검정 수행
t_stat, p_value = ttest_ind(group1, group2)
print(f"t-statistic: {t_stat}, p-value: {p_value}")

대응표본 t검정:

from scipy.stats import ttest_rel

# 예제 데이터
before = [85, 90, 88, 78, 92]
after = [88, 91, 89, 80, 94]

# 대응표본 t검정 수행
t_stat, p_value = ttest_rel(before, after)
print(f"t-statistic: {t_stat}, p-value: {p_value}")

6. 결론 🎉

이표본 t검정과 대응표본 t검정은 상황에 따라 적절히 선택해야 하는 중요한 통계적 도구다

  • 독립된 두 집단 비교: 이표본 t검정 🧮
  • 같은 집단 내 변화 비교: 대응표본 t검정 🔄

정확한 가정을 이해하고, 상황에 맞는 검정을 선택하는 것이 성공적인 분석의 시작 📊

통계 마스터로의 길, 가즈아 🌟