본문 바로가기
데이터/데이터

[내 머리로 빅분기] Q-Q plot에 대해 알아보자

by 단단_SINCE 2023 2025. 3. 18.

 

 

 


📊 Q-Q Plot 완전 정복! – 정규성 검정의 비밀을 풀어보자 ✨

 

데이터 분석을 하다 보면 "내 데이터가 정규분포를 따를까?" 라는 질문을 하게 된다.
이때 사용하는 강력한 도구가 바로 Q-Q Plot(Quantile-Quantile Plot) 다.

 


🍰 Q-Q Plot, 쉽게 말하면?

Q-Q Plot은 두 데이터의 "분포 모양을 비교하는 그래프"다.
특히, "내 데이터가 정규분포처럼 생겼는지" 확인할 때 많이 사용한다.

 

📏 비유해볼게요!

마치 두 개의 자(尺)를 나란히 놓고 길이를 비교하는 것과 같다.
하나는 표준 정규분포라는 기준 자,
하나는 내 데이터 분포 자입니다.

이 두 자의 눈금이 똑같으면 → 정규분포!
다르면 → 정규분포 아님! ❌


🧠 어떻게 그려지나요?

  1. 내 데이터의 값을 작은 순서대로 정렬한다. (→ 분위수, quantile)
  2. 같은 개수의 정규분포 분위수도 계산해요.
  3. 두 분위수를 X축(Y=정규분포) vs Y축(내 데이터) 에 찍는다.
  4. 점들이 대각선(직선)에 착착 붙으면? → 정규분포 굿! 🎯

💡 왜도(Skewness)와 첨도(Kurtosis)와 Q-Q Plot은 어떤 관계일까요?

이 부분은 정말 중요한 포인트! 👇

👉 왜도(Skewness): 데이터의 비대칭 정도

  • 오른쪽 꼬리가 길면 양의 왜도(+)
    → Q-Q Plot에서 위쪽 끝이 휘어짐
  • 왼쪽 꼬리가 길면 음의 왜도(-)
    → Q-Q Plot에서 아래쪽 끝이 휘어짐

📈 예시:

  ↑
  |        ●
  |      ●
  |    ●
  | ●
  +----------------→  (휘어짐)

👉 첨도(Kurtosis): 데이터의 꼭대기 뾰족함

  • 너무 뾰족하면 (고첨도) → 중간점들이 직선 위보다 안쪽으로
  • 너무 납작하면 (저첨도) → 중간점들이 직선 위보다 바깥쪽으로

🧪 Q-Q Plot을 언제 쓰나요?

  • 정규성 검정 전에 시각적으로 점검
  • 통계 분석(예: 회귀, ANOVA 등) 전 데이터 확인
  • 머신러닝 전처리에서 이상값 탐색

🎨 정리 그림 요약 (이모지로 표현!)

특징 Q-Q Plot 모양 의미
🎯 직선에 착착 정규분포 ✔ Good
📈 위로 휘어짐 양의 왜도 오른쪽 꼬리 길다
📉 아래로 휘어짐 음의 왜도 왼쪽 꼬리 길다
📎 가운데 안쪽 고첨도 뾰족한 분포
🧇 가운데 바깥쪽 저첨도 납작한 분포

마무리 한 줄 요약 ✍

Q-Q Plot은 정규분포라는 ‘기준자’와 내 데이터의 ‘자’를 비교하는 그래프!
선에 가까울수록 정규분포, 휘어지면 왜도/첨도가 있다는 힌트!