📊 Q-Q Plot 완전 정복! – 정규성 검정의 비밀을 풀어보자 ✨
데이터 분석을 하다 보면 "내 데이터가 정규분포를 따를까?" 라는 질문을 하게 된다.
이때 사용하는 강력한 도구가 바로 Q-Q Plot(Quantile-Quantile Plot) 다.
🍰 Q-Q Plot, 쉽게 말하면?
Q-Q Plot은 두 데이터의 "분포 모양을 비교하는 그래프"다.
특히, "내 데이터가 정규분포처럼 생겼는지" 확인할 때 많이 사용한다.
📏 비유해볼게요!
마치 두 개의 자(尺)를 나란히 놓고 길이를 비교하는 것과 같다.
하나는 표준 정규분포라는 기준 자,
하나는 내 데이터 분포 자입니다.
이 두 자의 눈금이 똑같으면 → 정규분포!
다르면 → 정규분포 아님! ❌
🧠 어떻게 그려지나요?
- 내 데이터의 값을 작은 순서대로 정렬한다. (→ 분위수, quantile)
- 같은 개수의 정규분포 분위수도 계산해요.
- 두 분위수를 X축(Y=정규분포) vs Y축(내 데이터) 에 찍는다.
- 점들이 대각선(직선)에 착착 붙으면? → 정규분포 굿! 🎯
💡 왜도(Skewness)와 첨도(Kurtosis)와 Q-Q Plot은 어떤 관계일까요?
이 부분은 정말 중요한 포인트! 👇
👉 왜도(Skewness): 데이터의 비대칭 정도
- 오른쪽 꼬리가 길면 양의 왜도(+)
→ Q-Q Plot에서 위쪽 끝이 휘어짐 - 왼쪽 꼬리가 길면 음의 왜도(-)
→ Q-Q Plot에서 아래쪽 끝이 휘어짐
📈 예시:
↑
| ●
| ●
| ●
| ●
+----------------→ (휘어짐)
👉 첨도(Kurtosis): 데이터의 꼭대기 뾰족함
- 너무 뾰족하면 (고첨도) → 중간점들이 직선 위보다 안쪽으로
- 너무 납작하면 (저첨도) → 중간점들이 직선 위보다 바깥쪽으로
🧪 Q-Q Plot을 언제 쓰나요?
- 정규성 검정 전에 시각적으로 점검
- 통계 분석(예: 회귀, ANOVA 등) 전 데이터 확인
- 머신러닝 전처리에서 이상값 탐색
🎨 정리 그림 요약 (이모지로 표현!)
특징 | Q-Q Plot 모양 | 의미 |
---|---|---|
🎯 직선에 착착 | 정규분포 ✔ | Good |
📈 위로 휘어짐 | 양의 왜도 | 오른쪽 꼬리 길다 |
📉 아래로 휘어짐 | 음의 왜도 | 왼쪽 꼬리 길다 |
📎 가운데 안쪽 | 고첨도 | 뾰족한 분포 |
🧇 가운데 바깥쪽 | 저첨도 | 납작한 분포 |
마무리 한 줄 요약 ✍
Q-Q Plot은 정규분포라는 ‘기준자’와 내 데이터의 ‘자’를 비교하는 그래프!
선에 가까울수록 정규분포, 휘어지면 왜도/첨도가 있다는 힌트!
'데이터 > 데이터' 카테고리의 다른 글
[내 머리로 빅분기] 특이값분해(SVD) 이해하기 (0) | 2025.03.20 |
---|---|
[내 머리로 빅분기] 자연어처리의 트랜스포머 (0) | 2025.03.20 |
[내 머리로 빅분기] 기술통계 - 이산확률분포와 연속확률분포 (0) | 2025.03.05 |
[내 머리로 데이터시각화] 회귀모형의 추정과 검정 (0) | 2025.03.03 |
[내 머리로 텍스트분석] 텍스트 네트워크 분석의 설정값 (0) | 2025.02.16 |