본문 바로가기
[내 머리로 통계학] 마코프연쇄와 체프만-콜모고로프 방정식 🎲 오늘의 주제: 마코프 연쇄와 체프만-콜모고로프 방정식!🧠 마코프 연쇄란?👉 무기억성이란?친구랑 숨바꼭질할 때, "지금 어디 숨었는지"만 중요하지, "전에 어디 있었는지"는 별로 중요하지 않다.이게 바로 무기억성이다."지금 상태가 미래를 결정하고, 과거는 잊어버린다!" 😮이걸 무기억성 (Memoryless) 이라고 한다.🎯 마코프 연쇄을 쉽게 말하면?마코프 연쇄은 간단히 말해서 한 상태에서 다른 상태로 움직이는 규칙이다.근데 중요한 건! **"다음에 어디로 갈지는 지금 어디 있는지에만 달려 있다"**는 것이다.🎈 예시: 사탕 뽑기 기계사탕 뽑기 기계를 사용한다고 가정해보자지금은 딸기맛 사탕을 뽑았다다음에 나올 사탕이 뭘까? 🍓🍇🍋➡️ 오직 지금 딸기맛이 나왔다는 사실만 중요하고, 그 전.. 2025. 5. 4.
[내 머리로 통계학개론] 이산확률분포와 연속확률분포에 대하여 🎲 이산 vs 연속 분포: 사탕 봉지와 물컵 이야기이산(Discrete) 분포와 연속(Continuous) 분포, 그리고 이와 관련된 **확률질량함수(PMF)**와 **확률밀도함수(PDF)**에 대해 알아보자. 이산이라는 말을 들으면 이서진 밖에 생각안나는 사람(나 포함) 주목... 🍬 이산 분포 (Discrete Distribution) – 사탕 봉지처럼 ‘딱딱 끊어지는’ 수먼저 이산 분포는 딱딱 끊어지는 숫자들을 다룰 때 사용한다. ▶ 예시:주사위를 던졌을 때 나오는 눈: 1, 2, 3, 4, 5, 6시험 점수 (0점, 1점, 2점, … 100점)버스 정류장에서 기다리는 사람 수: 0명, 1명, 2명…이런 것들은 0.5명, 3.7점, 4.2개의 사탕처럼 나올 수가 없죠.그래서 우리는 이런 상황을 .. 2025. 3. 22.
[감사일기] 창립기념일, 영화모임, 방통대 기말고사 - 12월 1주 즐겁게 한 것들 창립기념일 이번주는 회사의 창립기념일 행사가 있었다. 늘 그렇듯(?) 오전 행사 후 조기퇴근! 난 연차가 하나도 없는 사람이라. 뜻밖의 오후시간이 행복했다. 회사에서 나눠준 아베베 베이커리 도넛을 먹고 (흑임자도넛 짱맛ㅠ) 연말선물을 사러 국립중앙박물관으로 향했다. 역시나 국중박... 어찌나 예쁜게 많던지. 고민끝에 자개 달력을 몇개 사왔다. 실용적이기도 하고. 1년 내내 책상에 두고 보면서 날 기억하라는 의미였다 ^,^ 회사가 용돈(?)으로 30만원도 챙겨줘서 어찌나 든든하던지. 구 회사에 비해서 챙겨주는게 많아서인지. 늘 고맙다는 생각이 든다. 즐거운 창립기념일 행사. 회사가 선물해준 오후시간이 무척이나 행복하였다.   영화모임 여름에 만났던 영화모임 사람들과 연말모임을 가졌다. 영화모임이지만 어쩐지.. 2024. 12. 8.
[방통대 통계데이터과학과] 회귀분석에서 오차와 잔차 선형회귀분석에서 자주 나오는 오차(Error)와 잔차(Residual)는 비슷해 보이지만, 엄연히 다른 개념이다.둘의 차이를 명확히 이해하면 통계 분석의 기초를 확실히 잡을 수 있다! 📊✨ 1. 오차(Error): 진짜 값과의 차이오차는 모집단 전체에서 예측값과 실제값(관측값)의 차이.정의오차는 모델이 모집단 데이터를 얼마나 잘 설명하지 못했는지를 나타낸다.특징모집단과 관련됨오차는 모집단의 데이터를 기반으로 정의.관측할 수 없음모집단의 진짜 값을 알 수 없기 때문에, 오차는 관측이 불가능하다. 한눈에 보기: 선형회귀의 오차 가정 4가지선형성독립변수와 종속변수의 관계는 선형이어야 함.비선형 변환 또는 비선형 모형 사용독립성오차항들 간에 상관관계가 없어야 함.시계열 분석, 복잡한 모형 도입등분산성오차항의 .. 2024. 12. 5.
[방통대 통계데이터과학과] 통계적 추정과 가설검정 (표본평균, 신뢰구간, 신뢰구간의 너비) 통계학의 핵심인 표본평균의 특성과 신뢰구간에 대해 알아보자.표본이 늘어나면 신뢰구간의 너비가 어떻게 바뀌는지도 살펴볼것이다 📊✨  1. 표본평균의 특성 🎯표본평균은 모집단의 특성을 추정하기 위해 표본 데이터의 평균을 계산한 값이다.다음은 표본평균의 주요 특성이다:① 표본평균은 불편추정량이다표본평균은 모집단 평균(μ\mu)을 추정하는 데 사용된다.불편추정량이란, 표본평균의 기대값이 모집단 평균과 같다는 뜻. ② 표본평균의 분산은 표본 크기에 반비례한다표본평균의 분산(즉, 표본평균이 얼마나 흩어져 있는지)은 표본 크기(nn)가 클수록 작아진다. (표본평균을 구하는 공식에서 표본크기는 분모에 해당하기 때문)③ 중심극한정리표본의 크기가 충분히 크면, 표본평균은 모집단 분포가 어떤 형태든지 간에 정규분포에 가.. 2024. 12. 5.
[방통대 통계데이터과학과] 바이오통계학 - 연속형데이터의 비교 (이표본 T검정/ 대응표본 T검정) 이표본 t검정 vs 대응표본 t검정: 차이를 이해하자! 📊🤔이표본 t검정과 대응표본 t검정에 대해 쉽게 이해할 수 있도록 설명해보자 📚✨ 두 검정 모두 평균 차이를 비교하는 데 사용되지만, 각각의 적용 상황은 다르다. 이를 알아두면 통계 분석에서 어떤 검정을 선택해야 할지 확실히 알 수 있다. 😊👍 1. 이표본 t검정이란? 🧮이표본 t검정은 두 독립된 집단의 평균 차이를 비교할 때 사용하는 방법이다. 여기서 "독립된 집단"이란 서로 영향을 주지 않는 그룹을 뜻한다.🛠 예시:그룹 A 학생들과 그룹 B 학생들의 시험 평균 점수 비교 📝남성과 여성의 평균 키 비교 👫✅ 주요 가정:집단 간 독립성: 두 집단은 서로 독립적이어야함정규성: 데이터가 정규분포를 따라야함. 📈분산 동질성: 두 집단의 .. 2024. 12. 2.
[내 머리로 머신러닝] 신경망 신경망의 기본 구조신경망은 마치 레고 블록을 쌓아 올린 것처럼 여러 층으로 이루어져 있다. 각 층은 수많은 작은 계산 단위들로 구성된다.     퍼셉트론: 신경망의 기본 벽돌퍼셉트론은 신경망의 가장 기본적인 구성 요소다. 마치 레고 블록 하나과 같다. 퍼셉트론은 여러 개의 입력을 받아 하나의 출력을 만들어 낸다.은닉층: 비밀 요리사의 주방은닉층은 입력층과 출력층 사이에 있는 층들을 말한다. 마치 레스토랑의 주방과 같다. 손님(입력)이 주문한 음식이 요리사들(은닉층)에 의해 여러 단계를 거쳐 맛있는 요리(출력)로 변하는 것처럼, 은닉층에서는 복잡한 계산이 이루어진다.활성화 함수: 마법의 양념활성화 함수는 각 뉴런(신경 세포)이 다음 층으로 정보를 전달할지 말지를 결정한다. 이것은 마치 요리에 뿌리는 마법의.. 2024. 11. 24.
[방통대 통계데이터과학과] 야구와 데이터 - 타율, 출루율, 평균자책점 등 방통대 통계데이터과학과에는 라는 기초수업이 있다.야구선수들의 데이터를 주제로 수업했고수업내용을 토대로 KBO기록들도 함께 살펴보기로 한다.  세이버메트릭스(Sabermetrics) - 야구경기의 각종 기록과 데이터에 대한 통계적 분석방법을 다루는 분야다. 이를 대표적으로 알 수 있는 영화로는 이 있다. 주요 핵심지표는 다음과 같다. 지표설명목적WAR (Wins Above Replacement)대체 선수 대비 승리 기여도를 측정, 한 선수가 팀에 얼마나 기여했는지 평가선수의 종합적인 가치 평가OPS (On-base Plus Slugging)출루율(OBP) + 장타율(SLG)로 구성된 타자의 공격력 지표타자의 공격력을 간단하게 파악할 수 있는 지표BABIP (Batting Average on Balls In.. 2024. 10. 6.
[방통대 통계데이터과학과] 베이즈분석 - 제프리스 어쩌고 공부내용 정리 하. 내가 왜 을 수강했을까. 정말 말도 안되게 어렵다. 일단 개념만 대충 훑어보기로 하자. 4강 베이즈가설검정에서는 사후오즈비 = 사전오즈비 X 베이즈인자 뭐 이런 공식이 나오면서 계산식이 어마무시하게 나오는데 저는 수포자란 말이에요 각설하고. 일단 제프리스 어쩌고 개념만 정리해두고자 한다. 1. 제프리스의 기준 제프리스의 기준은 베이즈 분석에서 사전 확률을 설정할 때 사용하는 방법이다. 예를 들어, 동전을 던질 때 앞면이 나올 확률을 모르지만, 앞면과 뒷면이 나올 확률이 같다고 생각하고 싶다면 제프리스의 기준을 적용할 수 있다. 물론 제프리스의 기준이 50:50처럼 반반으로 설정하는 것은 아니다. 문제에 맞게 가장 중립적이고 공평하게 사전 확률을 설정하려고 하는 방법이다. 예를 들어, 동전을 던질 때.. 2024. 9. 19.
[감사일기] 방통대 통계데이터과학과 합격, ADP 공부 - 7월 5주 즐겁게 한 것들 방통대 통계데이터과학과 합격 갈말갈말 몇년째 고민했던 방송통신대학교 통계데이터과학과에 지원해 합격했다.  혹자는 '방통대 뭐 지원만 하면 합격하는거 아냐?' 라고 말할지도 모르겠지만. 나는 그렇게 생각하지 않는다. '지원했기 때문에' 비로소 '합격' 한 것이다. 지원하는 것. 도전하는 것. 그 자체가 의미있는 것이다.  나로말할것 같으면... 사실 몇년전에 법학과에 진학했다가 제적된 흑역사가 있다. 당시 라는 드라마를 보고 변호사가 너무 멋있어보여서 일단 법 공부를 찍먹해보기위해 도전했다. 하지만 당연하게도! 법학과는, 무려 방통대는, 찍먹해보러는 안일한 마음가짐으로는 공부를 이어갈 수 없는 대학이었다. 결국 현실을 깨닫고 GG... 한번의 실패경험이 있기에 더욱 다시 도전하기가 어려웠다. 하지만 나란여.. 2024. 8. 2.