본문 바로가기
개발자 일기/일일회고 (TIL)

[Upstage AI Lab]부트캠프 10일차

by MS_developer 2024. 11. 27.

오늘의 생각

 

 

너무 많은 개념을 하루만에 배운 것 같다.

 

확률과 통계에 대한 기본적인(!!) 개념들과 파이썬을 통한 데이터 통계를 알아봤는데, 솔직히 소화가 전혀 안 됐다.

 

반복적인 학습이 필요할 것 같고, 실습도 많이해봐야 알 것 같다. 모르는 메소드들이 많다보니 일단은 "아 이런 기능이 있구나."를 꼭 기억하려고 애쓰고 있다. 

 

고등학교 때부터 수학은 영어로 배워서 단어들도 익숙치 않고, 영어 단어들도 생소한 녀석들이 꽤 많았다. 무서웠다.


오늘의 학습내용

  • 산술평균, 기하평균, 조화평균
  • 평균의 함정 - 중앙값과 최빈값
  • 분산, 표준편차 자료의 밀집과 퍼짐 정도
  • 사분위 범위 (IQR)과 이상치의 탐지
  • 변동계수
  • 왜도와 첨도
  • 모집단과 표본, 샘플링 방법
  • 정규분포와 중심극한 정리
  • 카이제곱 분포
  • 스튜던트 t 분포
  • F 분포
  • 가설검정 - P값
  • 단측검정과 양측검정
  • 제 1종 오류와 제 2종오류
  • t 검정과 기각역
  • 분산 분석 (ANOVA)
  • 카이제곱 검정
  • 단순 선형 회귀 분석
  • 다중 선형 회귀 분석
  • 결정 계수 (R-Squared)와 평균 제곱근 오차 (RMSE)
  • 회귀 분석의 기본적인 가정 5가지 - 선형성, 잔차 정규성, 독립성, 다중 공산성, 등분산성

추가적으로 알게된 내용

 

사소한 부분이긴 한데, 일반적인 데이터 집합에서 벗어난 값 "Outlier"의 어원은 Out + Lier 다.

 

처음 단어를 들었을 때는 통계에 대한 거짓정보를 제공한다는 뜻에서 "Outliar"가 아닌가 했는데, "바깥에 누워있다"라는 뜻으로 "Outlier"를 사용한다.

댓글