본문 바로가기
개발자 일기/일일회고 (TIL)

[Upstage AI Lab]부트캠프 27일차

by MS_developer 2024. 12. 24.

오늘의 생각



지난 주 월요일 제외 휴가를 다녀왔다.

 

휴가를 다녀오고 첫날부터 매우매우 바쁜 하루였다.

 

그만큼 밀렸던 내용이 많았고, 경진대회도 시작하기 때문에 최대한 많은 강의를 빠른 시간 안에 들어야 했다. 진짜 오랜만에 거의 쉬지도 않고 하루종일 강의만 들었던 것 같다. (밥도 못먹었다)

 

덕분에 머릿속에 지식을 강제로 주입당하는 느낌이었다...

 

그래도 본격적으로 ML을 배우게 되어서 흥미로운 과정들이 많았다. 중간중간 궁금한 점들이 있었는데, 더 자세히 알아보지 못해 아쉬웠다. 기회가 된다면 별도의 포스팅을 해보는 걸로..!


오늘의 학습내용

  • 머신러닝의 정의 - 약인공지능 / 강인공지능
  • ML 프로젝트의 구성요소
    • 함수 정의의 수학적 표현법
    • 데이터와 모델의 학습
    • 머실러닝에서 학습의 의미
    • 머신러닝 시스템의 확장성
  • ML 시스템의 확장성, 그리고 그 한계 - UAT
  • 데이터의 종류와 구분
    • 정량적 정보와 정성적 정보
    • 정형 데이터와 비정형 데이터
    • 수치형 변수와 범주형 변수
  • 다양한 도메인의 데이터 처리
  • 데이터의 품질과 EDA(탐색적 데이터 분석) - 편향, 이상치와 결측치의 파악, 상관계수, 상관행렬 그림 등
  • 지도학습 방법론
    • 회귀 모델의 정의와 개념 - 최적화의 수치적 해법과 해석적 해법, 상관분석과 상관계수 등
    • 분류 모델의 정의와 개념 - 이진분류, 로지스틱 함수, 시그모이드 함수, 크로스엔트로피 등
    • 이 외 다양한 방식의 분류문제 모델링 - kNN,  결정트리 + 결정포레스트, 결정경계, SVM
  • 비지도학습 방법론
    • 비지도학습의 정의와 예시 - 군집화, 분류 문제, 군집화 문제 등
    • 고차원 데이터의 이해 - 고차원에서 생기는 문제점들
    • PCA(주성분분석)를 이용한 차원축소와 시각화 - SVD, 정규직교행렬, truncated SVD 등
    • 데이터의 군집화 방법론 - k-means 군집화
  • ML 기반의 추천 시스템
    • 기초 추천 시스템 모델링 방법론 - 인기도 기반 추천시스템, 연관규칙 추천시스템, 콘텐츠 기반 추천시스템
    • 협업 필터링을 활용한 평점 예측 - 희소행렬, SVD를 이용한 유저-아이템 행렬의 Factorization 등
    • 시계열 데이터의 처리 - 시계열 데이터 모델링 방법론
  • 모델 평가의 기초
    • 모델의 일반화 성능과 데이터셋의 분할 - 평가용과 검증용 데이터셋의 역할, k-fold 교차검증의 활용, 외삽/내삽과 일반화 성능 등
    • 기초 정량평가 방법론
    • 휴먼 베이스라인과 목표 성능지표의 설정 - 베이즈에러와 휴먼 퍼포먼스
    • 체계적인 정량평가 방법론 / 체계적인 정성평가 방법론
    • 모델 에러의 분석 

댓글