728x90
TIL
📌
오늘 한 일
딥러닝 원격 강의 듣기
거북이 반 OT
오늘 아침부터 너무 피곤했다. 프로젝트할 때 쌓인 피로가
밀려온 느낌 그래서 의자에 앉아서 자버렸다.
제정신으로 공부한건 두시부터 인 거 같다.
오늘부터 딥러닝 강의가 있어서 1주 차 강의를 들었다.
딥러닝 초반에는 머신러닝, 선형 회귀 기초적인 지식을 배웠다.
그래프를 보니 고등학교 때 배웠던 수학이 생각났다.
많이 익숙해서 이해하기 쉬웠음
1주 차 강의를 듣고 8시부터 거북이 반 오티를 들었다.
오티 내용은 장고에 관한 것이었다.
회원가입도 만들지 못하는 나에겐 딱 좋은 수업이었다.
거북이 반 수업을 듣고 얼른 장고를 잘 활용하고 싶다.
remind
---딥러닝---
선형회귀 :
두 데이터 간의 직선 관계를 찾아내서 x값이 주어졌을 때 y값을 예측하는 것
H(x) = Wx + b
H(x)는 우리가 가정한 직선이고 y는 정답 포인트라고 했을 때 H(x)와 y의 거리(또는 차의 절댓값)가 최소가 되어야 이 모델이 잘 학습되었다고 할 수 있음.
머신러닝을 크게 3가지로 분류:
지도/비지도/강화 학습
지도 학습(Supervised learning) : 정답을 알려주면서 학습시키는 방법
비지도 학습(Unsupervised learning) : 정답을 알려주지 않고 군집화하는 방법
강화 학습(Reinforcement learning) : 주어진 데이터 없이 실행과 오류를 반복하면서 학습하는 방법(알파고를 탄생시킨 머신러닝 방법)
데이터셋 분할
1. Training set(학습 데이터셋, 트레이닝셋) = 교과서
머신러닝 모델을 학습시키는 용도로 사용한다. 전체 데이터셋의 약 80% 정도를 차지한다.
2. Validateion set(검증 데이터셋, 밸리데이션셋) = 모의고사
머신러닝 모델의 성능을 검증하고 튜닝하는 지표의 용도로 사용한다.
이 데이터는 정답 라벨이 있고, 학습 단계에서 사용하기는 하지만,
모델에게 데이터를 직접 보여주지는 않으므로 모델의 성능에 영향을 미치지 않는다.
손실 함수, Optimizer등을 바꾸면서 모델을 검증하는 용도로 사용한다.
전체 데이터셋의 약 20% 정도를 차지
3. Test set(평가 데이터셋, 테스트셋) = 수능
정답 라벨이 없는 실제 환경에서의 평가 데이터셋이다.
검증 데이터셋으로 평가된 모델이 아무리 정확도가 높더라도 사용자가 사용하는
제품에서 제대로 동작하지 않으면 소용없다.
728x90
'내일배움캠프' 카테고리의 다른 글
36. 내일배움캠프 - 27일차 TIL(딥러닝 2주차, 거북이반day1) (3) | 2022.10.11 |
---|---|
35. 내일배움캠프 -6주차 WIL (0) | 2022.10.10 |
33. 내일배움캠프 - 25일차 TIL 겸 KPT (0) | 2022.10.06 |
32. 내일배움캠프 - 24일차 TIL (0) | 2022.10.06 |
31. 내일배움캠프 - 23일차 TIL (0) | 2022.10.05 |
댓글