본문 바로가기
내일배움캠프

34. 내일배움캠프 - 26일차 TIL

by 새싹_v 2022. 10. 7.
728x90


 

TIL

📌
오늘 한 일

딥러닝 원격 강의 듣기
거북이 반 OT

오늘 아침부터 너무 피곤했다. 프로젝트할 때 쌓인 피로가

밀려온 느낌 그래서 의자에 앉아서 자버렸다.

제정신으로 공부한건 두시부터 인 거 같다.

오늘부터 딥러닝 강의가 있어서 1주 차 강의를 들었다.

딥러닝 초반에는 머신러닝, 선형 회귀 기초적인 지식을 배웠다.

그래프를 보니 고등학교 때 배웠던 수학이 생각났다.

많이 익숙해서 이해하기 쉬웠음

1주 차 강의를 듣고 8시부터 거북이 반 오티를 들었다.

오티 내용은 장고에 관한 것이었다. 

회원가입도 만들지 못하는 나에겐 딱 좋은 수업이었다. 

거북이 반 수업을 듣고 얼른 장고를 잘 활용하고 싶다.

 

 

 

remind

---딥러닝---

선형회귀 : 
두 데이터 간의 직선 관계를 찾아내서 x값이 주어졌을 때 y값을 예측하는 것
H(x) = Wx + b
H(x)는 우리가 가정한 직선이고 y는 정답 포인트라고 했을 때 H(x)와 y의 거리(또는 차의 절댓값)가 최소가 되어야 이 모델이 잘 학습되었다고 할 수 있음.


머신러닝을 크게 3가지로 분류:
지도/비지도/강화 학습

지도 학습(Supervised learning) : 정답을 알려주면서 학습시키는 방법
비지도 학습(Unsupervised learning) : 정답을 알려주지 않고 군집화하는 방법
강화 학습(Reinforcement learning) : 주어진 데이터 없이 실행과 오류를 반복하면서 학습하는 방법(알파고를 탄생시킨 머신러닝 방법)


데이터셋 분할

1. Training set(학습 데이터셋, 트레이닝셋) = 교과서
머신러닝 모델을 학습시키는 용도로 사용한다. 전체 데이터셋의 약 80% 정도를 차지한다.

2. Validateion set(검증 데이터셋, 밸리데이션셋) = 모의고사
머신러닝 모델의 성능을 검증하고 튜닝하는 지표의 용도로 사용한다.
이 데이터는 정답 라벨이 있고, 학습 단계에서 사용하기는 하지만,
모델에게 데이터를 직접 보여주지는 않으므로 모델의 성능에 영향을 미치지 않는다.
손실 함수, Optimizer등을 바꾸면서 모델을 검증하는 용도로 사용한다.
전체 데이터셋의 약 20% 정도를 차지

3. Test set(평가 데이터셋, 테스트셋) = 수능
정답 라벨이 없는 실제 환경에서의 평가 데이터셋이다.
검증 데이터셋으로 평가된 모델이 아무리 정확도가 높더라도 사용자가 사용하는
제품에서 제대로 동작하지 않으면 소용없다.
728x90

댓글