Study13 [딥러닝의 기본] Linear Regression cost 함수 최소화 ML lec 03 - Linear Regression의 cost 최소화 알고리즘의 원리 설명 가설과 실제 값의 차를 최소화할 수 있는 W와 b를 찾는 것이 Linear Regression의 목표다. 설명을 위해서 hypothesis를 간단히 했다. 편향 b를 없애고 가중치 W만 가진다. W 값에 따라 cost 함수는 어떻게 될지 본다. W에 따라 cost(W)가 어떻게 변할지 그래프를 그려볼 수 있다. 우리는 cost 함수가 최소화되게끔 찾아야 하기 때문에 최소화된 점을 찾는다. 여기선 (1,0)이지만 기계적으로 찾아야 한다. 최솟값을 찾을 때 많이 사용되는 알고리즘이 경사하강법 Gradient descent algorithm이다. 만약 언덕 위에 있다면 주변에 있는 경사진 곳을 찾아 내려가는 간단한 방.. 2020. 5. 20. [딥러닝의 기본] Linear Regression 의 개념 ML lec 02 - Linear Regression의 Hypothesis 와 cost 설명 하나의 지도학습을 가정해보자. 예측하는 최종목표가 점수(0~100) 예측이라면 regression 모델이다. 이런 데이터를 가지고 학습시키는 과정을 training이라 하고, x와 y를 training data라고 한다. 데이터를 가지고 학습하면 모델을 만들고 학습이 끝난다. regression을 사용한다는 것은 7시간 공부한 학생의 점수를 시험 치기 전에 예측하는 일이다. 이러한 예측은 선형 회귀, Linear Regression이라 한다. Linear Regression이 어떻게 동작하는지 보겠다. 설명을 위해 간단한 dataset이 있다. x는 예측을 위한 자료 또는 feature다. y는 예측 대상이다. .. 2020. 5. 20. [딥러닝의 기본] 머신러닝의 개념과 용어 책 『밑바닥부터 시작하는 딥러닝』을 공부하면서 김성훈 교수님의 강의 를 듣게 되었다. 따라서 정리를 하고자 포스팅 한다. Lec 00 - Machine/Deep learning 수업의 개요와 일정 강의 대상은 아래와 같다. 머신러닝을 블랙박스처럼 사용하고 싶은 사람은 본 강의를 들으면 좋다고 한다. 즉, 우리는 머신러닝 원리 안에 무엇이 들어있는지 모르는 채로 입력값으로 도출된 출력값으로 무언갈 할 수 있다. 만약 머신러닝을 이해한다면 블랙박스를 효율적으로 이용하여 출력값을 만들어낼 수 있을 것이다. 강의 목표는 아래와 같다. 김성훈 교수님이 강의를 만드는 데는 아래의 링크들을 참고하셨다고 한다. Andrew Ng 교수님의 ML 강의 강의를 요약한 노트 사이트 CNN 강의 TensorFlow 공식 웹사이.. 2020. 5. 20. 6-2. 학습 관련 기술들 6.4. 바른 학습을 위해 기계학습에서는 오버피팅을 억제하는 기술이 중요해진다. 오버피팅이란 신경망이 훈련 데이터에만 지나치게 적응되어 그 외의 데이터에는 제대로 대응하지 못하는 상태다. 6.4.1. 오버피팅 오버피팅은 주로 다음의 두 경우에 일어난다. 매개변수가 많고 표현력이 높은 모델 훈련 데이터가 적음 이 두 요건을 일부로 충족하여 오버피팅을 일으켜보겠다. 60000개인 MNIST 데이터셋의 훈련 데이터 중 300개만 사용하고, 7층 네트워크를 사용해 네트워크의 복잡성을 높이겠다. 각 층의 뉴런은 100개, 활성화 함수는 ReLU를 사용한다. 실험에 필요한 코드를 발췌해 설명하겠다. (깃허브https://github.com/WegraLee/deep-learning-from-scratch 에서 ch0.. 2020. 5. 12. 6-1. 학습 관련 기술들 6. 학습 관련 기술들 6장에서는 신경망 학습의 핵심 개념을 다룬다. 가중치 매개변수의 최적값을 탐색하는 최적화 방법, 가중치 매개변수 초깃값, 하이퍼파라미터 설정 방법 등이다. 오버피팅 대응책인 가중치 감소와 드롭아웃 등의 정규화 방법과 배치 정규화도 짧게 알아본다. 6.1. 매개변수 갱신 신경망 학습의 목적은 손실 함수의 값을 가능한 한 낮추는 매개변수를 찾는 것이다. 이는 곧 매개변수의 최적값을 찾는 문제이며, 이 문제를 푸는 것을 최적화(optimization)라 한다. 신경망 최적화는 굉장히 어려운 문제다. 매개변수 공간은 매우 넓고 복잡해서 최적의 솔루션은 쉽게 찾을 수 없다. 심층 신경망에서는 매개변수의 수가 엄청나게 많아져서 더 어렵다. 지금까지 최적의 매개변수 값을 찾는 단서로 매개변수의.. 2020. 5. 11. 이전 1 2 3 다음