본문 바로가기

하루 30분 머신러닝, 딥러닝 기초다지기

(4)
하이퍼파라미터와 네트워크 깊이의 관계성 Learning Rate, Epoch I  Learning Rate와 Epoch1. Learning Rate와 Epoch의 역할 Learning Rate란?Learning Rate는 한 번의 업데이트(Gradient Descent)에서 가중치가 얼마나 크게 조정되는지를 결정하는 것을 말한다. Learning Rate가 크면 빠르게 학습하지만 불안정하거나 최적점을 넘어서 진동할 수 있고  Learning Rate가 작으면 안정적으로 학습하지만 수렴 속도가 느려지고 더 많은 Epoch이 필요하다.  Epoch란?Epoch는 전체 데이터셋을 학습하는 반복 횟수를 의미한다.Epoch가 적으면 학습이 충분하지 않기 때문에 언더피팅될 가능성이 크다. Epoch가 많으면 많이 학습할 수 있지만 학습 시간이 길어지고과적합될 위험이 있다.  2. Lear..
Skit - learn으로 머신러닝 구현해 보기 설치 및 improt pip install scikit-learn 사이킷런 install 사이트 import sklearn print(sklearn._version_) skit - learn의 주요 메소드 Transformer() from sklearn.model_selection import train_test_split fit() predict() 데이터 표현법 skit - learn에서는 numpy의 Ndarray, pandas의 DataFrame, scipy의 Sparse Matrix로 데이터셋을 제공한다. skit - learn은 데이터를 보통 Feature matrix(특성 행렬)과 Target vector(타겟 벡터)로 나타냅니다. Feature matrix 입력 데이터를 의미 feature..
머신러닝 알고리즘 머신러닝 알고리즘이란 머신러닝 : 데이터로부터 자동으로 모델을 생성하는 방법 머신러닝 알고리즘 : 데이터 집합을 모델로 바꿔주는 알고리즘 대표적인 머신러닝 알고리즘 3가지 - 지도학습 (Supervised Learning) - 비지도학습 (Unsupervised Learning) - 강화학습 (Reinforcement Learning) 머신러닝에서 알고리즘은 가장 크게 지도와 비지도, 강화학습으로 나눌수 있다. 지도 학습은 정답이 포함된 문제를 학습데이터로 제공한다. 이와 반대로 비지도 학습은 정답이 없는 데이터를 제공해서 알고리즘이 스스로 데이터를 살펴보고 유의미한 결과를 도출하게 한다. 머신러닝 알고리즘은 우리가 구현하고자하는 용도에 따라 선택할 수 있고, 또 합쳐서 사용될 수도 있다. 어떤 알고리즘..
Regularization(정규화) Ridge vs Lasso Regularization(정규화) : 모델을 변형하여 과적합을 완화해 일반화 성능을 높여주기 위한 기법을 말한다. 위의 세가지 모델을 통해 under fitting(과소적합)된 모델과 over fitting(과적합)된 모델을 살펴보자. 첫번째 모델을 보면 train data와 예측값이 많이 차이가 나는 것을 볼수 있다. 이런 경우를 under fitting, high bias라고 한다. 이와 같은 모델은 train data를 잘 학습하지 못하였고 test data와 train data사이의 차이가 너무 크기 때문에 값을 잘 예측 할 수 없다. 세번째 모델은 train data의 모든 점들을 예측값이 전부 통과하는 것을 볼수 있다. 이런 경우를 over fitting, high vaiance라고 한다. ..