[인공지능 기초] 정규화 (Normalization)
·
AI Research/Artificial Intelligence
이전 포스팅에 이어서 이번 게시물에서는 Normalization에 대해 설명하겠습니다. ​ ​ ▶ 정규화(Normalization) 이 기법은 학습시에 사용할 데이터 값의 범위를 0~1사이로 일정하게 만들어주기 위해 사용합니다. 데이터를 0-1사이의 범위로 바꿔주는 방법은, $\frac{정규화하고자하는\ 값\ -\ 데이터\ 값들\ 중\ 최소\ 값}{데이터\ 값들\ 중\ 최대\ 값\ -\ 데이터값들\ 중\ 최소\ 값}$정규화하고자하는 값 − 데이터 값들 중 최소 값데이터 값들 중 최대 값 − 데이터값들 중 최소 값​​ 위와 같습니다. 그렇다면, Normalization이 필요한 이유는 무엇일까요? 1. 사용하는 데이터의 범위가 너무 크면 노이즈가 발생하기 쉽고, 오버피팅이 일어나기 쉽습니다. 2. 학습을 ..
[인공지능 기초] Regularization
·
AI Research/Artificial Intelligence
Regularization과 Normalization은 딥러닝에 자주 등장하는 단어입니다. 이번 포스팅과 다음 포스팅에서는 두 단어의 개념에 대해서 설명하도록 하겠습니다. ​ ​ ▶ Regularization 번역하여 '일반화'라고 이해하면 쉽게 이해 할 수 있을 것 같습니다. 이 방법은 모델에 제약(패널티)을 줘 오버피팅을 해결하는 방법이라고 할 수 있습니다. perfect fit을 포기하여 training acccuracy(학습 정확도)를 낮춤으로써 모델을 더 일반적이게(generalization) 만드는 것입니다. 그 결과로 potential fit이 증가하게되고 testing accuracy를 높힐 수 있습니다. 출처 모델을 만드는 방법 중 가장 단순한 것은 계속해서 loss function의 값..