본문 바로가기
728x90
반응형

AI Research47

[인공지능 기초] 선형 회귀(Linear Regression)와 로지스틱 회귀(Logistic Regression) - 2 이번 포스팅에서는 로지스틱 회귀에 대해 다루도록 하겠습니다. ​ ​ ▶ 로지스틱 회귀(Logistic Regression)란? 로지스틱 회귀는 회귀를 사용하여 데이터가 어떤 범주에 속할 확률을 0~1사이로 예측하고, 그 확률에 따라 가능성이 더 높은 범주에 속하는 것으로 분류해주는 supervised learning 알고리즘입니다. 어떤 메일을 받았을 때 정상 메일인지, 스팸 메일인지 분류한다거나, 시험 점수를 보고 합격인지 불합격인지 분류하는 문제등이 이에 속합니다. 이렇게 데이터가 2개의 범주중 하나로 분류되도록하는 것을 이진 분류(binary classification)이라고 합니다. 로지스틱 회귀에서는 데이터가 트겅 범주에 속할 확률을 예측하기 위해 아래와 같은 단계를 거칩니다. 1. 모든 fea.. 2023. 2. 28.
[인공지능 기초] 선형 회귀(Linear Regression)와 로지스틱 회귀(Logistic Regression) - 1 이번 포스팅과 다음 포스팅에서는 회귀(regression)에 대해 설명하겠습니다. 이번 포스팅에서는 선형회귀와 선형회귀의 학습 과정에 대해 다루도록 하겠습니다. ​ ​ ▶ 선형 회귀(Linear Regression)란? 머신러닝은 모델을 생성하여 여러 인풋 값에 대해 적절한 아웃풋을 예측하는 것이 목적입니다. 이 때 입력 대비 아웃풋을 가장 잘 표현할 수 있는 것이 선(line)입니다. 이렇게 데이터를 두고 그것을 잘 표현할 수 있는 선을 찾는 것을 선형 회귀(Linear Regression)라고 합니다. 예를 들어, 키와 몸무게 데이터들을 표현한 데이터가 있다면, 그것들을 잘 표현할 수 있는 선을 찾으면 특정인의 키를 바탕으로 몸무게를 예측할 수 있게됩니다. 키를 독립변수, 독립변수의 변화에 따라 어떻.. 2023. 2. 28.
[인공지능 기초] 정규화 (Normalization) 이전 포스팅에 이어서 이번 게시물에서는 Normalization에 대해 설명하겠습니다. ​ ​ ▶ 정규화(Normalization) 이 기법은 학습시에 사용할 데이터 값의 범위를 0~1사이로 일정하게 만들어주기 위해 사용합니다. 데이터를 0-1사이의 범위로 바꿔주는 방법은, $\frac{정규화하고자하는\ 값\ -\ 데이터\ 값들\ 중\ 최소\ 값}{데이터\ 값들\ 중\ 최대\ 값\ -\ 데이터값들\ 중\ 최소\ 값}$정규화하고자하는 값 − 데이터 값들 중 최소 값데이터 값들 중 최대 값 − 데이터값들 중 최소 값​​ 위와 같습니다. 그렇다면, Normalization이 필요한 이유는 무엇일까요? 1. 사용하는 데이터의 범위가 너무 크면 노이즈가 발생하기 쉽고, 오버피팅이 일어나기 쉽습니다. 2. 학습을 .. 2023. 2. 26.
[인공지능 기초] Regularization Regularization과 Normalization은 딥러닝에 자주 등장하는 단어입니다. 이번 포스팅과 다음 포스팅에서는 두 단어의 개념에 대해서 설명하도록 하겠습니다. ​ ​ ▶ Regularization 번역하여 '일반화'라고 이해하면 쉽게 이해 할 수 있을 것 같습니다. 이 방법은 모델에 제약(패널티)을 줘 오버피팅을 해결하는 방법이라고 할 수 있습니다. perfect fit을 포기하여 training acccuracy(학습 정확도)를 낮춤으로써 모델을 더 일반적이게(generalization) 만드는 것입니다. 그 결과로 potential fit이 증가하게되고 testing accuracy를 높힐 수 있습니다. 출처 모델을 만드는 방법 중 가장 단순한 것은 계속해서 loss function의 값.. 2023. 2. 26.
728x90
반응형