머신러닝 2

군집화 모델(Clustering Model)의 개념과 K-Means/K-Means++ 알고리즘

들어가면서 머신러닝은 크게 지도학습과 비지도학습으로 구분할 수 있다. 지도 학습(Supervised Learning)은 입력 값이 주어졌을 때 원하는 결과값(label)을 가진 학습 데이터를 학습시켜서, 이후 결과값이 없는 테스트 데이터가 주어졌을 때 적절한 결과값을 찾도록 하는 방법이다. 지도 학습은 결과값이 딱딱 끊어지는 범주형 데이터인 경우 분류 모델(Classification Model)을 활용하고, 연속형 데이터가 결과값으로 제공된다면 회귀 모델(Regression Model)을 활용하게 된다. 회귀 모델을 통한 사업 지표 예측하기 (1) (회귀모델의 개념/성능평가) 반면 학습 데이터가 없는 경우라면 비지도학습(Unsupervised Learning)을 적용하게 된다. 오늘 정리한 군집화 모델(..

데이터 이야기 2023.01.09

회귀 모델을 통한 사업 지표 예측하기 (1) (회귀모델의 개념/성능평가)

목차 1. 회귀 모델 Regression Model 2. 회귀 모델의 성능 평가 회귀 모델 Regression Model - 2023년의 거래액은 어떻게 예측할 수 있을까? - 2023년의 회원가입은 어느 정도 수준으로 나타날 수 있을까? 특정 사용자가 이탈할 것인가, 잔류할 것인가를 판단할 때는 분류 모델Classification Model을 활용했다. 하지만 내년도 실적 전망치를 예측하는 경우에는 이런 분류 모델을 활용할 수 없다. 왜냐하면, 결과값이 연속형 데이터이기 때문이다. 이런 경우에는 회귀 모델 Regression Model을 사용하게 된다. 회귀는 회귀 분석의 그 회귀다. 어떤 자료에 대해 그 값에 영향을 주는 요소를 고려하여 구한 평균으로, 연속형 데이터의 형태로 값을 예측할 때 사용하는..