-
[데이터분석개론] Linear Regression . 선형회귀분석IT&컴퓨터공학/데이터분석개론 2021. 2. 13. 14:28
Linear Regression ( 선형 회귀분석 )
X로 Y 를 예측하며 이때 이때 Y 를 분류하는것이 아닌 '예측' 하는 것이기 때문에 Y 값은 항상 numerical 한 outcome 이어야 한다.
- Simple Linear Regression ( 단순 선형 회귀분석 )
가장 간단한 지도학습 중 하나.
하나의 X 로 Y 를 예측하는 회귀선을 그리며, 이때 선은 실제 Y값과 예측된 값 사이의 편차의 제곱을 최소화 하도록 그려진다.
- Multiple Linear Regression ( 다중 선형 회귀분석 )
여러개의 X 로 Y 를 예측하는 회귀선을 그린다.
우리는 P 개의 dimensions 들을 가지고 있으며, 해당 dimensions 들로 Y값을 예측한다.
빨간 박스 부분이 내가 가지고있는 선형식 ( 모델 ) 을 나타내며
오차는 내가 가지고 있는 선형식으로는 설명이 불가능한 부분을 나타낸다.
해당식의 오차가 최소가 되도록 베타값들을 찾아 선형식을 완성하는게 우리의 목표다.
이때 베타값들을 추정하는 것뿐 아니라 어떤 dimensions 들을 포함시킬지도 결정해야한다.
베타값은 Ordinary Least Squares ( 최소자승법 ) 을 사용해서 구할 수 있다.
Ordinary Least Squares ( 최소제곱법 ) - OLS method
Explanatory vs Predictive Modeling
- Explanatory Modeling : 설명에 초점을 맞춘 모델링이다.
- Predictive Modeling : 예측에 초점을 맞춘 모델링이다.
'IT&컴퓨터공학 > 데이터분석개론' 카테고리의 다른 글
[데이터분석개론] K-Nearest Neighbors (0) 2021.02.13 [데이터분석개론]Logistic Regression . 로지스틱 회귀분석 (0) 2021.02.13 [데이터분석개론] Predictive Performance / Classifier Performance (0) 2021.02.12 [데이터분석개론] 머신러닝과 Performance Evaluation (0) 2021.02.12 [데이터분석개론] PCA - Dimension Reduction 방법 중 하나 (0) 2021.02.11 댓글