목록회귀 (4)
오랑우탄의 반란
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bc4u6i/btsIZ7oz3ro/KcOO84NhY6nZCoLCCUBkkk/img.png)
로지스틱회귀란?독립변수 Y의 선형 결합을 이용해 사건의 발생 가능성을 예측하는 데 사용되는 통계 기법 로지스틱회귀 이론만약 X를 연속형 변수로 두고 Y 를 특정 값이 될 확률로 설정한다면, 앞서 배웠던 선형회귀로는 표현이 불가능할 것입니다. 선형 함수는 발산하기 때문에 실제 확률이 0보다 작거나 1보다 크게 나올 수도 있기 때문이지요. 그래서 이 한계를 보완하고자 로지스틱회귀를 사용합니다. 아래 그래프를 보시면 함수에 로그를 취해서 Y값이 0, 1로 수렴하도록 설계된 것을 볼 수 있습니다. 즉, Y가 특정 범주에 속할 때 범주형 변수에 대한 분석으로 로지스틱회귀가 적합합니다. 로지스틱회귀 수식로그함수가 어떻게 그려지는지 단계별로 살펴보겠습니다. 1. Odds RatioOdds ratio (오즈비)란..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/6YW7j/btsIZzeBIgB/yf6fpuGf3kYGrcToDNpDO1/img.png)
머신러닝 선형회귀분석 실습회귀분석은 scikit-learn 라이브러리에서 제공해주는 함수만 다룰 줄 알면 매우 간단한데요, 아래 단계에 따라 진행하겠습니다.사용할 라이브러리 설치데이터 확인 (Seaborn tips)선형회귀 모델 훈련모델 평가 1. 라이브러리 설치우선 사용할 라이브러리를 모두 import 해줍니다.import pandas as pd import matplotlib.pyplot as pltimport seaborn as snsimport numpy as npimport sklearn #scikit-learn으로 적으면 안됨 라이브러리 설치가 안 되어 있다면 pip 설치를 진행해주세요.! pip install 라이브러리 2. 데이터 확인 이번 실습에서 사용할 데이터는 Seaborn 라이브러..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/n5Miu/btsIXty6Uz9/tmU9OjDKeolc1fz1BJlgz0/img.png)
선형회귀란?선형적인 관계를 가진 두 변수 X, Y에 대해 모르는 데이터 값을 예측하는 것 선형회귀 이론키(Y)와 몸무게(X) 분포가 아래와 같이 있다고 가정해봅시다. 이때 두 변수 사이에 일정하게 증가하는 패턴을 보고 우리는 몸무게를 알면 키를 예측할 수 있겠다고 생각할 수 있습니다. 하지만 실제로 각 값의 분포에 대해 예측 선을 무한하게 그릴 수 있는데요, 이때 데이터 분포를 가장 잘 설명해줄 수 있는 선을 그리는 것이 선형회귀입니다. weights = [87,81,82,92,90,61,86,66,69,69]heights = [187,174,179,192,188,160,179,168,168,174] 그러면 이 선을 어떻게 그리는 게 좋을까요? 바로 각각의 값에 대해 선과의 오차를 계산해서 최소의 오..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/sa54i/btsIUmSmFOg/7gxFJ6vGnxOtLbd35TvbN1/img.png)
이전 포스트에 이어 기본적인 회귀 종류를 살펴보겠습니다. 단순선형회귀독립변수 x와 종속변수 y 사이의 관계를 직선 형태로 모델링한 방법데이터가 직선적 경향을 따를 때 사용, 간단하고 해석이 용이함 가지고 있지 않는 데이터에 대해 예측할 수 있음 Y = β0 + β1Xex) 광고비x와 매출y의 관계 분석 import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.linear_model import LinearRegressionfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import mean_squared_error, r2_score# 예..