목록vscode (4)
오랑우탄의 반란
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/b4hNbw/btsI0JG5epC/pjkP1U99pAvX3ihV3X5yn1/img.png)
다중선형회귀앞서 간단한 선형회귀 분석을 진행했는데요, 모든 데이터가 선형적인 관계를 보이면 참 좋겠지만 현실의 데이터는 비선형적인 관계를 지닐 때가 훨씬 많습니다. 그렇기 때문에 다중선형회귀분석이 더 많이 쓰일 수 있는데요, tips 데이터 중 수치형 데이터에 대해 분석을 진행했다면 이번에는 범주형 데이터를 인코딩(encoding)하는 과정까지 다뤄보도록 하겠습니다. 머신러닝 다중선형회귀분석 실습진행방법은 선형회귀와 동일한데요, 범주형 데이터를 간단하게 전처리하는 과정만 추가됩니다.라이브러리 설치는 생략하겠습니다. 데이터 확인 (Seaborn tips)범주형 데이터 인코딩 다중선형회귀 모델 훈련모델 평가 1. 데이터 확인사용할 tips 데이터를 다시 확인해줍니다. 해당 데이터에는 NaN 값이 없..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/dhcKGN/btsIZrTIucE/gtqA30z5uJ4MRBsW0vq1lk/img.png)
머신러닝이란? 관측된 패턴을 기반으로 의사 결정(예측, 분류)을 하기 위한 알고리즘 알고리즘이 문제풀이를 통해 해답을 찾아가는 과정이라면,머신러닝은 해답을 미리 학습시켜 스스로 문제풀이를 할 수 있게 설계하는 것 머신러닝 종류지도 학습 Supervised Leaning → 예측, 분류비지도 학습 Unsupervised Learning → 연관 규칙, 군집강화 학습 Reinforcement Learning → 보상 머신러닝 적용 분야머신러닝금융 신용평가, 사기탐지, 주식 예측 헬스케어 질병 예측, 환자 데이터 분석 이커머스 고객 구매 패턴 분석, 추천 시스템, 가격 최적화, 장바구니 분석 딥러닝 자연어처리 번역, 챗봇, 텍스트분석 이미지&영상처리 얼굴인식, 이미지 생성
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/KZXOS/btsIDmFqMFj/Fuyk67gCkxcOpivk97qcG0/img.jpg)
오늘 오랑이는 pandas를 활용한 데이터 전처리에 대해 배울 예정입니다. 1 Pandas vs ExcelWHAT Pandas란?→ Python에서 데이터를 조작하고 쉽게 분석할 수 있게 도와주는 라이브러리대용량 데이터 처리가 가능 : Pandas는 데이터를 메모리에 로드하고, 다양한 연산을 빠른 처리가 가능하며 대용량 데이터를 처리하는데 최적화되어 있습니다.데이터 조작 기능 : 데이터 정렬, 필터링, 집계, 결측값 처리 등 데이터를 쉽게 가공할 수 있음데이터 시각화 기능 제공 : Matplotlib, Seaborn , … , etc데이터를 구조화하여 분석할 수 있음 : DataFrame이라는 자료형을 제공하여 데이터를 표 형태로 나타내어 분석이 가능함WHY 멀쩡한 엑셀 놔두고 왜 Pandas를 쓰나요..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bFUYfL/btsIBWBiLzM/S8vm7sKytgab6JFfYemahK/img.png)
오늘 오랑이는 pandas를 활용한 데이터 전처리에 대해 배울 예정입니다. 데이터 전처리WHAT 데이터 전처리란? → 원하는 데이터를 보기 위한 모든 활동 = raw 데이터 정리 작업 하나의 요리를 만들기 위한 재료 손질 작업이라고 비유할 수 있습니다. WHY 데이터 전처리를 왜 해야 하나요? → 가공되지 않은 데이터에서 원하는 정보를 편하게 얻기 위해세상의 모든 데이터가 깔쌈하게 정리되어 있다면 정말 행복하겠지요? 하지만 실제 데이터가 저장된 형태는 재각각이기 때문에 거기서 원하는 정보를 얻어내려면 우선 정리가 필요합니다. HOW 데이터 전처리는 어떻게 하나요? → 데이터 전처리를 할 때 방향성을 갖고 해야 합니다. 무슨 목적을 위해 어떤 정보를 확인하고자 하는지, 그 결과를 토대로..