목록프로그래밍 (2)
오랑우탄의 반란

오늘 오랑이는 pandas를 활용한 데이터 전처리에 대해 배울 예정입니다. 1 Pandas vs ExcelWHAT Pandas란?→ Python에서 데이터를 조작하고 쉽게 분석할 수 있게 도와주는 라이브러리대용량 데이터 처리가 가능 : Pandas는 데이터를 메모리에 로드하고, 다양한 연산을 빠른 처리가 가능하며 대용량 데이터를 처리하는데 최적화되어 있습니다.데이터 조작 기능 : 데이터 정렬, 필터링, 집계, 결측값 처리 등 데이터를 쉽게 가공할 수 있음데이터 시각화 기능 제공 : Matplotlib, Seaborn , … , etc데이터를 구조화하여 분석할 수 있음 : DataFrame이라는 자료형을 제공하여 데이터를 표 형태로 나타내어 분석이 가능함WHY 멀쩡한 엑셀 놔두고 왜 Pandas를 쓰나요..

오늘 오랑이는 pandas를 활용한 데이터 전처리에 대해 배울 예정입니다. 데이터 전처리WHAT 데이터 전처리란? → 원하는 데이터를 보기 위한 모든 활동 = raw 데이터 정리 작업 하나의 요리를 만들기 위한 재료 손질 작업이라고 비유할 수 있습니다. WHY 데이터 전처리를 왜 해야 하나요? → 가공되지 않은 데이터에서 원하는 정보를 편하게 얻기 위해세상의 모든 데이터가 깔쌈하게 정리되어 있다면 정말 행복하겠지요? 하지만 실제 데이터가 저장된 형태는 재각각이기 때문에 거기서 원하는 정보를 얻어내려면 우선 정리가 필요합니다. HOW 데이터 전처리는 어떻게 하나요? → 데이터 전처리를 할 때 방향성을 갖고 해야 합니다. 무슨 목적을 위해 어떤 정보를 확인하고자 하는지, 그 결과를 토대로..