목록파이썬 (44)
오랑우탄의 반란

오늘 오랑이는 matplotlib을 활용한 데이터 시각화에 대해 배울 예정입니다. 그동안 데이터 전처리를 위해 사용하는 pandas의 개념을 익혔는데요, 이제 matplotlib으로 시각화를 해볼 예정입니다. 실제로 시각화에 들어가기 전에 간단하게 그래프 종류를 짚고 넘어갑시다. Matplotlib이란? → 파이썬의 시각화를 위한 라이브러리 중 하나로, 다양한 종류의 그래프를 생성하기 위한 도구를 제공합니다.주로 2D 그래픽을 생성하기 위해 사용되며, 여러 그래프 형식을 지원하고 원하는 형태로 스타일링 할 수 있습니다. matplotlib.pyplot 선형 그래프plot() 2차원 데이터를 시각화하기 위해 사용합니다. xlabel(), ylabel(), title()x축, y축, 제목 s..

오늘 오랑이는 matplotlib을 활용한 데이터 시각화에 대해 배울 예정입니다. 그동안 데이터 전처리를 위해 사용하는 pandas의 개념을 익혔는데요, matplotlib으로 시각화를 해보기 전에 데이터 시각화에 대해 간단하게 짚고 넘어가겠습니다. 데이터 시각화WHAT 데이터 시각화란? → 데이터 시각화란 말 그대로 정리된 데이터를 더 효과적으로 보기 위해 정보와 시각적인 요소를 패밍한 것입니다. 그래프, 지도, 시뮬레이션 등 그래픽 요소로 변환된 정보 모두 데이터 시각화의 예시입니다. WHY 데이터 시각화가 왜 필요하나요? → 복잡한 다량의 정보를 가장 직관적이고 효과적으로 전달하기 위한 수단이기 때문입니다. 텍스트에 비해 그래픽에 대한 정보 처리 속도가 가장 빠르며, 다량의 정보를 담으..

오늘 오랑이는 pandas를 활용한 데이터 전처리에 대해 배울 예정입니다. 지난 포스트에 이어 데이터 병합, 집계, 병렬을 알아보며 Pandas 기초 개념 설명을 마치겠습니다. 6 데이터 병합데이터 병합에는 concat, merge 두 가지 방법이 있습니다. 각각 SQL의 union, join 과 비슷한 쓰임새입니다.아래 데이터에 대해서 작업하겠습니다. concatconcat로 여러 테이블을 병합할 경우, 기본이 밑으로 이어붙여지는 형식입니다. (axis=0)이때 주의할 부분은 인덱스가 기존 테이블들의 인덱스 그대로 이어지지 않는 형태로 들어가기 때문에, 마지막에 .reset_index(drop=True) 를 꼭 붙여줘야 한다는 점입니다. drop=True 를 생략하면 합쳐진 개별 인덱스 칼럼이 남..

오늘 오랑이는 pandas를 활용한 데이터 전처리에 대해 배울 예정입니다. 지난 포스트에 이어 데이터 확인 및 선택과 불리언 인덱싱을 알아보겠습니다. 4 데이터 확인 및 선택데이터 확인.head(n) / .tail(n)dataframe 을 위에서부터, 밑에서부터 출력해주는 함수로, 데이터셋을 불러올 때 제대로 들어있는지 간단하게 확인하는 용도입니다. .info()각 칼럼에 대한 null 여부과 그 개수, 타입을 알려주는 함수입니다. .describe()숫자 데이터에 대한 간단한 통계를 반환하는 함수입니다. .dtype 특정 칼럼의 타입을 조회할 수 있습니다. .dtypes모든 칼럼에 대한 타입을 조회할 수 있습니다. .astype()특정 칼럼의 타입을 바꿀 때 사용합니다. 아래 데이터로..

오늘 오랑이는 pandas를 활용한 데이터 전처리에 대해 배울 예정입니다. 지난 포스트에 이어 Pandas 의 기초 개념 몇 가지를 알아보겠습니다. Seaborn 라이브러리의 내장데이터셋을 통해 학습하도록 하겠습니다. iris 데이터셋: 붓꽃의 꽃잎과 꽃받침의 길이와 너비를 포함한 데이터셋입니다.tips 데이터셋: 음식점에서의 팁과 관련된 정보를 담고 있는 데이터셋입니다.titanic 데이터셋: 타이타닉 호 승객들의 정보를 포함한 데이터셋입니다.flights 데이터셋: 연도별 항공편 정보를 담고 있는 데이터셋입니다.planets 데이터셋: 외계 행성 발견에 대한 정보를 담고 있는 데이터셋입니다. 1 데이터셋 불러오기 및 저장하기불러오기seaborn 라이브러리를 import 해 tips 데이터셋을 불..

오늘 오랑이는 pandas를 활용한 데이터 전처리에 대해 배울 예정입니다. 데이터 전처리WHAT 데이터 전처리란? → 원하는 데이터를 보기 위한 모든 활동 = raw 데이터 정리 작업 하나의 요리를 만들기 위한 재료 손질 작업이라고 비유할 수 있습니다. WHY 데이터 전처리를 왜 해야 하나요? → 가공되지 않은 데이터에서 원하는 정보를 편하게 얻기 위해세상의 모든 데이터가 깔쌈하게 정리되어 있다면 정말 행복하겠지요? 하지만 실제 데이터가 저장된 형태는 재각각이기 때문에 거기서 원하는 정보를 얻어내려면 우선 정리가 필요합니다. HOW 데이터 전처리는 어떻게 하나요? → 데이터 전처리를 할 때 방향성을 갖고 해야 합니다. 무슨 목적을 위해 어떤 정보를 확인하고자 하는지, 그 결과를 토대로..

오늘도 오랑이는 문제를 풉니다. 명예의 전당 (1) 풀이 과정우선 전당에 올라갈 값들을 따로 저장해둘 빈 리스트 temp 가 필요합니다. 이때 k 값과 무관하게 모든 score 값 i 는 temp에 저장되는 과정을 거치므로 for 문 안에 바로 넣어줍니다.문제 문맥상 temp 의 sort를 해야 하나 싶었지만 어차피 추출할 때 min 값으로 추출하면 돼서 굳이 정렬이 필요 없습니다. def solution(k, score): answer = [] temp = [] for i in score: temp.append(i) #조건 answer.append(min(temp)) return answer 이제 구체적인 조건에 대해 생각해봅시다.temp 의 길이가..

오늘도 오랑이는 문제를 풉니다. 콜라 문제풀이 과정뭐이리 길어..하는 문제지만 답변 코드는 굉장히 짧은 문제입니다.괜히 글도 길고 무슨 이미지도 있어서 복잡해보여도, n을 a로 나눈 값의 몫에 b를 곱해서 모두 더하는 간단한 풀이지요.이 과정을 반복해야 하기 때문에, 몫이 0이 되기 전까지 반복되도록 설정한 후, n도 매번 새로운 값으로 갱신되게 해야 합니다. 최종 코드def solution(a, b, n): answer = 0 while n//a != 0: answer += (n//a)*b n = (n//a)*b + n%a return answer 오랑우탄이 영어를 하고 오랑이가 코드마스터가 되는 그날까지~ 프로그래머스코드 중심의 개발자 채용. 스택 ..