데이터 분석

데이터 분석을 통한 세상 엿보기

파이썬 3

데이터 집계와 그룹 연산(1)

데이터 집계와 그룹 연산(1) 데이터셋을 분류하고 각 그룹에 집계나 변형 같은 함수를 적용하는 건 데이터 분석 과정에서 무척 중요한 일이다. 데이터를 불러오고 취합해서 하나의 데이터 집합을 준비하고 나면 그룹 통계를 구하거나 가능하다면 피벗데이블을 구해서 보고서를 만들거나 시각화하게 된다 파이썬과 pandas의 강력한 표현력을 잘 이용하면 아주 복잡한 그룹 연산도 pandas 객체나 NumPy 배열을 받는 함수의 조합으로 해결할 수 있다. . 하나 이상의 키(함수, 배열, DataFrame의 컬럼 이름)을 이용해서 pandas 객체를 여러 조각으로 나누는 방법 . 합계, 평균, 표준편차, 사용자 정의 함수 같은 그룹 요약 통계를 계산하는 방법 . 정규화, 선형회귀, 등급 또는 부분집합 선택 같은 집단 내..

Python 2022.07.22

pandas에서 seaborn으로 그래프 그리기

pandas에서 seaborn으로 그래프 그리기 pandas는 Series와 DataFrame 객체를 간단하게 시각화할 수 있는 내장 메서드를 제공한다. 다른 라이브러리로는 마이클 와스콤 Michael Waskom이 만든 통계 그래픽 라이브러리인 seaborn이 있다. seaborn은 흔히 사용하는 다양한 시각화 패턴을 쉽게 구현할 수 있도록 도와준다. seaborn 라이브러리를 임포트하면 더 나은 가독성과 미려함을 위해 matplotlib의 기본 컬럼 스킴과 플롯 스타일을 변경한다. https://seaborn.pydata.org/examples/index.html Example gallery — seaborn 0.11.2 documentation seaborn.pydata.org https://sea..