그래프와 시각화
pandas로 그리는 그래프 종류들
nova-unum
2022. 7. 28. 13:27
pandas로 그리는 그래프 종류들
pandas로 그릴수 있는 그래프 종류에 대해서 알아보겠습니다.
히스토그램, 산점도, 원 그래프(파이차트), 상자그림이 데이터분석시 많이 사용하는 대표 그래프들입니다.
히스토그램
히스토그램은 사용자가 원하는 범주에 따라 해당 범주의 빈도를 막대로 표현함으로써 빈도의 수준과 상대적 크기의 차이를 시각적으로 판단하기에 매우 용이합니다. 히스토그램은 수치형 척도로 측정된 변수의 분포를 파악하고자 하는 모든 경영 이슈에서 활용될수 있습니다.
plt.hist(df.서비스_만족도, bins=7, alpha=0.4, rwidth=1, color='red', label='서비스만족도' )
plt.legend()
plt.grid()
plt.xlabel('서비스 만족도')
plt.ylabel('빈도')
plt.xticks(fontsize=14)
plt.yticks(fontsize=14)
plt.show()
산점도
산점도란 두 개의 데이터를 직교 좌표계를 이용하여 두 변수들 간의 관계를 좌표평면 상의 점으로 나타내는 방법입니다.
df.plot.scatter(x ='방문빈도', y='총_매출액', grid=True, title='방문빈도와 총 매출액간 관계')
파이차트
원 그래프라고 불리는 파이차트는 명목형 척도로 측정된 변수의 각 항목에 대한 비율을 하나의 원내에서 파이 조각처럼 분리하여 표현한 그래프입니다.
groupby_구매유형 = df.groupby('구매유형')
groupby_구매유형.describe()
labels =['1','2','3','4']
sizes =[43, 317, 144, 496]
colors=['yellowgreen','gold','lightskyblue','lightcoral']
explode = (0, 0.1, 0, 0)
plt.pie(sizes, explode=explode, labels=labels, colors=colors, autopct='%1.1f%%', shadow=True, startangle=90)
plt.axis('equal')
plt.title("구매유형에 따른 고객 분류")
plt.show()
상자그림
상자그림은 상자수염도라고 불리는 자료 요약의 대표적인 방법으로서 수치형 변수의 분포적 특성을 비교적 자세히 나타내는 시각적인 분석도구입니다. 상자그림은 수치형 척도로 측정된 변수의 분포와 사분위 수를 파악할수 있습니다.