pandas Categorical 데이터 Categorical 데이터 ● pandas의 Categorical ● Categorical 연산 ● categorical을 이용한 성능 개선 Categorical 메서드 ● 모델링을 위한 더미값 생성하기 Categorical 데이터 pandas의 Categorical형을 활용하여 pandas 메모리 사용량을 줄이고 성능을 개선할 수 있는 방법을 소개한다. 하나의 칼럼 내에 특정 값이 반복되어 존재하는 경우는 흔하다. 배열 내에서 유일한 값을 추출하거나 특정 값이 얼마나 많이 존재하는지 확인할 수 있는 unique와 value_counts같은 메서드가 있다. values = pd.Series(['apple','orange','apple','apple'] * 2) ..