데이터 분석

데이터 분석을 통한 세상 엿보기

시계열 5

횡단면, 종단면, 시계열자료

https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=her7845&logNo=220878719799 004. 통계용어 Ⅲ (횡단면과 시계열자료) 통계용어 통계용어 세 번째 시간입니다. 횡단면 데이터와 시계열(종단면) 데이터, 패널데이터 등을 소개하... blog.naver.com https://m.blog.naver.com/townlab/222019654110 계량경제에서 사용되는 자료 형태(횡단면, 시계열, 패널)-경영, 경제, 사회과학에서 사용되는 자 이번에는 경제분석에 있어서 사용되는 자료에 대해서 살펴보겠다. 자료 형태는 크게 3가지로 나눌수 있는데... blog.naver.com http://triki.net/study/334..

시계열 2022.12.10

시계열time series (4)

시계열time series (4) 이동창 함수 ● 지수 가중 함수 ● 이진 이동창 함수 ● 사용자 정의 이동창 함수 시계열 연산에서 사용되는 배열 변형에서 중요한 요소는 움직이는 창 또는 지수 가중과 함께 수행되는 통계와 여타 함수들이다. 이런 함수를 이용해서 누락된 데이터로 인해 매끄럽지 않은 시계열 데이터를 매끄럽게 다듬을 수 있다. 지수 가중 이동평균처럼 고정 크기의 창을 가지지 않는 함수도 포함해서 이동창 함수 moving window function 라고 부른다. 다른 통계함수와 마찬가지로 이동참 함수도 누락된 데이터를 자동으로 배제한다. 우선 시계열 데이터를 불러와서 영업일 빈도로 리샘플링하자. close_px_all = pd.read_csv('examples/stock_px_2.csv', p..

시계열 2022.08.05

시계열time series (3)

시계열time series (3) 시간대 다루기 ● 시간대 지역화와 변환 ● 시간대를 고려해서 Timestamp 객체 다루기 ● 다른 시간대 간의 연산 기간과 기간 연산 ● Period의 빈도 변환 ● 타임스탬프와 기간 서로 변환하기 ● 배열로 PeriodIndex 생성하기 리샘플링과 빈도 변환 ● 다운샘플링 ● 업샘플링과 보간 ● 기간 리샘플링 시간대 다루기 시계열을 다루는 많은 사용자는 현재 국제표준이며 그리니치 표준시를 계승하는 국제표준시 coordinated universal time, UTC 를 선택한다. 시간대는 UTC로부터 떨어지 오프셋으로 표현되는데 예를 들면 뉴욕은 일광절약시간 daylight saving time, DST 일때 UTC보다 4시간 늦으며 아닐 때는 5시간 늦다. 파이썬에서..

시계열 2022.08.04

시계열time series (2)

시계열time series (2) 시계열기초 ● 색인, 선택, 부분 선택 ● 중복된 색인을 갖는 시계열 ● 날짜 범위, 빈도, 이동 날짜 범위, 빈도, 이동 ● 날짜 범위 생성하기 ● 빈도와 날짜 오프셋 ● 데이터 시프트 pandas 에서 찾아볼 수 있는 가장 기본적인 시계열 객체의 종류는 파이썬 문자열이나 datetime객체로 표현되는 타임스탬프로 색인된 Seriese다. from datetime import datetime dates =[datetime(2011, 1, 2), datetime(2011, 1, 5), datetime(2011, 1, 7), datetime(2011, 1, 8), datetime(2011, 1, 10), datetime(2011, 1, 12)] ts = pd.Series(..

시계열 2022.07.29

시계열time series (1)

시계열time series (1) 시계열 데이터는 금융, 경제, 생태학, 신경과학, 물리학 등 여러 다양한 분야에서 사용되는 매우 중요한 구조화된 데이터다. 시간상의 여러 지점을 관측하거나 측정할 수 있는 모든 것이 시계열이다. 대부분의 시계열은 고정 빈도 fixed frequency로 표현되는데 데이터가 존재하는 지점이 15초마다, 5분마다, 한 달에 한 번 같은 특정 규칙에 따라 고정 간격을 가지게 된다. 시계열은 또한 고정된 단위나 시간 혹은 단위들 간의 간격으로 존재하지 않고 불규칙적인 모습으로 표현될 수도 있다. 어떻게 시계열 데이터를 표시하고 참조할지는 애플리케에 의존적이며 다음중 한 유형일 수 있다. ● 시간 내에서 특정 순간의 타임스탬프 ● 2007년 1월이나 2010년 전체 같은 고정된 ..

시계열 2022.07.28