Machine Learning
[TS] 시계열 데이터 정리와 기본 개념
[TS] 시계열 데이터 정리와 기본 개념
2021.07.29이 글은 책 '실전 시계열 분석'을 재구성하여 작성되었습니다. 책링크 실전 시계열 분석 실전 시계열 분석: 통계와 머신러닝을 활용한 예측 기법시계열 분석의 모든 것실제 환경에 특화된 시계열 데이터 분석 및 모범 사례를 다루는 실무 지침서다. ARIMA 및 베이즈 상태 공간 같은 표 books.google.co.jp Data Handling 1. Missing value 시계열만이 아닌 대부분의 빅데이터에는 결측치가 존재하는 경우가 많습니다. 다양한 이유에서 값이 누락되는 경우가 발생하는 것이죠. 간단한 이유로는 금융사는 고객의 개인정보를 암호화하여 일정한 형태로 저장하는 경우도 있지만 공개되는 데이터에는 값을 제외하는 경우도 많습니다. 이런 다양한 이유로 데이터에 결측치가 발생하는 것이죠. 결측치를 제거..
[TS] 시계열의 역사와 시계열 데이터 수집
[TS] 시계열의 역사와 시계열 데이터 수집
2021.07.16이 글은 책 '실전 시계열 분석'의 내용을 참고하여 작성되었습니다. 책링크 실전 시계열 분석 실전 시계열 분석: 통계와 머신러닝을 활용한 예측 기법시계열 분석의 모든 것실제 환경에 특화된 시계열 데이터 분석 및 모범 사례를 다루는 실무 지침서다. ARIMA 및 베이즈 상태 공간 같은 표 books.google.co.jp 시계열의 역사 시계열 데이터는 시간의 흐름을 기준으로 기록된 데이터입니다. 머신러닝에서 사용되는 많은 데이터는 시계열적인 요소를 갖고 있는 것보다 데이터 하나하나가 특징점을 갖고 있는 경우가 많습니다. 간단하게는 다층 퍼셉트론을 활용한 XOR classifier에서 MNIST classifer에 자주 쓰이는 CNN등이 있죠. 이런 데이터들은 시간의 영향을 받는 데이터들이 아닙니다. 데이터..