인공지능 학습
오늘은 주식 시장에 관한 데이터 분석강의이다
한국의 대표적인 대기업 삼성의 증권 데이터를 2016~현재까지의 데이터를 가져 올 수 있다.
시가, 고가, 저가, 종가, 거래량, 전일대비 등락률 (속성) 값들을 가져오며
국내장 뿐만 아니라 해외장까지 가져올 수 있다.
위는 미국 증시에 상장된 테슬라 데이터이다.
이 중 시가 가격으로 딥러닝 과정을 밟아 볼 생각이다.
2016년부터 현재까지의 데이터라 1200여개의 수많은 데이터들이 주가의 성장에따라 폭 넓게 다른 가격으로 형성 되기 때문에 이 방대한 데이터를 정규화 과정을 거쳐 축소 시킬 필요가 있다.
위 코드가 정규화 작업이다.
그 방대한 데이터를 0과 1 사이 값으로 축소 시키는 것이다.
이제 훈련 데이터와 테스트 데이터로 일정 부분으로 나눠 줄 것이다.
테스트 데이터 200개로 설정해주고 그외 데이터들을 모두 훈련데이터로 할당한다.
def 함수로 이용하여 tensor3 형태로 변환해준다.
RNN,LSTM 은 학습을 위해서는 해당 타입으로 변환해줘야한다.
훈련 데이터 들을 확인해본다.
위 까지가 삼성 주식의 시가를 기준으로 학습을 구현한 모델이고 해당 코드를 기반으로 한 예측모델 출력 그래프를 확인해보자
이것이 현재까지의 추세와 예측 선이 표현된 그래프인데 정말 신기한점은
최근 미국 경제 불황 심리가 작용하여 매우 큰 낙폭이 실제 이루어졌지만 학습 모델의 예측선은 이러한 큰 낙차를 따라잡지 못한 모습을 보인다.
주식에 흥미가 매우 있으니 이러한 부분들은 꼭 완벽히 습득하고픈 학습 대목이였다.