Project/ML-파이썬 주식 종목 예측
-
머신러닝 모델 완성 및 실험결과Project/ML-파이썬 주식 종목 예측 2023. 6. 10. 16:17
naver_news_title함수를 수정했다. 기존에 작성했던 코드에 naver_news_title은 result_list라는 전역변수에 data를 수정하는 형식이였는데 전역 데이터를 직접 수정하는 것은 좋은 코드가 아니다. 그래서 함수 내 지역변수를 선언하고 해당 배열을 return하는 형식으로 함수를 수정해줬다. using에 해당하는 함수도 전 글에서 말했던 로직을 추가해줬다. 상승이나 하락에 해당하는 비중이 0.65이상 0.45 이하이면 더 큰 쪽을 return하고 그게 아니라면 정확도가 높은 것을 출력하게끔 했다. 상승과 하락이라는 text보다 bool형식으로 상승을 예측하면 True, 아니면 False를 return하게 했다. 이렇게 해야 api로 전달받았을 때 편하기 때문에 이렇게 해줬다. 새..
-
머신러닝 모델 수정Project/ML-파이썬 주식 종목 예측 2023. 6. 9. 14:37
저번에 글을 보면 아시겠지만 요 모델이란놈이 100이면 100하락을 예측하길래 학습 데이터를 늘려보고 이런 저런 시도를 해봤지만 원인은 다른 곳에 있었다. def using(): # 객체를 복원, 저장된 모델 불러오기 with open('pipe.dat','rb') as fp: # 읽기 pipe = pickle.load(fp) while True : text = input('뉴스 타이틀을 입력해주세요 : ') str = [text] # 예측 정확도 r1 = np.max(pipe.predict_proba(str)*100) # 확률값을 구해서 *100 # 예측 결과 r2 = pipe.predict(str)[0] # 긍정('1'), 부정('0') if r2 == 1: #
-
머신러닝 모델 만들기 및 테스트Project/ML-파이썬 주식 종목 예측 2023. 6. 9. 11:11
# import scipy as sp import pandas as pd import numpy as np #konlpy : 형태소 분석기 from konlpy.tag import Kkma from konlpy.tag import Hannanum from konlpy.tag import Okt from konlpy.tag import * import nltk import pickle from wordcloud import WordCloud, STOPWORDS from PIL import Image #머신러닝에 필요한 라이브러리 from sklearn.feature_extraction.text import CountVectorizer from sklearn.feature_extraction.text imp..
-
네이버 뉴스 제목 크롤링하기Project/ML-파이썬 주식 종목 예측 2023. 6. 8. 12:35
import requests from bs4 import BeautifulSoup from urllib import parse price_data = pd.read_csv('samsung_주가데이터.csv') df_0 = price_data[price_data['price']==0]['Date'] date_0 = [] for i in range(0,len(df_0)): date_0.append(str(df_0.tolist()[i])[:10].replace('-','.')) df_1 = price_data[price_data['price']==1]['Date'] date_1 = [] for i in range(0,len(df_1)): date_1.append(str(df_1.tolist()[i])[:10]..