Machine Learning
-
특성교차Machine Learning/기본개념 2023. 5. 22. 02:13
이런식으로 데이터가 분류될 때 우리는 특성교차를 사용한다. 특성 교차는 두개 이상의 입력 특성을 곱하여 특성 공간에서 비선형성을 인코딩하는 합성 특성이다. x3 = x1*x2로 생각해볼 수 있다. 특성 교차의 종류 [A X B]: 두 특성의 값을 곱하여 구성되는 특성 교차 [A x B x C x D x E]: 특성 5개의 값을 곱하여 구성되는 특성 교차 [A x A]: 단일 특성을 제곱하여 구성되는 특성 교차 원 핫 인코딩 값이 문자열로 되어있어서 특성 벡터로 사용할 수 없을 때 문자열마다 고유계수를 가지는 원-핫 인코딩을 통해 특성벡터로 변환할 수 있다. 특성 특성은 분명하고 명확한 의미를 가져야한다. 그러므로 우리는 데이터를 파악하는 것을 우선 해야한다. 데이터를 파악하는 방법은 세 가지가 있다. -..
-
모델 학습 및 검증에 관하여Machine Learning/기본개념 2023. 5. 20. 02:32
우리는 앞서 선형회귀 모델과 학습에 관해서 이야기를 나눴는데 한정된 데이터세트 내에서 반복된 학습과 테스트를 하다보면 해당 데이터에 최적화된 모델을 얻을 수 있다. 이게 무슨 말이냐하면 우리가 가진 데이터세트에만 최적화된 모델이라는 뜻이다. 만약 새로운 데이터가 들어왔을 때 우리는 해당 모델이 올바르게 작동하는지 알 수 없다. 이를 과적합이라고 표현한다. 그럼 이 문제를 어떻게 해결할 수 있을까? 우리가 가진 데이터 세트를 좀 더 세분화하는 방법이 있다. 이전에는 학습데이터와 테스트 데이터 두 분류로 나누었다면 학습 데이터, 테스트 데이터, 검증 데이터 이렇게 세 분류로 나누는 것이다. 그럼 우린 한 단계를 더 거치면서(검증) 새로운 데이터에 대한 올바른 결과값을 낼 수 있는 모델을 얻을 수 있을거라 예..
-
TensorFlow keras를 이용한 선형회귀Machine Learning/기본개념 2023. 5. 19. 02:56
제목처럼 tf.keras를 사용해서 선형회귀를 간단하게 익혀보자 import pandas as pd import tensorflow as tf from matplotlib import pyplot as plt 여기서 사용할 tensorflow와 pandas, pyplot을 불러오자 pyplot은 데이터 시각화에 유용한 툴이다. 우리가 가진 데이터값을 도표나 그래프를 이용해 효과적으로 나타내준다. 이제 우리는 모델을 빌드하고 학습을 시키는게 이 과정의 핵심이다. #모델 구축 def build_model(my_learning_rate): #대부분 tf.keras는 순차적으로 시행되며 여기에 하나 이상의 레이어가 포함됩니다. model = tf.keras.models.Sequential() #여기서 dense..
-
Numpy 기본 개념 익히기Machine Learning/기본개념 2023. 5. 19. 01:50
Numpy는 배열표현 및 선형 대수연산 단순화를 지원한다 구글 코랩 설명에는 아래와 같이 나와있다. Numpy는 ML 알고리즘이 사용하는 주요 데이터 구조인 매트릭스를 만들고 조작하기 위한 Python 라이브러리입니다. 행렬은 행과 열에 값을 저장하는 데 사용되는 수학적 개체입니다. 그러므로 TansorFlow를 조작하기 위해 꼭 필요한 라이브러리다. import numpy as np 파이썬에서 위와 같은 구문으로 라이브러리를 import할 수 있고 사용할 땐 np로 사용하면 된다. one_dimensional_array = np.array([1.2, 2.4, 3.5, 4.7, 6.1, 7.2, 8.3, 9.5]) print(one_dimensional_array) [1.2 2.4 3.5 4.7 6.1 ..