들어가며
지난 글까지 인공 신경망과 학습 모델들에 대해서 알아보고 이를 사이킷런으로 구현해 보았습니다.
이번에는 google 의 tensorflow에서 지원하는 keras라이브러리를 사용해서 간편하게 신경망을 구현, 학습, 그리고 평가하는 방법에 대해서 알아보겠습니다.
목차
1. 텐서플로2 설치
2. Sequential API로 이미지 분류기 구현하기
1. 데이터 다운로드
2. Sequential Model 구축
3. 모델 알아보기
4. 모델 컴파일하기
5.모델 학습하기
6. 학습 시각화하기
7. 테스트 데이터로 평가하기
8. 예측하기
Tensorflow 2.0 설치하기
tensorflow 2.0을 설치하는 환경이 여러 가지가 있으므로 이는 tensorflow.org에 게재된 공식문서를 참조하는 것이 좋습니다.
https://www.tensorflow.org/install/pip?hl=ko
Seauential API로 이미지 분류기 만들기
1. 데이터 다운로드
이미지 분류기를 만들기 전에 분류할 이미지 데이터를 다운해봅시다.
여기서는 fashion_mnist 데이터를 사용합니다. keras 라이브러리를 통해서 쉽게 다운이 가능합니다.
from tensorflow import keras
fashion_mnist = keras.datasets.fashion_mnist
(X_train_full, y_train_full), (X_test, y_test) = fashion_mnist.load_data()
데이터를 간단히 살펴봅시다.
하나의 패션 샘플은 28x28의 배열로 이루어져있으며 하나의 픽셀은 0~255의 정수로 이루어져 있습니다.
이미 데이터는 어느정도 전처리가 진행되어있으니 바로 keras를 통해 모델을 구축해봅시다.
2. Sequential Model 구축
keras.models.Sequential은 케라스로 MLP를 구현하는 가장 기본적이고 쉬운 방법입니다.
Sequential 클래스를 선언하고 층을 순서대로 추가함으로써 MLP구현이 가능합니다.
model = keras.models.Sequential()
model.add(keras.layers.Flatten(input_shape=[28, 28]))
model.add(keras.layers.Dense(300, activation="relu"))
model.add(keras.layers.Dense(100, activation="relu"))
model.add(keras.layers.Dense(10, activation="softmax"))
Flatten은 입력데이터의 shape를 일렬로 변경하는 클래스입니다.(reshape(-1,1)과 동일합니다.) Flatten은 선언하면 뉴런층이 생성되는 것이 아니라 단순히 데이터의 형태를 변경합니다. InputLayer(input_shape=[28, 28])를 통해서 대체가 가능합니다.
Dense는 이전 뉴런과 완전연결된 밀집 뉴런층을 의미합니다. 이를 선언하고 모델에 추가함으로써 모델 내부에 새로운 뉴런층을 생성할 수 있으며 첫 번째 파라미터로 뉴런 수를 서정하고 activation 파라미터를 통해서 활성화 함수를 지정할 수 있습니다.
마지막 Dense는 softmax를 활성화 함수를 사용하고 있는데 이는 우리가 원하는 모델은 분류기이기 때문에 각 샘플의 타깃레이블에 대한 예측확률을 측정하기 위해서입니다.
3. 모델 알아보기
모델을 생성했으니 이를 분석해봅시다.
model.summary()
summary를 통해서 모델의 정보를 대략 알 수 있습니다.
hidden1 = model.layers[1]
hidden1.name #'dense'추출
weights, biases = hidden1.get_weights()
model에서 인덱스를 통해서 레이어를 추출하고 name을 통해서 이름을 알고 get_weight() 메서드를 통해서 weight와 bias를 알 수 있습니다. (set_weight()를 통해서 설정도 가능합니다.)
4. 모델 컴파일하기
keras모델은 층을 생성한 후 비용함수, 최적화방법을 설정하여 어떻게 학습을 진행할지 설정해주어야하는데 이를 컴파일이라고 합니다.
model.compile(loss="sparse_categorical_crossentropy",
optimizer="sgd",
metrics=["accuracy"])
분류기이기 때문에 CEE를 비용함수로 정하고 최적화 방법은 SGD를 사용하였습니다. 만약 SVM같은 다른 모델을 사용하고싶으면 loss="hinge"로 지정하는 등 다른 비용함수를 정하면 되며 최적화 방식은 optimizer를 설정하여 변경 할 수 있습니다.(AdaGrad 등이 있습니다.)
metrics를 통해서 학습을 진행할 때마다 출력할 평가방식을 지정할 수 있습니다.
5.모델 학습하기
history = model.fit(X_train, y_train, epochs=30,
validation_data=(X_valid, y_valid))
fit 메서드를 통해서 학습시킬수 있으며 이 때 훈련 샘플,레이블 에폭수 그리고 검증 샘플,레이블을 입력할 수 있습니다.
fit 메서드를 실행하면 위와 같이 학습을 진행하며 에폭이 끝날 때마다 훈련데이터와 검증데이터의 손실함수 그리고 metrics에서 지정한 평가점수를 출력합니다.
학습이 끝나면 fit 메서드는 학습과정의 데이터를 저장한 history 클래스를 리턴합니다.
6. 학습 시각화하기
fit 메서드에서 리턴받은 history를 통해서 쉽게 구현가능합니다.
import pandas as pd
pd.DataFrame(history.history).plot(figsize=(8, 5))
plt.grid(True)
plt.gca().set_ylim(0, 1)
save_fig("keras_learning_curves_plot")
plt.show()
7. 테스트 데이터로 평가하기
evalute()메서드를 통해서 평가 할 수있습니다.
model.evaluate(X_test, y_test)
'''
result :
10000/10000 [==============================] - 0s 21us/sample - loss: 0.3378 - accuracy: 0.8781
'''
8. 예측하기
predict()메서드를 통해서 새로운 샘플을 예측하고 클래스별 확률을 알 수 있습니다.
X_new = X_test[:3]
y_proba = model.predict(X_new)
y_proba.round(2)
'''
result:
array([[0. , 0. , 0. , 0. , 0. , 0. , 0. , 0.01, 0. , 0.99],
[0. , 0. , 0.99, 0. , 0.01, 0. , 0. , 0. , 0. , 0. ],
[0. , 1. , 0. , 0. , 0. , 0. , 0. , 0. , 0. , 0. ]],
dtype=float32)
'''
predict_calsses()메서드를 통해서 예측 클래스만 출력할 수 있습니다.
y_pred = model.predict_classes(X_new)
y_pred
'''
result:
array([9, 2, 1])
'''
'Machine Learning > Keras' 카테고리의 다른 글
인공 신경망 with Keras - 3. 함수형 API로 복잡한 모델 만들기 (0) | 2020.12.21 |
---|---|
인공 신경망 with Keras -2. 케라스로 Regression MLP(회귀 다층퍼셉트론) 구현하기 (0) | 2020.05.02 |