from IPython.core.display import display, HTML
display(HTML("<style>.container {width:90% !important;}</style>"))


from google.colab import drive
drive.mount('/content/drive')

import matplotlib.pyplot as plt
import numpy as np
import os

%load_ext autoreload
%autoreload 2

os.chdir('drive/MyDrive/DL2024_201810776/week10')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


import tensorflow as tf
from tensorflow.keras.models import Sequential, Model
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout, Layer, AveragePooling2D, Input, BatchNormalization, ReLU,  Add, GlobalAveragePooling2D
from tensorflow.keras.datasets import mnist
from tensorflow.keras.utils import to_categorical


# 데이터 로드 및 전처리
(x_train, y_train), (x_test, y_test) = mnist.load_data()

print(x_train.shape)

# 28x28 사이즈의 이미지 -> Train/Test Set으로 분리
x_train = x_train.reshape(-1, 28, 28, 1).astype('float32') / 255 # 0~255 정규화
x_test = x_test.reshape(-1, 28, 28, 1).astype('float32') / 255
y_train = to_categorical(y_train, 10)
y_test = to_categorical(y_test, 10)

(60000, 28, 28)


plt.imshow(x_test[0], cmap='gray')
plt.show()


y_test[0]

array([0., 0., 0., 0., 0., 0., 0., 1., 0., 0.], dtype=float32)


# 모델 생성
model = Sequential([

    # C1 : Convolution Layer
    # Input : 28X28 * 1
    # 커널 사이즈 : 5X5 * 6
    # Output : 28X28 * 6
    Conv2D(6, kernel_size=(5, 5), strides=(1,1), activation='relu', input_shape=(28, 28, 1), padding='same'),

    # S1 : Subsampling (Pooling)
    # Input : 28X28 * 6
    # Output : 14X14 * 6
    AveragePooling2D(pool_size=(2,2), strides=(2,2)),

    # C2 : Convolution Layer
    # Input : 14X14 * 6
    # 커널 사이즈 : 5X5 * 16
    # Output : 10X10 * 16
    Conv2D(16, kernel_size=(5, 5), strides=(1,1), activation='relu', padding='valid'),

    # S2 : Subsampling (Pooling)
    # Input : 10X10 * 16
    # Output : 5X5 * 16
    AveragePooling2D(pool_size=(2,2), strides=(2,2)),


    # C3 : Convolution Layer
    # Input : 5X5 * 16
    # 커널 사이즈 : 5X5 * 120
    # Output : 1X1 * 120
    Conv2D(120, kernel_size=(5, 5), strides=(1,1), activation='relu', padding='valid'),
    Flatten(), # 합성곱(Convolution)과 풀링(Pooling) 레이어를 거친 후에 나오는 다차원의 특징 맵을 1차원으로 변환(Flatten)하여 Fully Connected Layer에 연결

    # F1 : Fully Connected Layer
    # Input : 1X1 * 120
    # Output : 1X1 * 84
    Dense(84, activation='relu'),

    # F2 : Fully Connected Layer
    # Input : 1X1 * 84
    # Output : 1X1 * 10
    Dense(10, activation='softmax') #10개의 카테고리(숫자 0~9)에 대한 뉴런으로 현재 이미지가 각각의 숫자일 확률이 출력으로 나온다.

])


model.summary()

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
=================================================================
 conv2d_3 (Conv2D)           (None, 28, 28, 6)         156       
                                                                 
 average_pooling2d_2 (Avera  (None, 14, 14, 6)         0         
 gePooling2D)                                                    
                                                                 
 conv2d_4 (Conv2D)           (None, 10, 10, 16)        2416      
                                                                 
 average_pooling2d_3 (Avera  (None, 5, 5, 16)          0         
 gePooling2D)                                                    
                                                                 
 conv2d_5 (Conv2D)           (None, 1, 1, 120)         48120     
                                                                 
 flatten_1 (Flatten)         (None, 120)               0         
                                                                 
 dense_2 (Dense)             (None, 84)                10164     
                                                                 
 dense_3 (Dense)             (None, 10)                850       
                                                                 
=================================================================
Total params: 61706 (241.04 KB)
Trainable params: 61706 (241.04 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


# 학습
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
model.fit(x_train, y_train, epochs=50, batch_size=128, validation_split=0.1)

Epoch 1/50
422/422 [==============================] - 4s 5ms/step - loss: 0.1007 - accuracy: 0.9681 - val_loss: 0.0830 - val_accuracy: 0.9747
Epoch 2/50
422/422 [==============================] - 3s 6ms/step - loss: 0.0694 - accuracy: 0.9788 - val_loss: 0.0558 - val_accuracy: 0.9848
Epoch 3/50
422/422 [==============================] - 3s 7ms/step - loss: 0.0567 - accuracy: 0.9820 - val_loss: 0.0549 - val_accuracy: 0.9835
Epoch 4/50
422/422 [==============================] - 3s 7ms/step - loss: 0.0477 - accuracy: 0.9848 - val_loss: 0.0545 - val_accuracy: 0.9845
Epoch 5/50
422/422 [==============================] - 3s 7ms/step - loss: 0.0403 - accuracy: 0.9869 - val_loss: 0.0441 - val_accuracy: 0.9892
Epoch 6/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0348 - accuracy: 0.9887 - val_loss: 0.0501 - val_accuracy: 0.9875
Epoch 7/50
422/422 [==============================] - 3s 6ms/step - loss: 0.0301 - accuracy: 0.9901 - val_loss: 0.0485 - val_accuracy: 0.9853
Epoch 8/50
422/422 [==============================] - 3s 7ms/step - loss: 0.0273 - accuracy: 0.9915 - val_loss: 0.0422 - val_accuracy: 0.9893
Epoch 9/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0231 - accuracy: 0.9922 - val_loss: 0.0497 - val_accuracy: 0.9865
Epoch 10/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0214 - accuracy: 0.9927 - val_loss: 0.0411 - val_accuracy: 0.9883
Epoch 11/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0190 - accuracy: 0.9941 - val_loss: 0.0424 - val_accuracy: 0.9905
Epoch 12/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0172 - accuracy: 0.9945 - val_loss: 0.0462 - val_accuracy: 0.9877
Epoch 13/50
422/422 [==============================] - 2s 6ms/step - loss: 0.0156 - accuracy: 0.9950 - val_loss: 0.0449 - val_accuracy: 0.9897
Epoch 14/50
422/422 [==============================] - 3s 7ms/step - loss: 0.0137 - accuracy: 0.9954 - val_loss: 0.0445 - val_accuracy: 0.9895
Epoch 15/50
422/422 [==============================] - 2s 6ms/step - loss: 0.0142 - accuracy: 0.9953 - val_loss: 0.0387 - val_accuracy: 0.9897
Epoch 16/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0121 - accuracy: 0.9957 - val_loss: 0.0450 - val_accuracy: 0.9893
Epoch 17/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0121 - accuracy: 0.9960 - val_loss: 0.0440 - val_accuracy: 0.9880
Epoch 18/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0095 - accuracy: 0.9969 - val_loss: 0.0430 - val_accuracy: 0.9903
Epoch 19/50
422/422 [==============================] - 3s 6ms/step - loss: 0.0081 - accuracy: 0.9973 - val_loss: 0.0519 - val_accuracy: 0.9893
Epoch 20/50
422/422 [==============================] - 3s 7ms/step - loss: 0.0109 - accuracy: 0.9961 - val_loss: 0.0519 - val_accuracy: 0.9877
Epoch 21/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0087 - accuracy: 0.9970 - val_loss: 0.0387 - val_accuracy: 0.9907
Epoch 22/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0059 - accuracy: 0.9981 - val_loss: 0.0602 - val_accuracy: 0.9872
Epoch 23/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0104 - accuracy: 0.9964 - val_loss: 0.0489 - val_accuracy: 0.9897
Epoch 24/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0072 - accuracy: 0.9977 - val_loss: 0.0537 - val_accuracy: 0.9883
Epoch 25/50
422/422 [==============================] - 2s 6ms/step - loss: 0.0045 - accuracy: 0.9986 - val_loss: 0.0516 - val_accuracy: 0.9898
Epoch 26/50
422/422 [==============================] - 3s 7ms/step - loss: 0.0069 - accuracy: 0.9975 - val_loss: 0.0539 - val_accuracy: 0.9883
Epoch 27/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0060 - accuracy: 0.9979 - val_loss: 0.0527 - val_accuracy: 0.9880
Epoch 28/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0070 - accuracy: 0.9977 - val_loss: 0.0497 - val_accuracy: 0.9900
Epoch 29/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0064 - accuracy: 0.9978 - val_loss: 0.0565 - val_accuracy: 0.9882
Epoch 30/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0042 - accuracy: 0.9985 - val_loss: 0.0580 - val_accuracy: 0.9892
Epoch 31/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0053 - accuracy: 0.9981 - val_loss: 0.0462 - val_accuracy: 0.9907
Epoch 32/50
422/422 [==============================] - 3s 7ms/step - loss: 0.0036 - accuracy: 0.9989 - val_loss: 0.0517 - val_accuracy: 0.9900
Epoch 33/50
422/422 [==============================] - 3s 8ms/step - loss: 0.0044 - accuracy: 0.9986 - val_loss: 0.0692 - val_accuracy: 0.9875
Epoch 34/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0065 - accuracy: 0.9978 - val_loss: 0.0543 - val_accuracy: 0.9905
Epoch 35/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0044 - accuracy: 0.9985 - val_loss: 0.0552 - val_accuracy: 0.9898
Epoch 36/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0049 - accuracy: 0.9983 - val_loss: 0.0449 - val_accuracy: 0.9907
Epoch 37/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0032 - accuracy: 0.9991 - val_loss: 0.0555 - val_accuracy: 0.9897
Epoch 38/50
422/422 [==============================] - 3s 7ms/step - loss: 0.0027 - accuracy: 0.9990 - val_loss: 0.0512 - val_accuracy: 0.9917
Epoch 39/50
422/422 [==============================] - 2s 6ms/step - loss: 0.0042 - accuracy: 0.9987 - val_loss: 0.0580 - val_accuracy: 0.9893
Epoch 40/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0033 - accuracy: 0.9989 - val_loss: 0.0473 - val_accuracy: 0.9920
Epoch 41/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0040 - accuracy: 0.9986 - val_loss: 0.0646 - val_accuracy: 0.9888
Epoch 42/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0061 - accuracy: 0.9981 - val_loss: 0.0518 - val_accuracy: 0.9908
Epoch 43/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0032 - accuracy: 0.9989 - val_loss: 0.0534 - val_accuracy: 0.9907
Epoch 44/50
422/422 [==============================] - 3s 6ms/step - loss: 0.0012 - accuracy: 0.9996 - val_loss: 0.0518 - val_accuracy: 0.9915
Epoch 45/50
422/422 [==============================] - 3s 6ms/step - loss: 0.0011 - accuracy: 0.9997 - val_loss: 0.0564 - val_accuracy: 0.9902
Epoch 46/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0061 - accuracy: 0.9982 - val_loss: 0.0685 - val_accuracy: 0.9883
Epoch 47/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0036 - accuracy: 0.9989 - val_loss: 0.0663 - val_accuracy: 0.9908
Epoch 48/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0020 - accuracy: 0.9994 - val_loss: 0.0572 - val_accuracy: 0.9910
Epoch 49/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0043 - accuracy: 0.9986 - val_loss: 0.0561 - val_accuracy: 0.9905
Epoch 50/50
422/422 [==============================] - 2s 5ms/step - loss: 0.0035 - accuracy: 0.9988 - val_loss: 0.0560 - val_accuracy: 0.9897
313/313 [==============================] - 1s 3ms/step


# 예측
y_pred = model.predict(x_test)
y_pred = np.array(y_pred)

for idx in range(10):
  plt.title(str(np.argmax(y_pred[idx])))
  plt.imshow(x_test[idx], cmap='gray')
  plt.show()

313/313 [==============================] - 1s 2ms/step


from sklearn.metrics import accuracy_score
accuracy = accuracy_score(np.argmax(y_test, axis=1), np.argmax(y_pred, axis=1))
accuracy

0.988

[딥러닝] 기억하는 신경망 : RNN, 그리고 개선 모델 (LSTM, GRU) (0)	2024.06.08
[딥러닝] CNN : ResNet 모델로 동물 이미지 분류하기(CIFAR 이미지셋) (0)	2024.06.08
[딥러닝] 심층학습 시작 : 인공 신경망과 MLP (+ 신경망 모델 만들어보기) (1)	2024.06.08
[머신러닝] 앙상블 모델 : Boosting / Stacking 적용해보기 (0)	2023.08.30
[머신러닝] 앙상블 모델 : Voting / Bagging / Random Forest 적용해보기 (0)	2023.08.30

데굴데굴 개발자의 기록

CATEGORIES

[딥러닝] CNN : 이미지 학습을 위한 신경망 (+ MNIST 손글씨 분류해보기) /category/Data%20Science/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D%20%26%20%EB%94%A5%EB%9F%AC%EB%8B%9D

CNN(Convolutional Neural Network, 합성곱 신경망)

Convolution(컨볼루션)

컨볼루션 연산 과정

<컨볼루션 연산의 수행 과정>

컨볼루션 연산의 주요 속성

Size

Stride

Padding

출력 이미지의 크기

최초의 CNN : LeNet5

예시) 가장 간단한 영상 인식 : 도형 인식하기

특징을 잘 추출할 수 있는 필터 결정하기

특징 추출 (Convolution + Pooling)

특징 인식(Fully-Connected)

LeNet5 구조

Backpropagation

CNN의 등장 배경과 특징

등장 배경

CNN의 특징

CNN 기반으로 해결 가능한 작업 분류

다양한 CNN 기반 모델

AlexNet

ZFNet

VGGNet

ResNet

GoogleNet

Tensorflow로 MNIST 손글씨 인식하기 (LeNet5)

MNIST 데이터 로드 및 전처리¶

CNN 모델 생성¶

모델 학습¶

Test Set에 대한 예측 및 모델 평가¶

'Data Science > 머신러닝 & 딥러닝' 카테고리의 다른 글

BELATED ARTICLES

NOTICE

ARCHIVE

RECENTPOST

RECENTCOMMENT

티스토리툴바

[딥러닝] CNN : 이미지 학습을 위한 신경망 (+ MNIST 손글씨 분류해보기)
/category/Data%20Science/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D%20%26%20%EB%94%A5%EB%9F%AC%EB%8B%9D