Handwritten Digit Classification

1. Convolutional Neural Network (CNN) Architecture Configuration

Overview

This section explains the configuration of the Convolutional Neural Network (CNN) architecture designed for handwritten digit classification using the MNIST dataset.

Plots

Training and Test Accuracies

Training accuracy: 0.9960333108901978

Test accuracy: 0.9912999868392944

Architecture Details

Convolutional Layers

First Conv2D Layer:
- Filters: 32
- Filter Size: (3, 3)
- Activation Function: ReLU
Second Conv2D Layer:
- Filters: 64
- Filter Size: (3, 3)
- Activation Function: ReLU
Third Conv2D Layer:
- Filters: 64
- Filter Size: (3, 3)
- Activation Function: ReLU

Pooling Layers

MaxPooling2D layers:
- Applied after the first two convolutional layers.
- Pool Size: (2, 2)

Dense Layers

Dense Layer:
- Neurons: 64
- Activation Function: ReLU
Dropout Layer:
- Dropout Ratio: 0.5
- Purpose: Regularization to prevent overfitting
Output Dense Layer:
- Neurons: 10 (for each digit class)
- Activation Function: Softmax

Batch Normalization

Batch normalization layers are not included in this example but can be added for improved convergence and stability.

Optimizer

Adam Optimizer

Learning Rate

The learning rate is set to the default value for the Adam optimizer.

Experimental Considerations

The architecture and hyperparameters mentioned above serve as a starting point.
It's advisable to experiment with variations in the architecture, learning rate, and regularization techniques for optimal performance.

2. Multi-Layer Perceptron (MLP) Approach

Overview

This section provides details on the architecture of the fully connected neural network (Multi-Layer Perceptron or MLP) used for handwritten digit classification.

Plots

Training and Test Accuracies

Training accuracy: 0.9924166798591614

Test accuracy: 0.9801999926567078

Architecture Details

Dense Layers

First Dense Layer:
- Neurons: 512
- Activation Function: ReLU
Dropout Layer:
- Dropout Ratio: 0.5
- Purpose: Regularization to prevent overfitting
Second Dense Layer:
- Neurons: 256
- Activation Function: ReLU
Dropout Layer:
- Dropout Ratio: 0.5
- Purpose: Regularization to prevent overfitting
Output Dense Layer:
- Neurons: 10 (for each digit class)
- Activation Function: Softmax

Optimizer

Adam Optimizer

Learning Rate

The learning rate is set to the default value for the Adam optimizer.

Experimental Considerations

The architecture and hyperparameters mentioned above serve as a starting point.
It's advisable to experiment with variations in the architecture, learning rate, and regularization techniques for optimal performance.

Advantages

Simplicity:
- MLPs are relatively simpler compared to CNNs. They don't have convolutional or pooling layers, making them easier to understand and implement.
Less Computational Resources:
- MLPs might require fewer computational resources compared to CNNs, which can be advantageous in scenarios with limited computing power.

Disadvantages

Lack of Spatial Hierarchies:
- MLPs do not consider the spatial hierarchies present in images. They treat each pixel independently, which can result in the loss of important spatial information.
Limited Feature Learning:
- CNNs excel in feature learning from images through convolutional and pooling layers. MLPs lack these specialized layers, potentially limiting their ability to learn hierarchical features.
Less Robust to Spatial Transformations:
- MLPs are less robust to spatial transformations like translations, rotations, and scaling, which might be crucial for image classification tasks.
Large Number of Parameters:
- Fully connected layers in MLPs contribute to a large number of parameters, making them more prone to overfitting, especially when dealing with high-dimensional data like images.
Not Suitable for Complex Structures:
- For tasks where the input data has complex spatial structures (like images), CNNs are generally more suitable due to their ability to capture hierarchical features.

In conclusion, while MLPs have simplicity and computational advantages, they might not perform as well as CNNs on image classification tasks, especially when dealing with complex spatial structures. The choice between these approaches depends on the specific requirements of the task and available computational resources.

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
.gitignore		.gitignore
README.md		README.md
SWE-583-FINAL-REPORT-MERT-AYDIN.pdf		SWE-583-FINAL-REPORT-MERT-AYDIN.pdf
cnn.py		cnn.py
cnn_training_and_validation_accuracy.png		cnn_training_and_validation_accuracy.png
cnn_training_and_validation_loss.png		cnn_training_and_validation_loss.png
mlp.py		mlp.py
mlp_training_and_validation_accuracy.png		mlp_training_and_validation_accuracy.png
mlp_training_and_validation_loss.png		mlp_training_and_validation_loss.png
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Handwritten Digit Classification

1. Convolutional Neural Network (CNN) Architecture Configuration

Overview

Plots

Training and Test Accuracies

Architecture Details

Convolutional Layers

Pooling Layers

Dense Layers

Batch Normalization

Optimizer

Learning Rate

Experimental Considerations

2. Multi-Layer Perceptron (MLP) Approach

Overview

Plots

Training and Test Accuracies

Architecture Details

Dense Layers

Optimizer

Learning Rate

Experimental Considerations

Advantages

Disadvantages

About

Releases

Packages

Languages

mert-aydin/Handwritten-Digit-Classification

Folders and files

Latest commit

History

Repository files navigation

Handwritten Digit Classification

1. Convolutional Neural Network (CNN) Architecture Configuration

Overview

Plots

Training and Test Accuracies

Architecture Details

Convolutional Layers

Pooling Layers

Dense Layers

Batch Normalization

Optimizer

Learning Rate

Experimental Considerations

2. Multi-Layer Perceptron (MLP) Approach

Overview

Plots

Training and Test Accuracies

Architecture Details

Dense Layers

Optimizer

Learning Rate

Experimental Considerations

Advantages

Disadvantages

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages