ShootLessSketchMore

Progetto di Data and Document Mining.
Siamese Network per Few-shot Learning, nello specifico One-Shot learning con N-Way modificabile

Come eseguire il codice

Addestramento della Siamese net:

python3 train.py --dataset tuberlin
python3 train.py --dataset miniquickdraw

Valutazione dell'accuratezza di predizione N-Way:

python3 evaluation.py

train.py

Addestra una Siamese Net che prende in input dal data loader due immagini con label 0 se di classi differenti o label 1 viceversa
Rete per classificazione binaria
Due immagini in input a due reti convoluzionali che condividono i pesi
Differenza in valore assoluto ---> layer fully connected ---> sigmoide che indica la similarità (rete in model.py)
Ottimizzatore Adam con learning rate 10^-3
Binary Cross Entropy Loss with Logits
Epoche di addestramento modificabili in config.py
A termine esecuzione salva il modello addestrato e mostra i grafici con l'andamento della loss (Esempio seguente del train in 15 epoche con dataset Mini Quick Draw)

evaluation.py

Carica il modello addestrato precedentemente (file .pt)
Il data loader fornisce una immagine e un set di N-Way immagini di cui una della stessa classe della prima
Inserendo nella rete addestrata l'immagine principale e una immagine del set alla volta si trova quella con similarità maggiore
Viene mostrata la performance di predizione nel task N-Way One-Shot mediata su 12 iterazioni

L'immagine principale a sinistra viene posta in input alla Siamese Net assieme ad una immagine alla volta tra quelle di destra
In output dalla rete si ha il valore di predizione, si decide di assegnare l'appartenenza alla stessa classe dell'immagine di sinistra con una di quelle a destra per cui il valore di predizione in output dalla Siamese Net è il maggiore tra tutti

for i, testImg in enumerate(imgSets):
            output = model(mainImg, testImg)
            if output > predVal:
                pred = i
                predVal = output
        if pred == label:
            correct += 1

Output finale: performance di predizione per i due modelli in configurazione 2-Way, 5-Way, 10-Way

Datasets utilizzati

TUBerlin

161 classi train
41 validation
48 test
Formato .png dimensione 84x84 8-bit
File di supporto: ./TUBerlin, dataset_n_way.py, train_val_splitter.py, dataset.py

MiniQuickDraw

Sottoinsieme delle 50 milioni di immagini di Google QuickDraw! ricavabile tramite il codice presente in DataUtils
32.700 disegni in totale in 109 classi (300 per classe)
70 classi train
18 validation
21 test
formato compresso array .npz numpy, unidimensionale di 748, modificate in 28x28 nel main.py
File di supporto ./DataUtils, dataset_n_way.py

Name		Name	Last commit message	Last commit date
Latest commit History 38 Commits
DataUtils		DataUtils
TUBerlin		TUBerlin
README.md		README.md
Schermata da 2021-04-29 09-09-43.png		Schermata da 2021-04-29 09-09-43.png
Schermata da 2021-05-30 13-28-23.png		Schermata da 2021-05-30 13-28-23.png
Siamese.PNG		Siamese.PNG
config.py		config.py
dataset.py		dataset.py
dataset_n_way.py		dataset_n_way.py
evaluation.py		evaluation.py
fewShotExample.PNG		fewShotExample.PNG
make_table.py		make_table.py
miniquickdraw_model.pt		miniquickdraw_model.pt
models.py		models.py
test.py		test.py
train.py		train.py
train_val_splitter.py		train_val_splitter.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ShootLessSketchMore

Come eseguire il codice

train.py

evaluation.py

Datasets utilizzati

TUBerlin

MiniQuickDraw

About

Releases

Packages

Languages

edoardore/ShootLessSketchMore

Folders and files

Latest commit

History

Repository files navigation

ShootLessSketchMore

Come eseguire il codice

train.py

evaluation.py

Datasets utilizzati

TUBerlin

MiniQuickDraw

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages