Quoa Question Pair Similarity Project

Techniques Used:

BOW
TFIDF
Own Word Embedding
Pre-Trained Word2Vec
Pre-Trained GloVe
Pre-Trained BERT
Senetence Similarity

Extracted Features:

Basic Word features
Length Based Features
Token Based Features
Fuzzy features
Cosine similarity between two sentences

Machine Learning Models Used:

Logistic Regression
SVM
Naive Bayes
KNN
Decision Tree
Random Forest
Gradient Boost
ADA Boost
XGBoost

Best Method:

XGBoost using BERT and Advanced Extracted features Accuracy of 86%.