Skip to content
View SalimM21's full-sized avatar
🏠
Working from home
🏠
Working from home

Block or report SalimM21

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
SalimM21/README.md

Greetings ✨, I'm Salim MAJIDE

Typing SVG

🙋‍♂️ About Me

Data Engineer & MLOps Enthusiast

Passionate about building scalable, reliable, and production-ready data systems, I specialize in designing end-to-end data platforms combining Data Engineering, Machine Learning, and MLOps.

I have worked on advanced projects such as a Scoring & Fraud Detection Platform (MLOps) integrating real-time streaming, ML models, and compliance automation (KYC/AML), as well as end-to-end ELT pipelines and Big Data analytics systems.

💡 My core expertise includes:

  • Real-time data pipelines (Apache Kafka, Spark, Airflow)
  • MLOps & model lifecycle (MLflow, Docker, Kubernetes)
  • Data quality & governance (Soda Core, monitoring, validation)
  • Scalable architectures (batch & streaming)

🔭 Currently Working On

  • Scoring & Fraud Detection Platform (MLOps)
  • Real-time pipelines with Kafka + Spark Streaming
  • Advanced monitoring & observability (Grafana, Prometheus)

🌱 Learning

  • Advanced MLOps (MLflow, Kubeflow, Feature Store)
  • Cloud Data Engineering (GCP / BigQuery optimization)
  • LLM integration in data platforms

👯 Collaborating On

  • Data Engineering & MLOps projects
  • Open-source data platforms & analytics tools

🤔 Seeking Help With

  • Advanced orchestration with Apache Airflow
  • Distributed system design & optimization

💬 Ask Me About

  • Data pipelines (Batch & Streaming)
  • MLOps & ML lifecycle
  • Data modeling & architecture
  • Fraud detection & scoring systems

📂 Projects Portfolio

🚀 Here are some of my database projects:

Project Description Tech Stack
Plateforme de Scoring Automatisée avec MLOps (All-in-One) Voir le projet Plateforme intelligente, scalable et traçable permettant l'évaluation du risque de crédit (scoring prospects) + l'intégration d’un chatbot intelligent Airflow Docker Kubernetes MLflow MLOps Terraform Data Governance Agile Snowflake Helm DLQ
Football Data Engineering ( Databricks + Power BI) Pipeline complet pour analyser les performances footballistiques PySpark Databricks PowerBI ETL Data Visualization Data Quality
YouTube ELT Pipeline (Airflow + Data Quality) Pipeline ELT automatisé pour analyser les données YouTube Airflow PostgreSQL Grafana Prometheus Data Quality
Sentiment Analysis API API REST et page web pour analyse de sentiments via Hugging Face Python FastAPI HuggingFace Docker Gradio Pandas Scikit-learn NumPy
Big Data Apps Deployment in Kubernetes Automatisation du déploiement d’applications Big Data dans Kubernetes Kubernetes Docker Terraform Helm Ansible Prometheus Grafana ArgoCD Jenkins Python
Kafka Pipeline in Big Data Environment Création et déploiement d’un pipeline Kafka pour ingestion et traitement en temps réel Kafka Terraform Apache Spark Airflow Prometheus Grafana Docker Kubernetes
REST API + MongoDB (Django ORM + pymongo) API REST avec stockage de données MongoDB et WebSockets Python Django MongoDB JWT Swagger Docker Nginx
Bank-Account-Application Application bancaire Java avec Spring Boot, AngularJS et JWT Java Spring Boot AngularJS JWT Swagger Thymeleaf Hibernate
Web Chat Application (Java EE) Chat en ligne avec MVC, JSP et Spring Data JPA Java JSP MySQL Spring Data JPA JDBC

🛠 Capabilities

  • Database Design & Optimization : Relational & NoSQL schema design, query tuning, indexing, normalization
  • ETL & Data Processing : Apache Spark, Kafka, Airflow, data cleaning, transformation, pipeline orchestration
  • Machine Learning & AI : NLP models, clustering, classification, predictive analytics (Random Forest, Logistic Regression)
  • Automation & DevOps for Data : Kubernetes, Docker, CI/CD for scalable deployments
  • Data Visualization & BI : Tableau, Power BI, dashboard creation, KPI monitoring

🧰 Stack Technique

speciality Technologies
Data Engineering
Spark Kafka Airflow MySQL PostgreSQL MongoDB Snowflake Docker Kubernetes Terraform Ansible Helm ArgoCD Jenkins AWS Azure Prometheus Grafana
Data Science
Python Pandas NumPy Scikit-learn TensorFlow HuggingFace NLP Matplotlib Seaborn Plotly PowerBI Tableau Streamlit Dash Gradio
Others (Dev & Frameworks)
Django Flask FastAPI SpringBoot AngularJS Thymeleaf JSP JWT Swagger Nginx Tomcat GlassFish WildFly

📫 Contact

  • 📫 How to reach me: Email
  • 📱 Connect with me: LinkedIn
  • 📝 Feel free to contact me. I am always here ... Github SalimM21

📊 GitHub Analytics

🏆 GitHub Trophies

GitHub Trophies

GitHub Trophies

Pinned Loading

  1. Football-Data-Engineering-avec-PySpark-Databricks-et-Power-BI Football-Data-Engineering-avec-PySpark-Databricks-et-Power-BI Public

    Construction d’un pipeline PySpark pour l’analyse des performances footballistiques saison par saison, avec calcul de KPI, ranking des équipes et stockage optimisé en Parquet partitionné.

    Python 1

  2. Pipeline-YouTube-ELT-Project Pipeline-YouTube-ELT-Project Public

    Conception d'un pipeline ELT (Extract, Load, Transform) automatisé pour l'analyse de données YouTube, développé avec Apache Airflow, PostgreSQL et validation de qualité des données.

    Python 1

  3. SentimentAPI_HuggingFaceProject SentimentAPI_HuggingFaceProject Public

    Développement d’une API d’analyse de sentiments recevant un texte et retournant, automatiquement et clairement, un résultat positif ou négatif accompagné d’un score de confiance. L’API est conteneu…

    Python 2

  4. Filtrage-des-Emails-comme--spam-ou-legitime-Project Filtrage-des-Emails-comme--spam-ou-legitime-Project Public

    Système Intelligent de Filtrage des Emails comme "spam" (malveillant) ou légitime pour la Sécurité des Communications. Conçu pour BMSecurity, il est destiné à être intégré ultérieurement aux platef…

    Python 1

  5. ObesiTrack-Project ObesiTrack-Project Public

    ObesiTrack est une API sécurisée de prédiction de l’obésité, combinant Machine Learning multiclasses, FastAPI + JWT et PostgreSQL. Déployable via Docker, Compose et Helm, elle intègre une pipeline …

    Python 1

  6. Heart-Disease-Risk-Prediction-avec-PySpark-ML Heart-Disease-Risk-Prediction-avec-PySpark-ML Public

    Dans ce projet, nous allons concevoir un pipeline d’apprentissage automatique avec PySpark qui permet d'analyser et modéliser des facteurs cardiovasculaires afin d’anticiper les risques et d’aider …

    Python 1