Skip to content

assadiab/agc-tp

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

23 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Calcul des OTU

Vous trouverez la description complète du TP ici.

Introduction

L’objectif de ce TP sera de calculer les OTU obtenues à partir d’un séquençage “mock”. Nous n’avons amplifié que les bactéries (et non les champignons). 8 espèces sont ainsi attendues.

Nous avons développé un programme effectuant une dé-duplication en séquence complète (“dereplication full length”), une recherche des séquences chimériques et un regroupement basé sur un algorithme glouton (“Abundance Greedy Clustering”).

Cloner le dépôt

Pour récupérer le projet sur votre machine, utilisez la commande suivante :

git clone https://github.com/assadiab/agc-tp.git
cd agc-tp

Installation des dépendances

Le gestionnaires de packages Pixi est utilisé pour gérer l’environnement et installer les dépendances. Le fichier pixi.toml est déjà disponible dans le dépôt.

Pour installer ou mettre à jour l’environnement, utilisez :

pixi install   # Installe les dépendances si ce n'est pas déjà fait
pixi update    # Met Ă  jour l'environnement selon pixi.toml

Utilisation

Après avoir cloné le dépôt et navigué dans le répertoire du projet, mettez à jour l'environnement Pixi (voir Installation des dépendances), puis listez les fichiers pour vérifier que tout est présent :

ls -l

Vous devriez voir :

├── README.md
├── data/
├── debruijn/
├── pixi.lock
├── pixi.toml
├── results/
└── tests/

Le script principal est agc.py. Il s’exécute depuis le terminal avec les arguments suivants :

Option Description Valeur par défaut
-i, --amplicon_file Fichier contenant les séquences au format FASTA Obligatoire
-s, --minseqlen Longueur minimum des séquences 400
-m, --mincount Comptage minimum des séquences 10
-c, --chunk_size Taille des partitions de séquence (non utilisé dans cette implémentation) 100
-k, --kmer_size Longueur des k-mers (non utilisé dans cette implémentation) 8
-o, --output_file Fichier de sortie contenant les OTU au format FASTA Obligatoire

Exemple d’exécution :

 pixi run python debruijn/agc.py -i tests/test_sequences.fasta.gz -s 200 -m 3 -o results2/OTU.fasta    

⚠️ Le dossier de sortie (results2/) sera créé automatiquement s’il n’existe pas.

Contact

En cas de questions, vous pouvez me contacter par email: assa.diabira@etu.u-paris.fr .

About

🦠📊 OTU clustering pipeline for mock bacterial sequencing

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages