Vous trouverez la description complète du TP ici.
L’objectif de ce TP sera de calculer les OTU obtenues à partir d’un séquençage “mock”. Nous n’avons amplifié que les bactéries (et non les champignons). 8 espèces sont ainsi attendues.
Nous avons développé un programme effectuant une dé-duplication en séquence complète (“dereplication full length”), une recherche des séquences chimériques et un regroupement basé sur un algorithme glouton (“Abundance Greedy Clustering”).
Pour récupérer le projet sur votre machine, utilisez la commande suivante :
git clone https://github.com/assadiab/agc-tp.git
cd agc-tpLe gestionnaires de packages Pixi est utilisé pour gérer l’environnement et installer les dépendances. Le fichier pixi.toml est déjà disponible dans le dépôt.
Pour installer ou mettre à jour l’environnement, utilisez :
pixi install # Installe les dépendances si ce n'est pas déjà fait
pixi update # Met à jour l'environnement selon pixi.tomlAprès avoir cloné le dépôt et navigué dans le répertoire du projet, mettez à jour l'environnement Pixi (voir Installation des dépendances), puis listez les fichiers pour vérifier que tout est présent :
ls -lVous devriez voir :
├── README.md
├── data/
├── debruijn/
├── pixi.lock
├── pixi.toml
├── results/
└── tests/Le script principal est agc.py. Il s’exécute depuis le terminal avec les arguments suivants :
| Option | Description | Valeur par défaut |
|---|---|---|
-i, --amplicon_file |
Fichier contenant les séquences au format FASTA | Obligatoire |
-s, --minseqlen |
Longueur minimum des séquences | 400 |
-m, --mincount |
Comptage minimum des séquences | 10 |
-c, --chunk_size |
Taille des partitions de séquence (non utilisé dans cette implémentation) | 100 |
-k, --kmer_size |
Longueur des k-mers (non utilisé dans cette implémentation) | 8 |
-o, --output_file |
Fichier de sortie contenant les OTU au format FASTA | Obligatoire |
Exemple d’exécution :
pixi run python debruijn/agc.py -i tests/test_sequences.fasta.gz -s 200 -m 3 -o results2/OTU.fasta En cas de questions, vous pouvez me contacter par email: assa.diabira@etu.u-paris.fr .