Instructora: Dra. Evelia Coss, Posdoc de la Dra. Alejandra Medina, LIIGH-UNAM
Clases para los alumnos de Ciencias Genomicas de 4to semestre de la ENES, Juriquilla (27 Feb - 1 Marzo 2024). Formando parte de la clase de Bioinformática y Estadística 2.
El módulo consta de sesiones teóricas y prácticas impartidas de forma presencial, que cubrirán aspectos básicos del tópico como:
- Calidad y limpieza de archivos fastq
- Alineamiento y ensamblaje con el genoma de referencia usando STAR
- Generación del archivo de cuentas crudas
- Importar datos en R
- Normalización y corrección por batch
- Expresión diferencial con DESEq2 y edgeR
- Análisis funcional de los genes detectados
- Visualización grafica de los resultados
Se darán presentaciones detalladas del uso de programas clave, todos de código fuente abierto, usando datos tomados de las bases de datos. También se presentará el uso de algunos scripts de Bash y R muy sencillos, con el objetivo de aprender los aspectos básicos de estos lenguajes para el análisis de datos transcriptómico.
- Dia 1. Aspectos generales de RNA-Seq / Control de calidad de los datos
- Dia 2. Diversos pipeline para Alineamiento, ensamblaje y conteo de reads
- Dia 3. Importar datos en R, Normalización y Corrección por batch / DEG con DESeq2
- Dia 4. GSEA - Análisis funcional
- Fecha: martes 27 de Febrero 2024
- Presentación:
- Datos:
/mnt/Guanina/bioinfo24/data/Clase_RNASeq2024/
- Tarea: Elegir en equipos los transcriptomas que emplearán en su proyecto - Información diapositiva 58 y moodle ENES
- Lecturas y cursos recomendados:
- Fecha: miércoles 28 de Febrero 2024
- Presentación:
- Lecturas y cursos recomendados:
- Alineamiento de novo - Trinity
- Alineamiento con el genoma de referencia - STAR
- Pseudoalineamiento con Kallisto
- Pseudoalineamiento con Kallisto - practica
- Fecha: jueves 29 de Febrero 2024
- Presentación:
- Scripts: https://github.com/EveliaCoss/RNAseq_classFEB2024/tree/main/Practica_Dia3/scripts/
- Lecturas y cursos recomendados:
- Fecha: viernes 1 de marzo 2024
- Presentación:
- Lecturas y cursos recomendados:
- Base de datos Gene Ontology Resource
- Base de datos AmiGo2
- Reducir terminos con REVIGO
- Heatmap con ComplexHeatmap - Github
- Heatmap con ComplexHeatmap - manual
- Contar con una terminal en tu sistema operativo
- Los paquetes que emplearemos en R v4.0.2, se encuentran presentes en el cluster DNA, por lo que, no es necesario instalar nada en nuestras computadoras.
- Nodo de prueba (qlogin)
-
Script
load_data_inR.R
:1) Importar datos en R (archivo de cuentas) + metadatos y 2) Crear una matriz de cuentas con todos los transcriptomas
-
Script
DEG_analysis.R
:3) Crear el archivo
dds
conDESeq2
, 4) Correr el análisis de Expresión Diferencial de los Genes (DEG), 5) Normalización de los datos, 6) Detección de batch effect y 7) Obtener los resultados de los contraste de DEG -
Script
VisualizacionDatos.R
:8) Visualización de los datos
-
Script
GOterms_analysis.R
:9) Análisis de Terminos funcionales (GO terms)
- Presentacion
- Script
- Informacion fuente:
- Introduccion a Rmarkdown
En la clase previa les enseñe a crear reportes en Rmarkdown, si necesitan revisar la clase les dejo el link: https://github.com/EveliaCoss/RmarkdownGraphs_notes
- Crear llaves y alias
También aprendimos a crear llaves (ssh-keygen) y alias para acceder a los servidores de una manera segura y rápida: https://github.com/EveliaCoss/keygen
- GOterms en S. cereviacae
- Go Term finder
- REVIGO - pagina principal
- REVIGO - Reducir terminos GO, ejemplos
- ggprofiler2
- Pathway enrichment analysis and visualization of omics data
- Biomedical knowledge mining using GOSemSim and Clusterprofiler
- Pathview - Pagina principal
- Pathview - Manual
- KEGG - Pathway ID
- AnnotationDbi
- Gene Ontology enrichment analysis - Uso de varias bases de datos en R