Skip to content

Latest commit

 

History

History
142 lines (103 loc) · 8.83 KB

README.md

File metadata and controls

142 lines (103 loc) · 8.83 KB

Análisis de datos de RNA-Seq 👾

Instructora: Dra. Evelia Coss, Posdoc de la Dra. Alejandra Medina, LIIGH-UNAM

Clases para los alumnos de Ciencias Genomicas de 4to semestre de la ENES, Juriquilla (27 Feb - 1 Marzo 2024). Formando parte de la clase de Bioinformática y Estadística 2.

Descripción

El módulo consta de sesiones teóricas y prácticas impartidas de forma presencial, que cubrirán aspectos básicos del tópico como:

  • Calidad y limpieza de archivos fastq
  • Alineamiento y ensamblaje con el genoma de referencia usando STAR
  • Generación del archivo de cuentas crudas
  • Importar datos en R
  • Normalización y corrección por batch
  • Expresión diferencial con DESEq2 y edgeR
  • Análisis funcional de los genes detectados
  • Visualización grafica de los resultados

Se darán presentaciones detalladas del uso de programas clave, todos de código fuente abierto, usando datos tomados de las bases de datos. También se presentará el uso de algunos scripts de Bash y R muy sencillos, con el objetivo de aprender los aspectos básicos de estos lenguajes para el análisis de datos transcriptómico.

Contenido 📌

  • Dia 1. Aspectos generales de RNA-Seq / Control de calidad de los datos
  • Dia 2. Diversos pipeline para Alineamiento, ensamblaje y conteo de reads
  • Dia 3. Importar datos en R, Normalización y Corrección por batch / DEG con DESeq2
  • Dia 4. GSEA - Análisis funcional

Dia 1. Aspectos generales de RNA-Seq / Control de calidad de los datos

Dia 2. Diversos pipeline para Alineamiento, ensamblaje y conteo de reads

Dia 3. Importar datos en R, Normalización y Corrección por batch effect 🪲 / DEG con DESeq2

Dia 4. GSEA - Análisis funcional

Requisitos

  • Contar con una terminal en tu sistema operativo
  • Los paquetes que emplearemos en R v4.0.2, se encuentran presentes en el cluster DNA, por lo que, no es necesario instalar nada en nuestras computadoras.
  • Nodo de prueba (qlogin)

Pipeline ⚡

Pasos a seguir para el análisis de los datos de RNA-Seq

  • Script load_data_inR.R:

    1) Importar datos en R (archivo de cuentas) + metadatos y 2) Crear una matriz de cuentas con todos los transcriptomas

  • Script DEG_analysis.R:

    3) Crear el archivo dds con DESeq2, 4) Correr el análisis de Expresión Diferencial de los Genes (DEG), 5) Normalización de los datos, 6) Detección de batch effect y 7) Obtener los resultados de los contraste de DEG

  • Script VisualizacionDatos.R:

    8) Visualización de los datos

  • Script GOterms_analysis.R:

    9) Análisis de Terminos funcionales (GO terms)

Clase de retroalimentación (24 mayo 2024)

Clases previas 📗

  • Introduccion a Rmarkdown

En la clase previa les enseñe a crear reportes en Rmarkdown, si necesitan revisar la clase les dejo el link: https://github.com/EveliaCoss/RmarkdownGraphs_notes

  • Crear llaves y alias

También aprendimos a crear llaves (ssh-keygen) y alias para acceder a los servidores de una manera segura y rápida: https://github.com/EveliaCoss/keygen

Cursos para practicar 📕

Referencias 📚