Skip to content

Repositorio para la Actividad Evaluable 1 de Data Driven Security (Máster en Gestión de la Ciberseguridad, 2024/2025). Contiene análisis de preguntas de ciencia de datos, resolución de un caso práctico sobre registros TCP, y procesamiento de logs HTTP con R. Incluye código reproducible en RMarkdown, documentación y resultados renderizados.

Notifications You must be signed in to change notification settings

spirock/Data_Driven_Security_Activity1

Repository files navigation

Análisis de Logs de Servidor HTTP con R

Este proyecto tiene como objetivo realizar un análisis de registros HTTP (logs) de un servidor usando R. A lo largo de la clase, hemos explorado diversas técnicas para cargar, limpiar y analizar datos, especialmente centrados en archivos de log con formato estructurado.


Descripción del Proyecto

  • Archivo de entrada: epa-http.csv
    Este archivo contiene registros de un servidor HTTP donde cada línea incluye información como:
    • Dirección IP del cliente
    • Hora de la solicitud
    • Método HTTP
    • Endpoint solicitado
    • Protocolo HTTP
    • Código de respuesta
    • Tamaño en bytes de los datos transferidos

Objetivos del Proyecto

  1. Lectura y Exploración de Datos

    • Cargar archivos de texto utilizando readr y tratar separadores complejos.
    • Identificar y manejar valores nulos (NA) en el dataset.
    • Validar las dimensiones del dataset (número de filas y columnas).
  2. Análisis Estadístico Básico

    • Calcular el valor medio de la columna Bytes (tamaño de respuesta).
    • Identificar filas problemáticas que no cumplen con el formato esperado.
  3. Limpieza de Datos

    • Rellenar valores faltantes con valores predeterminados (como 0 o "xx").

Herramientas y Librerías

El proyecto se desarrolló utilizando las siguientes herramientas:

  • Lenguaje: R
  • Librerías principales:
    • readr: Para leer archivos de texto con formatos personalizados.
    • stringr: Para trabajar con strings en R.

About

Repositorio para la Actividad Evaluable 1 de Data Driven Security (Máster en Gestión de la Ciberseguridad, 2024/2025). Contiene análisis de preguntas de ciencia de datos, resolución de un caso práctico sobre registros TCP, y procesamiento de logs HTTP con R. Incluye código reproducible en RMarkdown, documentación y resultados renderizados.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •  

Languages