Este proyecto es una continuación del análisis inicial realizado en el sistema predictivo para el riesgo de lesiones musculoesqueléticas. En esta segunda fase, el enfoque se centra específicamente en desarrollar un modelo predictivo para clasificar el riesgo de lesión de rodilla utilizando datos biomecánicos seleccionados.
Después de evaluar múltiples modelos de clasificación, el Random Forest fue seleccionado como el modelo más robusto y efectivo tras un proceso de optimización con GridSearchCV. Los datos, procesados a partir de diversas características biomecánicas, permiten predecir si un individuo está en riesgo de sufrir una lesión de rodilla.
Este trabajo amplía los resultados obtenidos en la fase inicial, la cual fue presentada en el 11º Congreso Conjunto AEA-SEROD en Barcelona, destacando la integración de Machine Learning e inteligencia artificial en la biomecánica aplicada.
- Fase 1: Desarrollo inicial de un sistema predictivo integral para evaluar el riesgo de lesiones musculoesqueléticas y despliegue en Google Cloud Platform (enlace al respositorio).
- Fase 2: Clasificación específica del riesgo de lesiones de rodilla con un enfoque optimizado en modelos predictivos.
El proyecto ha sido reconocido en el ámbito científico y profesional, con una presentación en el Congreso AEA-SEROD. El certificado de la ponencia se encuentra en la carpeta src/pdf
.
Durante este proyecto se evaluaron varios modelos, incluyendo:
- Random Forest (Modelo Seleccionado)
- Bagging Classifier
- Decision Tree
- Gradient Boosting Classifier
- Voting Classifier
El modelo Random Forest fue elegido por su rendimiento, particularmente después de su optimización utilizando GridSearchCV con validación cruzada de 10 pliegues.
- Mejor puntuación promedio de validación cruzada: 0.669
- Mejores Parámetros:
max_depth
: 6max_features
: 'log2'min_samples_leaf
: 1min_samples_split
: 2
- Precisión en el entrenamiento: 0.9779
- Precisión en la prueba: 0.7353
- AUC-ROC: 0.7612
- Precisión:
- Sin Lesión de Rodilla: 0.75
- Lesión de Rodilla: 0.72
- Exhaustividad (Recall):
- Sin Lesión de Rodilla: 0.71
- Lesión de Rodilla: 0.76
- Puntuación F1:
- Sin Lesión de Rodilla: 0.73
- Lesión de Rodilla: 0.74
- Predicciones correctas para sin lesión de rodilla: 12
- Predicciones incorrectas para sin lesión de rodilla: 5
- Predicciones correctas para lesión de rodilla: 12
- Predicciones incorrectas para lesión de rodilla: 5
Después de un exhaustivo análisis y comparación, el modelo Random Forest demostró un rendimiento equilibrado entre precisión y capacidad de generalización, lo que lo convierte en la opción óptima para predecir el riesgo de lesión de rodilla.
El modelo fue entrenado con las siguientes características:
- Datos Biomecánicos:
- IMC
- Tasa de Fuerza Total
- Tasa de Paso
- Excursión de Pronación (mp -> to)
- Impacto GS
- Ratio de Contacto
- Velocidad Máxima de Pronación
- Potencia
- Excursión de Apoyo (fs -> mp)
- Rigidez Vertical del Resorte
- Fuerza de Frenado GS
- Peso
- Excursión de Pronación
- Tipo de Golpe de Pie
- Excursión de Apoyo (mp -> to)
- Ritmo
- Longitud de Paso
- Altura
- Tasa de GRF Vertical
- Edad
- Ángulo de Zancada
- Tamaño de Zapato
- Impacto
- Velocidad
- Torsión Femoral Externa (TFE)
- FPI Total (Postura Dorsal del Pie)
- Hallux Limitus (HL)
- Prueba de Thomas para TFL
- Genu Recurvatum
- Prueba de Jack (No Reconstruido)
Los archivos de la carpeta data
, que incluyen el conjunto de datos dataset_run.csv
y otros archivos relacionados, no han sido subidos a este repositorio debido a que contienen información propietaria del equipo de investigación de la Universidad San Jorge de Zaragoza (España). Estos datos son confidenciales y pertenecen a un proyecto de investigación en curso, por lo que no pueden ser compartidos públicamente.
Si tienes interés en acceder a los datos o en colaborar con el equipo de investigación, te recomendamos ponerte en contacto directamente con la Universidad San Jorge para más información.