Topic Modelling: Es una técnica de aprendizaje automático no supervisada que es capaz de escanear un conjunto de documentos, detectar patrones de palabras y frases dentro de ellos y agrupar automáticamente grupos de palabras y expresiones similares que caracterizan mejor un conjunto de documentos. Se puede profundizar más en su definición en este link.
Latent Dirichlet Allocation(LDA): Es uno de los métodos de modelado de temas más populares. Cada documento se compone de varias palabras y cada tema también tiene varias palabras que le pertenecen. El objetivo de LDA es encontrar temas a los que pertenece un documento, basándose en las palabras que contiene.
Con el fin de construir un sistema de recomendación de libros, se utiliza el aprendizaje no supervizado en particular el algoritmo LDA, con el fin de obtener los tópicos principales de los libros refereidos en el dataset CMU Book Summary.