Descripción del proyecto

Tabla de contenidos

Descripción del proyecto
Pasos para la puesta en marcha
Técnicas con LLMs
- LLMs confrontados
Referencias

Descripción del proyecto

Este proyecto busca convertirse en un punto de referencia accesible para cualquier persona interesada en el fascinante mundo de los chatbots y los modelos de lenguaje extenso (LLMs de sus siglas en inglés Large Language Model). Nuestro objetivo es proporcionar una base sólida de conocimientos y herramientas prácticas que permitan a usuarios de todos los niveles, desde principiantes hasta desarrolladores experimentados, adentrarse en la creación de sus propios asistentes y aplicaciones con LLMs. Queremos democratizar el acceso a esta tecnología y fomentar la innovación en el campo de la interacción humano-máquina.

De momento tenemos implementados y explicados tres técnicas básicas para crear chatbots y aplicaciones con LLMs: Chatbot básico(main.py), RAG(main_rag.py) y un agente de IA(main_agentia.py):

Pasos para la puesta en marcha

Arrancar LLM(Large Language Model)

Para empezar, procedemos a inicializar el modelo de lenguaje LLM(Large Language Model) que servirá como base para nuestro chatbot. Para facilitar su implementación y gestión, decidimos ejecutar los LLMs a través de un contenedor Docker utilizando la plataforma Cortex. Esta elección nos permite aislar el entorno de ejecución del LLM, garantizando una mayor estabilidad y portabilidad del proyecto y ejecutarlo usando la GPU o CPU.

# Arrancamos el contenendor usando la CPU
docker run -it -d --name cortex -p 39281:39281 menloltd/cortex

#  O alternativamente, usando la GPU. Atención! Requiere los drivers 'nvidia-docker' y evidentemente el hardware adecuado
docker run --gpus all -it -d --name cortex -p 39281:39281 menloltd/cortex

En este caso, hemos seleccionado Llama 3.2 3B, un modelo de última generación conocido por su capacidad para generar texto de alta calidad aunque podemos usar otros modelos:

# Descargamos el modelo y lo arrancamos 
docker exec -it cortex cortex run llama3.2:3b-gguf-q4-km

# O alternativamente, podemos usar otros modelos, como Phi de Microsoft 
docker exec -it cortex cortex run phi-3.5:3b-gguf-q4-km

# O alternativamente, podemos usar otros modelos, como DeepSeek
docker exec -it cortex cortex run deepseek-r1-distill-qwen-14b:14b-gguf-q4-km

Atención! Es importante tener configurado el modelo que tenemos descargado y arrancado en los scripts "main_*.py"

Instalación de dependencias Python

Para arrancar el chatbot el primer paso obligatório es instalar las dependencias del python(En nuestro caso vamos a crear también un entorno virtual de Python con el objetivo de tener un único espacio con las dependencias de nuestro proyecto):

# Creación y activación del virtual env
virtualenv env
source env/bin/activate

# Instalaciión de dependencias
pip install -r requirements.txt

Puesta en marcha del chatbot básico

Para arrancar el chatbot simplemente arrancar el script 'main.py':

# Arranque del script
python main.py

Puesta en marcha del chatbot con RAG

Un RAG (Retrieval Augmented Generation, o Generación Aumentada por Recuperación) es una técnica de inteligencia artificial que combina la capacidad de los LLMs y la habilidad de buscar información específica en una base de datos(Normalmente una base de datos vectorial).

Para arrancar el chatbot con el RAG simplemente arrancar el script 'main_rag.py':

# Arranque del script
python main_rag.py

Probar el script para trastear con ChromaDB

Para arrancar el script y trastear con ChromaDB(Base de datos orientada a vectores) ejecutamos el script 'testchromadb.py':

# Arranque del script
python testchromadb.py

Puesta en marcha del agente de IA

Un agente de IA es un sistema que percibe su entorno, toma decisiones y realiza acciones con el objetivo de alcanzar metas específicas. Para ello se conecta a distintos tipos de herramientas como bases de datos, APIs, dispositivos, etc.

Para arrancar el chatbot con el Agente de IA simplemente arrancar el script 'main_agentia.py':

# Arranque del script
python main_agentia.py

Técnicas con LLMs

LLMs confrontados

La idea es confrontar la salida de un LLM con otro LLM y tiene el potencial de mejorar significativamente la calidad y confiabilidad de la información generada. Aquí presentamos algunas arquitecturas posibles y sus implicaciones:

Arquitectura de "Verificación por consenso"

Funcionamiento: Se utilizan múltiples LLMs para generar respuestas a una misma pregunta o tarea(En paralelo). Luego, se comparan las salidas y se selecciona la respuesta que tenga mayor consenso.

Ventajas: Reduce la probabilidad de respuestas incorrectas o sesgadas, ya que se basa en la validación cruzada entre diferentes modelos. El ejecutarse el paralelo no penaliza la UX del usuario.

Desventajas: Aumenta la complejidad y el costo computacional, ya que requiere la ejecución de múltiples LLMs.

Arquitectura de "Detección de anomalías"

Funcionamiento: Un LLM genera una respuesta, y luego otro LLM actúa como un "detector de anomalías" que evalúa la respuesta en busca de inconsistencias, errores o información falsa.

Ventajas: Permite identificar y corregir errores en las respuestas generadas por el primer LLM, mejorando la precisión y confiabilidad de la información.

Desventajas: Requiere un diseño cuidadoso del "detector de anomalías" para evitar falsos positivos o negativos.

Arquitectura de "Generación y edición iterativa"

Funcionamiento: Un LLM genera una primera versión de una respuesta, y luego otro LLM la revisa y edita para mejorar su calidad, claridad o precisión. Este proceso puede repetirse varias veces de forma iterativa.

Ventajas: Permite obtener respuestas más elaboradas y pulidas, ya que se basa en la colaboración entre dos o mas LLMs.

Desventajas: Puede ser un proceso lento y costoso, ya que requiere múltiples iteraciones en série.

Referencias

Vídeo de Youtube "Aprende a desarrollar chatbots desde 0"
Vídeo de Youtube "Aprende a desarrollar chatbots con RAG(Retrieval-Augmented Generation) usando ChromaDB"
Vídeo de Youtube "Tutorial de desarrollo de IA Agents"
Vídeo de Youtube "Aprende a crear aplicaciones con DeepSeek y Técnicas con LLMs confrontadas"
Artículo "Cortex: Desplegando LLMs en local"

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
static		static
README.md		README.md
diagram.png		diagram.png
diagram2.jpg		diagram2.jpg
facturas.csv		facturas.csv
main.py		main.py
main_agentia.py		main_agentia.py
main_rag.py		main_rag.py
requirements.txt		requirements.txt
testchromadb.py		testchromadb.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Tabla de contenidos

Descripción del proyecto

Pasos para la puesta en marcha

Arrancar LLM(Large Language Model)

Instalación de dependencias Python

Puesta en marcha del chatbot básico

Puesta en marcha del chatbot con RAG

Probar el script para trastear con ChromaDB

Puesta en marcha del agente de IA

Técnicas con LLMs

LLMs confrontados

Arquitectura de "Verificación por consenso"

Arquitectura de "Detección de anomalías"

Arquitectura de "Generación y edición iterativa"

Referencias

About

Uh oh!

Releases

Packages

Uh oh!

Languages

acoronadoc/chatbot-sample

Folders and files

Latest commit

History

Repository files navigation

Tabla de contenidos

Descripción del proyecto

Pasos para la puesta en marcha

Arrancar LLM(Large Language Model)

Instalación de dependencias Python

Puesta en marcha del chatbot básico

Puesta en marcha del chatbot con RAG

Probar el script para trastear con ChromaDB

Puesta en marcha del agente de IA

Técnicas con LLMs

LLMs confrontados

Arquitectura de "Verificación por consenso"

Arquitectura de "Detección de anomalías"

Arquitectura de "Generación y edición iterativa"

Referencias

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages