Esta guía te llevará a través del proceso de desarrollo y despliegue en Oracle Cloud Infrastructure (OCI) para construir tu primera aplicación utilizando modelos fundacionales como LLAMA 3.1
, prompt engineering
, y contexto
, aprovechando principalmente la capa gratuita de OCI.
Esta aplicación está diseñada para ayudar a los asistentes de Nerdearla 2024 a obtener recomendaciones personalizadas sobre los workshops, basándose en sus intereses y preguntas. Utiliza un enfoque híbrido de búsqueda de información Contexto y generación de texto con un modelo de lenguaje grande, en este caso LLAMA 3.1
proporcionado por Oracle Cloud Infrastructure (OCI).
- AI Engineering en la Nube - Primeros Pasos presentacion
- Repositorio - Selecciona la rama main en github
- Template - selecciona la rama template en github
- AI Engineering en la nube: Primeros Pasos en el Canal de Nerdearla Youtube
-
Campo de Entrada para Preguntas:
- El usuario puede ingresar preguntas relacionadas con los workshops disponibles en Nerdearla 2024, como por ejemplo: "Soy programador y me interesa la inteligencia artificial generativa, ¿qué workshops de Nerdearla 2024 me recomiendas?"
- Este campo es dinámico, permitiendo al usuario formular cualquier tipo de consulta que le ayude a encontrar workshops relevantes.
- Permite hacerlo altamente personalizable, muy rápidamente.
-
Integración de Contexto:
- La aplicación permite activar o desactivar la funcionalidad Contexto mediante un toggle.
- Contexto activado: La pregunta del usuario se enriquece con información relevante obtenida de un conjunto de documentos predefinidos (
workshops.json
), lo que mejora la precisión de las respuestas, y, (user.json
), lo que da una experiencia más personalizada. - Contexto desactivado: La pregunta del usuario se envía directamente al modelo de lenguaje sin ninguna modificación o enriquecimiento.
-
Modelo de Lenguaje:
- La aplicación se apoya en LLAMA 3.1, un modelo de lenguaje basado en inteligencia artificial generativa para generar respuestas a las preguntas de los usuarios.
- Este modelo es utilizado para interpretar la pregunta del usuario y generar una recomendación de workshop que se ajuste a sus intereses.
-
Interfaz de Usuario Interactiva:
- La aplicación se construye con Streamlit, lo que permite una experiencia interactiva y fácil de usar.
- Los usuarios pueden escribir preguntas, activar/desactivar la funcionalidad Contexto y recibir respuestas instantáneas.
-
Manejo de Errores:
- En caso de que haya un error durante la generación de la respuesta, como una solicitud fallida al modelo de lenguaje, la aplicación maneja el error mostrando mensajes claros al desarrollador entienda que sucede.
Puedes acceder a OCI aquí y crear una cuenta gratuita con $300 en créditos universales. Sigue este tutorial de YouTube para guiarte en el proceso.
Tiempo estimado: 10 minutos
- Configurar Visual Studio Code para desarrollo remoto
- Generar una clave SSH usando PowerShell
- Descarga e instala Visual Studio Code.
- Abre Visual Studio Code e instala las siguientes extensiones:
- Abre PowerShell: Presiona
Win + X
y selecciona Windows PowerShell o Windows Terminal. - Ejecuta el siguiente comando para generar una clave SSH:
ssh-keygen -t ed25519
- Presiona Enter para aceptar la ubicación predeterminada:
C:\Users\TuNombreDeUsuario\.ssh\id_rsa
- Se crearán dos archivos en
~/.ssh/
:id_ed25519
: Tu clave privada (guárdala de forma segura).id_ed25519.pub
: Tu clave pública (esta se compartirá para autenticarte).
Tiempo estimado: 10 minutos
- En el panel de OCI, navega a Identity & Security > Compartimientos.
- Haz clic en Crear Compartimiento y asígnale un nombre (por ejemplo,
compartimiento-ai
).
- En el panel de OCI, navega a Redes > Redes Virtuales en la Nube (VCN).
- Haz clic en Crear VCN.
- Asigna un nombre a la VCN (por ejemplo,
vcn-ai-engineering
). - Selecciona VCN con Internet Gateway y subred pública.
- Revisa la configuración y haz clic en Crear.
- Navega a Instancias de cómputo > Crear Instancia.
- Asigna un nombre (ejemplo:
vm-ubuntu-22-04-minimal
). - Selecciona la forma
VM.Standard.A1.Flex
(disponible en la capa gratuita). - Elige Ubuntu 22.04 Minimal (aarch64) como sistema operativo.
- Configura 1 OCPU (Equivale a 2VCPU) y 8 GB de memoria.
- Selecciona la subred pública de la VCN creada previamente.
- Carga tu clave pública
id_ed25519.pub
generada en el paso anterior. - Haz clic en Crear.
- Navega a Analytics & AI > Generative AI.
- En el Playground revisa los
modelos
disponibles, entre ellosmeta.llama-3.1-70b-instruct
- Haz una prueba con el chat
- Revisa el Código en Python
- Abre VS Code y abre la paleta de comandos (
Ctrl + Shift + P
). - Escribe
Remote-SSH: Add New SSH Host...
y selecciona esta opción. - Ingresa la dirección del host en formato
usuario@direccion_ip
, por ejemplo,ubuntu@123.45.67.89
. - Abre nuevamente la paleta de comandos, escribe
Remote-SSH: Connect to Host...
y selecciona el host configurado. - Abre la carpeta del proyecto en la VM desde Archivo > Abrir Carpeta... y navega a la carpeta deseada.
- Una vez conectado a la VM, actualiza los repositorios e instala las librerías necesarias:
sudo apt update sudo apt install -y git python3-pip
- Verifica la versión de python:
python3 --version #Python 3.10.12
- Verifica la instalación de
pip
:pip3 --version #22.0.2
- Instala las librerías necesarias para tu proyecto:
pip3 install oci==2.135.0 python-dotenv==1.0.1 streamlit==1.38.0
- Abre Visual Studio Code e instala las siguientes extensiones:
Crea una nueva carpeta:
mkdir nerdapp
Y abrela desde el explorador.
Tiempo estimado: 10 minutos
Antes de desplegar la aplicación, es importante que la estructura de archivos sea correcta. A continuación, se muestra cómo debe estar organizada:
- db/: Contiene los documentos necesarios para el proceso de recuperación de información.
- .env: Archivo donde se almacenan las variables de entorno, como claves API.
- app.py: El archivo principal de la aplicación, donde se define la lógica y la interfaz de usuario utilizando Streamlit.
- llm.py: Módulo que gestiona las interacciones con los modelos de lenguaje.
- context.py: Módulo para la recuperación de contexto.
Para desplegar tu aplicación con Streamlit, ejecuta el siguiente comando en la VM:
streamlit run app.py
# python3 -m streamlit run app.py
Para que nuestra VM pueda "autenticarse" y utilizar otros recursos en la nube, necesitamos crear un grupo dinámico:
- En el menú de OCI, navega a Identity & Security > Domains > Default > Grupos Dinámicos.
- Haz clic en Crear Grupo Dinámico.
- Asigna un nombre (ejemplo:
grupo-ai-engineering
). - Define una regla para incluir las instancias, por ejemplo:
Reemplaza
ANY {instance.compartment.id = 'ocid1.compartment.oc1..exampleuniqueID'}
'ocid1.compartment.oc1..exampleuniqueID'
con el OCID de tu compartimiento.
- Navega a Identity & Security > Policies.
- En el compartimiento raíz, crea una nueva política
genai-dynamic-policies
con las siguientes declaraciones:ReemplazaAllow dynamic-group [Nombre-del-Grupo-Dinámico] to use generative-ai-family in compartment [Nombre-del-Compartimiento]
[Nombre-del-Grupo-Dinámico]
y[Nombre-del-Compartimiento]
por los nombres correspondientes.
Para desplegar tu aplicación con Streamlit, ejecuta el siguiente comando en la VM:
streamlit run app.py
# python3 -m streamlit run app.py
Y haz tus preguntas:
- Soy programador y me interesa la inteligencia artificial generativa, ¿qué workshops de Nerdearla 2024 me recomiendas?
- ¿Algún Workshop cambio de Horario?
- ¿A que workshops puedo asistir hoy?
- Usar el stream de OCI Generative AI Inference
- Explora más la capa gratuita de OCI - https://www.oracle.com/es/cloud/free/
- Usar RAG con una base de datos vectorial para que sea más rápido y use menos tokens.
- Usar tu propio modelo llama 3.1 8B