AI Engineering en la Nube - Primeros Pasos

Esta guía te llevará a través del proceso de desarrollo y despliegue en Oracle Cloud Infrastructure (OCI) para construir tu primera aplicación utilizando modelos fundacionales como LLAMA 3.1, prompt engineering, y contexto, aprovechando principalmente la capa gratuita de OCI.

Esta aplicación está diseñada para ayudar a los asistentes de Nerdearla 2024 a obtener recomendaciones personalizadas sobre los workshops, basándose en sus intereses y preguntas. Utiliza un enfoque híbrido de búsqueda de información Contexto y generación de texto con un modelo de lenguaje grande, en este caso LLAMA 3.1 proporcionado por Oracle Cloud Infrastructure (OCI).

Materiales

AI Engineering en la Nube - Primeros Pasos presentacion
Repositorio - Selecciona la rama main en github
Template - selecciona la rama template en github
AI Engineering en la nube: Primeros Pasos en el Canal de Nerdearla Youtube

Principales Características

Campo de Entrada para Preguntas:
- El usuario puede ingresar preguntas relacionadas con los workshops disponibles en Nerdearla 2024, como por ejemplo: "Soy programador y me interesa la inteligencia artificial generativa, ¿qué workshops de Nerdearla 2024 me recomiendas?"
- Este campo es dinámico, permitiendo al usuario formular cualquier tipo de consulta que le ayude a encontrar workshops relevantes.
- Permite hacerlo altamente personalizable, muy rápidamente.
Integración de Contexto:
- La aplicación permite activar o desactivar la funcionalidad Contexto mediante un toggle.
- Contexto activado: La pregunta del usuario se enriquece con información relevante obtenida de un conjunto de documentos predefinidos (workshops.json), lo que mejora la precisión de las respuestas, y, (user.json), lo que da una experiencia más personalizada.
- Contexto desactivado: La pregunta del usuario se envía directamente al modelo de lenguaje sin ninguna modificación o enriquecimiento.
Modelo de Lenguaje:
- La aplicación se apoya en LLAMA 3.1, un modelo de lenguaje basado en inteligencia artificial generativa para generar respuestas a las preguntas de los usuarios.
- Este modelo es utilizado para interpretar la pregunta del usuario y generar una recomendación de workshop que se ajuste a sus intereses.
Interfaz de Usuario Interactiva:
- La aplicación se construye con Streamlit, lo que permite una experiencia interactiva y fácil de usar.
- Los usuarios pueden escribir preguntas, activar/desactivar la funcionalidad Contexto y recibir respuestas instantáneas.
Manejo de Errores:
- En caso de que haya un error durante la generación de la respuesta, como una solicitud fallida al modelo de lenguaje, la aplicación maneja el error mostrando mensajes claros al desarrollador entienda que sucede.

Puedes acceder a OCI aquí y crear una cuenta gratuita con $300 en créditos universales. Sigue este tutorial de YouTube para guiarte en el proceso.

1. Configuración del Entorno de Desarrollo

Tiempo estimado: 10 minutos

Objetivos

Configurar Visual Studio Code para desarrollo remoto
Generar una clave SSH usando PowerShell

1.1. Instalar Visual Studio Code

Descarga e instala Visual Studio Code.
Abre Visual Studio Code e instala las siguientes extensiones:
- Remote - SSH

1.2. Generar una clave SSH usando PowerShell

Abre PowerShell: Presiona Win + X y selecciona Windows PowerShell o Windows Terminal.
Ejecuta el siguiente comando para generar una clave SSH:
```
ssh-keygen -t ed25519
```
Presiona Enter para aceptar la ubicación predeterminada:
C:\Users\TuNombreDeUsuario\.ssh\id_rsa
Se crearán dos archivos en ~/.ssh/:
- id_ed25519: Tu clave privada (guárdala de forma segura).
- id_ed25519.pub: Tu clave pública (esta se compartirá para autenticarte).

2. Configuración en OCI

Tiempo estimado: 10 minutos

2.1. Crear un Compartimiento

En el panel de OCI, navega a Identity & Security > Compartimientos.
Haz clic en Crear Compartimiento y asígnale un nombre (por ejemplo, compartimiento-ai).

2.2. Crear una Red Virtual (VCN)

En el panel de OCI, navega a Redes > Redes Virtuales en la Nube (VCN).
Haz clic en Crear VCN.
Asigna un nombre a la VCN (por ejemplo, vcn-ai-engineering).
Selecciona VCN con Internet Gateway y subred pública.
Revisa la configuración y haz clic en Crear.

2.3. Crear una VM Ubuntu 22.04 Minimal

Navega a Instancias de cómputo > Crear Instancia.
Asigna un nombre (ejemplo: vm-ubuntu-22-04-minimal).
Selecciona la forma VM.Standard.A1.Flex (disponible en la capa gratuita).
Elige Ubuntu 22.04 Minimal (aarch64) como sistema operativo.
Configura 1 OCPU (Equivale a 2VCPU) y 8 GB de memoria.
Selecciona la subred pública de la VCN creada previamente.
Carga tu clave pública id_ed25519.pub generada en el paso anterior.
Haz clic en Crear.

2.4. Explorar el Servicio de Generative AI

Navega a Analytics & AI > Generative AI.
En el Playground revisa los modelos disponibles, entre ellos meta.llama-3.1-70b-instruct
Haz una prueba con el chat
Revisa el Código en Python

3. Conectar a la VM con Visual Studio Code

Abre VS Code y abre la paleta de comandos (Ctrl + Shift + P).
Escribe Remote-SSH: Add New SSH Host... y selecciona esta opción.
Ingresa la dirección del host en formato usuario@direccion_ip, por ejemplo, ubuntu@123.45.67.89.
Abre nuevamente la paleta de comandos, escribe Remote-SSH: Connect to Host... y selecciona el host configurado.
Abre la carpeta del proyecto en la VM desde Archivo > Abrir Carpeta... y navega a la carpeta deseada.

4. Instalar en la Máquina Virtual

4.1. Instalar Dependencias

Una vez conectado a la VM, actualiza los repositorios e instala las librerías necesarias:
```
sudo apt update
sudo apt install -y git python3-pip
```
Verifica la versión de python:
```
python3 --version #Python 3.10.12
```
Verifica la instalación de pip:
```
pip3 --version #22.0.2
```

Instala las librerías necesarias para tu proyecto:

pip3 install oci==2.135.0 python-dotenv==1.0.1 streamlit==1.38.0

4.2. Instalar Extensiones de Visual Studio Code

Abre Visual Studio Code e instala las siguientes extensiones:
- Python

5. Estructura de Archivos del Proyecto

Crea una nueva carpeta:

mkdir nerdapp

Y abrela desde el explorador.

Tiempo estimado: 10 minutos

Antes de desplegar la aplicación, es importante que la estructura de archivos sea correcta. A continuación, se muestra cómo debe estar organizada:

Descripción de los archivos clave

db/: Contiene los documentos necesarios para el proceso de recuperación de información.
.env: Archivo donde se almacenan las variables de entorno, como claves API.
app.py: El archivo principal de la aplicación, donde se define la lógica y la interfaz de usuario utilizando Streamlit.
llm.py: Módulo que gestiona las interacciones con los modelos de lenguaje.
context.py: Módulo para la recuperación de contexto.

Para desplegar tu aplicación con Streamlit, ejecuta el siguiente comando en la VM:

streamlit run app.py 
# python3 -m streamlit run app.py

6. Crear un Grupo Dinámico

Para que nuestra VM pueda "autenticarse" y utilizar otros recursos en la nube, necesitamos crear un grupo dinámico:

En el menú de OCI, navega a Identity & Security > Domains > Default > Grupos Dinámicos.
Haz clic en Crear Grupo Dinámico.
Asigna un nombre (ejemplo: grupo-ai-engineering).
Define una regla para incluir las instancias, por ejemplo:
```
ANY {instance.compartment.id = 'ocid1.compartment.oc1..exampleuniqueID'}   
```
Reemplaza 'ocid1.compartment.oc1..exampleuniqueID' con el OCID de tu compartimiento.

2.5. Crear una Política

Navega a Identity & Security > Policies.
En el compartimiento raíz, crea una nueva política genai-dynamic-policies con las siguientes declaraciones:
```
Allow dynamic-group [Nombre-del-Grupo-Dinámico] to use generative-ai-family in compartment [Nombre-del-Compartimiento]
```
Reemplaza [Nombre-del-Grupo-Dinámico] y [Nombre-del-Compartimiento] por los nombres correspondientes.

6. Desplegar la Aplicación

Para desplegar tu aplicación con Streamlit, ejecuta el siguiente comando en la VM:

streamlit run app.py 
# python3 -m streamlit run app.py

Y haz tus preguntas:

Soy programador y me interesa la inteligencia artificial generativa, ¿qué workshops de Nerdearla 2024 me recomiendas?
¿Algún Workshop cambio de Horario?
¿A que workshops puedo asistir hoy?

7. ¿Que sigue?

Usar el stream de OCI Generative AI Inference
Explora más la capa gratuita de OCI - https://www.oracle.com/es/cloud/free/
Usar RAG con una base de datos vectorial para que sea más rápido y use menos tokens.
- AI Chatbot engine with Oracle Database 23ai and OCI Generative AI Services
Usar tu propio modelo llama 3.1 8B

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
db		db
.env		.env
.gitignore		.gitignore
README.md		README.md
app.py		app.py
context.py		context.py
demo.gif		demo.gif
image.png		image.png
llm.py		llm.py
presentacion.pdf		presentacion.pdf
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AI Engineering en la Nube - Primeros Pasos

Materiales

Principales Características

1. Configuración del Entorno de Desarrollo

Objetivos

1.1. Instalar Visual Studio Code

1.2. Generar una clave SSH usando PowerShell

2. Configuración en OCI

2.1. Crear un Compartimiento

2.2. Crear una Red Virtual (VCN)

2.3. Crear una VM Ubuntu 22.04 Minimal

2.4. Explorar el Servicio de Generative AI

3. Conectar a la VM con Visual Studio Code

4. Instalar en la Máquina Virtual

4.1. Instalar Dependencias

4.2. Instalar Extensiones de Visual Studio Code

5. Estructura de Archivos del Proyecto

Descripción de los archivos clave

6. Crear un Grupo Dinámico

2.5. Crear una Política

6. Desplegar la Aplicación

7. ¿Que sigue?

8. Referencias

About

Releases

Packages

Languages

pavelsjo/ai-engineering-en-la-nube-primeros-pasos

Folders and files

Latest commit

History

Repository files navigation

AI Engineering en la Nube - Primeros Pasos

Materiales

Principales Características

1. Configuración del Entorno de Desarrollo

Objetivos

1.1. Instalar Visual Studio Code

1.2. Generar una clave SSH usando PowerShell

2. Configuración en OCI

2.1. Crear un Compartimiento

2.2. Crear una Red Virtual (VCN)

2.3. Crear una VM Ubuntu 22.04 Minimal

2.4. Explorar el Servicio de Generative AI

3. Conectar a la VM con Visual Studio Code

4. Instalar en la Máquina Virtual

4.1. Instalar Dependencias

4.2. Instalar Extensiones de Visual Studio Code

5. Estructura de Archivos del Proyecto

Descripción de los archivos clave

6. Crear un Grupo Dinámico

2.5. Crear una Política

6. Desplegar la Aplicación

7. ¿Que sigue?

8. Referencias

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages