🤖 Nuestro objetivo es establecer y cultivar una colección integral de proyectos, demostrando la notable versatilidad y potencial de las aplicaciones de LLM.
- 🦄LLMs
- 🏆 Tabla de clasificación de benchmarks
- 💬ChatBot
- 🗣️Voz
- 🎵Música
- 🌄Imagen
- 🧸Modelo 3D
- 🎥Video
- 🕸️Motor de búsqueda
- 👩🏽💻Asistente de desarrollo
- 🧠Agente de IA
- 🤼Colaboración multiagente
- 💻Terminal
- 📰Sitios web
- 🗜️Hardware
- ⌨️Ingeniería de prompts
- 🤯Inferencia y servicio de LLMs
- 💡Productividad
- 📋Otros
*
, significa que el proyecto no es de código abierto ni ha lanzado ninguna aplicación aún.
- Command-R: Command-R es un modelo generativo escalable dirigido a RAG y uso de herramientas para habilitar IA a escala de producción para empresas.
- Grok-1: Grok-1 es un modelo de mezcla de expertos de 314 mil millones de parámetros entrenado desde cero por xAI.
- Mistral: Mistral AI lanza LLMs de código abierto, incluyendo Mistral 7B, Mistral 8x7B y Codestral.
- DBRX: DBRX es un LLM abierto y de propósito general creado por Databricks.
- mPLUG-DocOwl: Modelo de lenguaje grande multimodal modularizado para la comprensión de documentos.
- OpenChat: Avanzando en modelos de lenguaje de código abierto con datos imperfectos
- WizardLM: Potenciando modelos de lenguaje preentrenados grandes para seguir instrucciones complejas
- CodeGemma-7b: Un lanzamiento oficial de Google para LLMs de código.
- Awesome-Chinese-LLM: Incluye muchos LLMs chinos de código abierto.
- llama3: Meta lanza nuevos LLMs.
- Snowflake Arctic: Arctic es una arquitectura híbrida de transformador denso-MoE preentrenada desde cero por el equipo de investigación de IA de Snowflake. Tomando un promedio de codificación (HumanEval+ y MBPP+), generación de SQL (Spider) y seguimiento de instrucciones (IFEval).
- DeepSeek-V2-Chat: Un modelo de lenguaje de mezcla de expertos fuerte, económico y eficiente
- Qwen 1.8B,7B,14B,72B: Modelo de lenguaje grande de chat y preentrenado propuesto por Alibaba Cloud.
- Granite Code Models 3b,8b,20b,34b: Granite Code Models, modelos de código de código abierto de IBM: Una familia de modelos de base abierta para la inteligencia de código
- Hunyuan-DiT: Un transformador de difusión multirresolución poderoso con comprensión detallada del chino
- MiniCPM-V 2.0: Un modelo grande multimodal eficiente en el lado final con capacidades fuertes de OCR y comprensión
- Stable Audio Open 1.0: Stable Audio Open 1.0 genera audio estéreo de longitud variable (hasta 47s) a 44.1kHz a partir de indicaciones de texto.
- Qwen2-0.5B, Qwen2-1.5B, Qwen2-7B, Qwen2-57B-A14B, and Qwen2-72B: Qwen2 es la serie de modelos de lenguaje grande desarrollada por el equipo de Qwen, Alibaba Cloud.
- GLM-4-9B: Serie GLM-4: Modelos de chat multimodal multilingües abiertos
- AutoCoder: Un nuevo modelo diseñado para la tarea de generación de código. Su precisión de prueba en el conjunto de datos base HumanEval supera la de GPT-4 Turbo (abril de 2024) y GPT-4o.
- Nemotron 4 340B: Los modelos abiertos de Nvidia para la generación de datos sintéticos (SDG). Incluye modelos base, de instrucción y de recompensa.
- Fish Speech V1.2: Fish Speech V1.2 es un modelo líder de texto a voz (TTS) entrenado con 300k horas de datos de audio en inglés, chino y japonés.
- Phi-3 family: Familia Phi-3 de modelos de lenguaje y multimodales pequeños. Los modelos de lenguaje están disponibles en longitudes de contexto cortas y largas.
- Gemma 2: Gemma 2 ofrece un rendimiento de primera clase, se ejecuta a una velocidad increíble en diferentes hardware y se integra fácilmente con otras herramientas de IA.
- open_llm_leaderboard: Esta es la organización central (HuggingFace) que mantiene la tabla de clasificación de LLMs abiertos.
- LMSys Chatbot Arena Leaderboard: Una plataforma de batalla aleatoria basada en crowdsourcing. Utiliza los votos de los usuarios para calcular las calificaciones Elo.
- META Leaderboard: Tabla de clasificación del Benchmark de Embedding de Texto Masivo (MTEB).
- LLM-Perf Leaderboard: Tiene como objetivo evaluar el rendimiento (latencia, rendimiento y memoria) de los LLMs con diferentes hardware, backends y optimizaciones utilizando Optimum-Benchmark y sabores de Optimum.
- Big Code Models Leaderboard: Compara el rendimiento de los modelos de generación de código multilingües base en el benchmark HumanEval y MultiPL-E.
- Open ASR Leaderboard: Clasifica y evalúa modelos de reconocimiento de voz en el Hugging Face Hub.
- Toolbench Leaderboard: Una evaluación de las capacidades de manipulación de herramientas de los LLMs.
- OpenCompass 2.0 LLM Leaderboard: Proporciona puntuaciones y clasificaciones completas, objetivas y neutrales para los modelos de lenguaje grande y multimodal de primer nivel.
- Open Ko-LLM Leaderboard: Evalúa el rendimiento del modelo de lenguaje grande coreano (LLM).
- ChatGPT: ChatGPT es un sistema de IA gratuito. Úsalo para conversaciones atractivas, obtener información, automatizar tareas y presenciar el futuro de la IA, todo en un solo lugar.
- Gemini: Bard ahora es Gemini. Obtén ayuda con la escritura, planificación, aprendizaje y más de Google AI.
- character.ai: ¡Donde viven los agentes inteligentes!
- Claude: Habla con Claude, un asistente de IA de Anthropic.
- Mistral AI: Mistral hace que la IA de vanguardia sea ubicua y proporciona IA a medida para todos los constructores.
Incluyendo texto a voz, voz a texto, voz a voz, generar voz:
- *Vall-E: Un modelo de lenguaje de códec neural para la síntesis de voz.
- ElevenLabs: Generador de voz AI y texto a voz
- Whisper: Reconocimiento de voz robusto a través de supervisión débil a gran escala
- Krisp: Krisp cancela el ruido de fondo y reduce el eco durante tus llamadas.
- Voicemod: Voicemod es un cambiador de voz en tiempo real gratuito y una tabla de sonidos disponible tanto en Windows como en macOS.
- *NaturalSpeech 3: Síntesis de voz de cero disparos con modelos de códec y difusión factorizados.
- VoiceCraft: VoiceCraft es edición de voz de cero disparos y texto a voz en la naturaleza.
- Parler-TTS: Parler-TTS es un modelo de texto a voz (TTS) ligero que puede generar voz de alta calidad y sonido natural en el estilo de un hablante dado (género, tono, estilo de habla, etc.).
- Sounds: Sonidos para creadores, desarrolladores de juegos, artistas, creadores de videos. Experimenta el mejor generador de efectos de sonido AI
- VIVA: VIVA es la plataforma de diseño visual creativo impulsada por IA
- ChatTTS: ChatTTS es un modelo de voz generativa para el diálogo diario.
- StreamSpeech: StreamSpeech es un modelo sin fisuras "todo en uno" para el reconocimiento de voz, la traducción de voz y la síntesis de voz simultáneos y fuera de línea.
- Dream Machine: Dream Machine es un modelo de IA que crea videos de alta calidad y realistas rápidamente a partir de texto e imágenes.
- CosyVoice: Modelo de generación de voz grande multilingüe, que proporciona capacidad de pila completa para inferencia, entrenamiento y despliegue.
- Suno: Suno es una herramienta innovadora diseñada para la creación de música, aprovechando la inteligencia artificial para transformar la entrada de texto en canciones originales
- Udio: Haz tu música. Descubre, crea y comparte música con el mundo.
- Haimian Music: Un producto de música generada por IA de ByteDance, que ofrece una calidad vocal superior en chino e inglés.
- Jamboss: Jamboss es una aplicación de generación de música AI súper simple que te permite convertir tus ideas y letras en canciones completas increíbles.
Incluyendo texto a imagen, imagen a imagen y animar:
- DALL-E: Creando imágenes a partir de texto.
- Stable Diffusion: Stable Diffusion es un modelo de aprendizaje profundo de texto a imagen.
- Midjourney: Midjourney es un programa y servicio de inteligencia artificial generativa que crea imágenes a partir de descripciones en lenguaje natural, similar a otras tecnologías de IA como DALL-E de OpenAI y Stable Diffusion de Stability AI.
- StickerBaker: StickerBaker es una herramienta de código abierto que permite a los usuarios crear pegatinas utilizando tecnología de IA.
- *PIXART-Σ: Entrenamiento de débil a fuerte del transformador de difusión para la generación de imágenes 4K a partir de texto.
- ResAdapter: ResAdapter es un adaptador de resolución plug-and-play para permitir que los modelos de difusión de dominios de estilo arbitrarios generen imágenes sin resolución: sin entrenamiento adicional, sin inferencia adicional y sin transferencia de estilo.
- FaceChain: FaceChain es una cadena de herramientas de aprendizaje profundo para generar tu gemelo digital.
- APISR: Superresolución de anime del mundo real inspirada en la producción de anime (CVPR 2024)
- OMG: Occlusion-friendly Personalized Multi-concept Generation In Diffusion Models: OMG es un marco para la generación de imágenes de múltiples conceptos
- BasicPBC: Aprendizaje de coincidencia de inclusión para la colorización de cubos de pintura de animación.
- DesignEdit: Descomposición y fusión latente en múltiples capas para la edición de imágenes unificada y precisa.
- VAR: un nuevo método de generación visual que eleva los modelos de estilo GPT más allá de la difusión y se observan leyes de escalado.
- Ideogram: Ideogram es una herramienta de IA gratuita que genera imágenes realistas, carteles, logotipos y más.
- MagicClothing: Enfocado en la síntesis de imágenes impulsada por prendas controlables.
- *IntrinsicAnything: Aprendizaje de priors de difusión para la renderización inversa bajo iluminación desconocida.
- HeyBeauty: Descubre la belleza con IA, redefine la moda.
- IC-Light: IC-Light es un proyecto para manipular la iluminación de las imágenes.
- Logo Diffusion: Crea logotipos en segundos con IA generativa.
- MistoLine: Un modelo SDXL-ControlNet versátil y robusto para la adaptación de arte lineal
- InstaDrag: Edición de imágenes basada en arrastrar emergente de videos
- Omost: Omost es un proyecto para convertir la capacidad de codificación de LLM en capacidad de generación de imágenes (o más precisamente, capacidad de composición de imágenes).
- ToonCrafter: ToonCrafter puede interpolar dos imágenes de dibujos animados aprovechando los priors de difusión de imagen a video preentrenados.
- Hallo: Síntesis visual impulsada por audio jerárquica para la animación de imágenes de retratos
- UniAnimate: Domando modelos de difusión de video unificados para la animación consistente de imágenes humanas.
- Krea: Genera y mejora imágenes y videos utilizando IA poderosa de forma gratuita.
- Leonardo AI: Leonardo AI es una herramienta de IA generativa que te permite crear activos visuales de primer nivel para tus proyectos.
- MimicBrush: Edición de imágenes de cero disparos con imitación de referencia
- SketchDeco: Decoración de bocetos en blanco y negro con color.
- Tensor.Art: Plataforma de intercambio de modelos de IA, ejecuta modelos en línea para generar imágenes y entrenar modelos de forma gratuita.
- AutoStudio: AutoStudio: Creación de sujetos consistentes en la generación de imágenes interactiva de múltiples turnos
- LivePortrait: Animación de retratos eficiente con control de costura y retargeting
- IMAGDressing: Generación de prendas modulares interactivas para vestir virtualmente
- PaintsUndo: Un modelo base de comportamientos de dibujo en pinturas digitales
Incluyendo texto a modelo 3D:
- TripoSR: TripoSR es un modelo generativo 3D rápido y de avance desarrollado en colaboración entre Stability AI y Tripo AI.
- PantoMatrix: PantoMatrix: Generación de animación de cara y cuerpo
- Gaussian Head Avatar: Avatar de cabeza de ultra alta fidelidad a través de Gaussians dinámicos.
- *Make-It-Vivid: Vestir a tus personajes de dibujos animados bípedos animables a partir de texto.
- *CAT3D: CAT3D: Crear cualquier cosa en 3D con modelos de difusión de múltiples vistas
- DiffTF: Modelo de difusión 3D de gran vocabulario con transformador
- DreamMat: Generación de materiales PBR de alta calidad con modelos de difusión conscientes de la geometría y la luz
- Unique3D: Generación de mallas 3D de alta calidad y eficiente a partir de una sola imagen.
- Era3D: Difusión de múltiples vistas de alta resolución utilizando atención eficiente por filas.
- *OccFusion: Renderización de humanos ocultos con priors de difusión generativa
- AIUNI: IA genera activos únicos, avatares, animación.
- MeshFormer: Generación de mallas de alta calidad con modelo de reconstrucción guiado en 3D
Incluyendo texto a video, imagen a video, video a video:
- *Sora: Creando video a partir de texto. Sora es un modelo de IA que puede crear escenas realistas e imaginativas a partir de instrucciones de texto.
- *Emote Portrait Alive: Generación de videos de retratos expresivos con modelo de difusión Audio2Video bajo condiciones débiles
- Runway: Runway es una empresa de investigación aplicada en IA que da forma a la próxima era del arte, el entretenimiento y la creatividad humana.
- HeyGen: HeyGen es una plataforma de video innovadora que aprovecha el poder de la IA generativa para simplificar tu proceso de creación de videos.
- AniPortrait: Síntesis de animaciones de retratos fotorrealistas impulsadas por audio
- MuseV: Generación de videos de humanos virtuales de longitud infinita y alta fidelidad con desnoising paralelo condicionado visualmente.
- CameraCtrl: Habilitando el control de la cámara para la generación de video a partir de texto.
- Pika: Pika es la plataforma de idea a video que pone en movimiento tu creatividad.
- *VASA-1: Caras parlantes impulsadas por audio realistas generadas en tiempo real.
- OpenVoice: Clonación de voz instantánea por MyShell.
- Veo: Veo es el modelo de generación de video más capaz de Google hasta la fecha.
- AniTalker: Animar caras parlantes vívidas y diversas a través de codificación de movimiento facial desacoplado de identidad
- Pandora: Hacia un modelo mundial general con acciones de lenguaje natural y estados de video
- EasyAnimate: Una solución de extremo a extremo para la generación de videos de alta resolución y larga duración basada en la difusión de transformadores.
- V-Express: V-Express tiene como objetivo generar un video de cabeza parlante bajo el control de una imagen de referencia, un audio y una secuencia de imágenes V-Kps.
- MusePose: Un marco de imagen a video impulsado por pose para la generación de humanos virtuales
- Hedra: Hedra es una plataforma de generación de contenido de video y una plataforma de redes sociales que permite a las personas editar, exportar y compartir videos generados por IA y componentes de video.
- MASA: Emparejamiento de cualquier cosa segmentando cualquier cosa
- MotionClone: Clonación de movimiento sin entrenamiento para la generación de video controlable
- MimicMotion: Generación de video de movimiento humano de alta calidad con guía de pose consciente de la confianza
- Video-Infinity: Video-Infinity genera videos largos rápidamente utilizando múltiples GPU sin entrenamiento adicional.
- DiffSynth Studio: DiffSynth Studio es un motor de difusión.
- SAM 2: Segment Anything Model 2 (SAM 2) es un modelo base hacia la solución de segmentación visual con indicaciones en imágenes y videos.
Incluyendo motor de búsqueda, navegador web:
- Phind: navegador web, para generar respuestas basadas en resultados de búsqueda web y LLMs, también para proporcionar funcionalidad personalizable para ajustar el peso de las fuentes de resultados de búsqueda
- Devv: El motor de búsqueda AI de próxima generación para desarrolladores. Resuelve tus problemas de programación en segundos.
- Perplexity: Perplexity AI desbloquea el poder del conocimiento con el descubrimiento y la compartición de información.
- Arc: Organiza sin esfuerzo todo lo que haces en línea: trabajo, estudio, pasatiempos, todo en una ventana con Espacios y Perfiles.
- Perplexica: Perplexica es un motor de búsqueda impulsado por IA. Es una alternativa de código abierto a Perplexity AI
- Reor: Aplicación de gestión de conocimiento personal AI privada y fuera de línea.
- GitHub Copilot: Obtén sugerencias basadas en IA en tiempo real.
- Codeium: Codeium ofrece la mejor finalización de código AI, búsqueda y chat, todo de forma gratuita. Soporta más de 70 idiomas e integra con tus IDEs favoritos, con velocidades ultrarrápidas y calidad de sugerencias de vanguardia.
- Amazon CodeWhisperer: Amazon CodeWhisperer es una herramienta de productividad impulsada por IA para el IDE y la línea de comandos que genera sugerencias de código basadas en comentarios y código existente.
- Transformer Debugger: Transformer Debugger (TDB) es una herramienta desarrollada por el equipo de Superalignment de OpenAI con el objetivo de apoyar investigaciones sobre comportamientos específicos de modelos de lenguaje pequeños. La herramienta combina técnicas de interpretabilidad automatizada con autoencoders dispersos.
- CopilotKit: Un marco para construir copilotos AI personalizados 🤖 chatbots AI en la aplicación, agentes AI en la aplicación y áreas de texto impulsadas por IA.
- Codium: La primera herramienta de CodiumAI es una extensión de IDE que interactúa con el desarrollador para generar pruebas significativas y explicaciones de código para desarrolladores ocupados.
- Tabby: Asistente de codificación AI autohospedado
- CodeRabbit: CodeRabbit es una plataforma innovadora de revisión de código AI que simplifica y mejora el proceso de desarrollo.
- Cursor: El editor de código AI.
- Melty: Melty es el primer editor de código AI que está al tanto de lo que estás haciendo desde la terminal hasta GitHub, y colabora contigo para escribir código listo para producción.
- AgentGPT: Ensambla, configura y despliega agentes AI autónomos en tu navegador.
- *Devin: Presentamos a Devin, el primer ingeniero de software AI y estableciendo un nuevo estado del arte en el benchmark de codificación SWE-bench.
- OpenDevin: Un ingeniero de software AI autónomo que es capaz de ejecutar tareas de ingeniería complejas y colaborar activamente con los usuarios en proyectos de desarrollo de software.
- Plandex: Un motor de codificación AI para tareas complejas.
- Devika: un ingeniero de software AI agentic que puede entender instrucciones humanas de alto nivel, desglosarlas en pasos, investigar información relevante y escribir código para lograr el objetivo dado.
- Aider: Aider es programación en pareja AI en tu terminal.
- Agent Protocol: Una interfaz común única para comunicarse con agentes
- Devon: Un programador en pareja de código abierto
- PR-Agent: CodiumAI PR-Agent: Una herramienta impulsada por IA para el análisis automatizado de pull requests, comentarios, sugerencias y más.
- FinRobot: Una plataforma de agentes AI de código abierto para aplicaciones financieras utilizando LLMs
- AgentQL: Construye agentes AI utilizando un lenguaje de consulta para la automatización precisa de la web y aplicaciones
- Husky: Un agente de lenguaje unificado y de código abierto para el razonamiento de múltiples pasos
- Translation Agent: Traducción agentic utilizando flujo de trabajo de reflexión
- DigiRL: Entrenamiento de agentes de control de dispositivos en la naturaleza con refuerzo autónomo
- MetaGPT: MetaGPT toma un requisito de una línea como entrada y produce historias de usuario / análisis competitivo / requisitos / estructuras de datos / API / documentos, etc.
- ChatDev: El objetivo principal de ChatDev es ofrecer un marco fácil de usar, altamente personalizable y extensible, que se basa en modelos de lenguaje grande (LLMs) y sirve como un escenario ideal para estudiar la inteligencia colectiva.
- TransAgents: Multi-Agente para traducir textos literarios ultra largos
- Warp: Warp es una herramienta diseñada para mejorar la experiencia del terminal al proporcionar asistencia impulsada por IA para búsquedas de comandos y permitir a los usuarios ingresar sus objetivos en inglés simple
- Gorilla: Gorilla CLI potencia tus interacciones en la línea de comandos con una herramienta centrada en el usuario.
- CodeWhisperer Cli: CodeWhisperer para la línea de comandos agrega completaciones de estilo IDE para cientos de CLIs populares como Git, npm, Docker, MongoDB Atlas y AWS CLI. Anteriormente conocido como fig.
- Open Interpreter: Una interfaz de lenguaje natural para computadoras.
- Dora: Diseña y publica sitios web impresionantes en 3D y animados sin esfuerzo, sin necesidad de codificación.
- Design2Code: Qué tan lejos estamos de automatizar la ingeniería de front-end
- Tempo: Tempo genera y edita código react de alta calidad directamente en tu base de código para que puedas enviar interfaces de usuario en minutos.
- OpenUI: OpenUI te permite describir la interfaz de usuario usando tu imaginación y luego verla renderizada en vivo.
- v0: Genera UI con shadcn/ui a partir de indicaciones de texto simples e imágenes.
- Groq: Groq tiene la misión de establecer el estándar para la velocidad de inferencia de GenAI, ayudando a que las aplicaciones de IA en tiempo real cobren vida hoy.
- *LOOI Root: Convierte tu smartphone en un robot de escritorio
- Friend: AI Wearable de código abierto con más de 24 horas de duración con una sola carga
- insight: Un raspberry pi por ahí y construí un AI wearable llamado insight.
- Limitless: AI personalizada impulsada por lo que has visto, dicho y escuchado.
- Frame AI glasses: Gafas de código abierto.
- Rabbit R1: Tu compañero de bolsillo.
- *Haptic Source-effector: Haptics de cuerpo completo a través de estimulación cerebral no invasiva
- OpenGlass: Convierte cualquier gafas en gafas inteligentes impulsadas por IA
- Octo: Octo es una política de robot basada en transformadores entrenada en una mezcla diversa de 800k trayectorias de robots.
- HumanPlus: Sombreado e imitación de humanoides a partir de humanos
- LeRobot: LeRobot: Aprendizaje de extremo a extremo para robótica en el mundo real en Pytorch
- Ray-Ban Meta Smart Glasses: La colección Ray-Ban Meta combina lo último en tecnología portátil con el diseño auténtico de Ray-Ban, para mantenerte conectado dondequiera que vayas.
- Solos AirGo Vision: Gafas inteligentes de audio impulsadas por ChatGPT
- Prompt-Engineering-Guide: Guías, artículos, conferencias, cuadernos y recursos para la ingeniería de prompts.
- Prompt Library: La biblioteca de prompts del Dr. Ethan Mollick y la Dra. Lilach Mollick de la Escuela Wharton de la Universidad de Pensilvania.
- vLLM: Un motor de inferencia y servicio de alto rendimiento y eficiente en memoria para LLMs.
- Text Generation Inference: Inferencia de generación de texto de modelos de lenguaje grande
- Ollama: Pon en marcha modelos de lenguaje grande localmente.
- LM Studio: Descubre, descarga y ejecuta LLMs locales.
- Podwise: es una aplicación de gestión del conocimiento que utiliza IA para extraer información clave de los podcasts, generando automáticamente transcripciones, esquemas, palabras clave y mapas mentales para los oyentes
- Cradle: El marco Cradle es un primer intento de Control General de Computadoras (GCC). Cradle permite a los agentes dominar cualquier tarea informática al habilitar fuertes habilidades de razonamiento, auto-mejora y gestión de habilidades, en un entorno general estandarizado con requisitos mínimos.
- LLMPerf: Una herramienta para evaluar el rendimiento de las API de LLM. También proporciona una tabla de clasificación para LLMs.
- WebLINX: Navegación de sitios web del mundo real con diálogo de múltiples turnos.
- Latent Box: Una colección de listas impresionantes para AI, creatividad y arte.
- LLM Transparency Tool: LLM Transparency Tool (LLM-TT), un kit de herramientas interactivas de código abierto para analizar el funcionamiento interno de los modelos de lenguaje basados en transformadores.
- LLM Visualization: Una visualización y recorrido del algoritmo LLM que respalda ChatGPT de OpenAI. Explora el algoritmo hasta cada suma y multiplicación, viendo todo el proceso en acción.
- HippoRAG: HippoRAG es un nuevo marco RAG inspirado en la memoria a largo plazo humana que permite a los LLMs integrar continuamente conocimientos a través de documentos externos.
- [Vanna](https://