English | 🌎 Versión en Español | 中文
**Search locally, search privately, search the old way.**
Un metabuscador nativo y una infraestructura de datos de alto rendimiento creada para recuperar la web útil. Diseñado para humanos que buscan relevancia sin anuncios y para agentes de IA que necesitan explorar internet sin las complicaciones de las llaves API comerciales y sus costos asociados.
Origen • Stack • Características • Agentes IA • Privacidad • Instalación • Créditos
searXena nació originalmente como una iniciativa de investigación para realizar un port experimental de SearXNG destinado a ejecutarse de forma nativa en sistemas operativos Windows sin el peso de contenedores Docker o subsistemas WSL involucrados.
A medida que el desarrollo avanzó y la necesidad de integraciones interactivas más profundas surgió, searXena evolucionó para convertirse en un software iterativamente independiente. Nuestro código base fue reescrito y estructurado bajo una arquitectura de micro-gestores propia (FastAPI), conservando el espíritu de soberanía del usuario establecido por el movimiento open-source.
Reconocemos y honramos formalmente al proyecto original SearXNG y a sus desarrolladores comunitarios por sentar los estándares universales y la base teórica (parsers, gestión de peticiones, headers proxy) acerca de cómo debe operar un metabuscador transparente y privado.
searXena aprovecha tecnologías modernas y ultraligeras para permitir una ejecución hiperfluida inclusive en hardware de uso local secundario:
- Backend: Python 3.x y FastAPI (Alto rendimiento asíncrono).
- Servidor Web: Uvicorn (Soporte nativo ASGI).
- Procesamiento de Red:
httpxpara peticiones HTTP/2 paralelas y asíncronas de bajísima latencia. - Frontend / Rendering: Jinja2 acoplado con Vanilla JavaScript (cero frameworks tipo React) y CSS3 Puro garantizando velocidad instantánea.
- Unidad de Extracción:
O-ZEN Engine(Núcleo de extracción nativo - AGPLv3). - Procesadores DOM:
lxmlyselectolaxacoplados con selectores modulares.
- 🚀 Metabúsqueda Paralela Asíncrona: Una sola consulta tuya dispara docenas de solicitudes asíncronas a múltiples fuentes de información globales consolidándolas en menos de 1 segundo.
- 🤖 Integración IA First: Formato JSON y esquemas Tools pre-construidos nativos, listos para conectar tu despliegue LLM a internet sin overheads ni scraping de HTML innecesario.
- 🛡️ Protección de Privacidad: Actúa como una interfaz neutral entre el usuario y la web global. Promueve el anonimato al centralizar las peticiones de forma transparente a través de su propio motor de red.
- 📦 100% Nativo en Windows: Cero dependencias complejas. Solo clona, instala las librerías con
pip, corre el archivo.pyprincipal y tienes un buscador privado minimizando la telemetría externa hospedado localmente en tu sistema. - 📱 UI/UX Moderna y Dinámica: Animaciones fluidas, modo oscuro ultra refinado ("Space Violet"), interfaz responsiva y separada categóricamente en pestañas (General, TI/Ciencia, Mapas, Videos, Imágenes).
- 🌎 Rich Snippets Consolidados: Lectura enriquecida consolidando datos de Wikipedia o Wikidata en recuadros laterales de rápido consumo ("Infoboxes").
- 🧘 O-ZEN Engine (Modo Lectura): Motor de extracción industrial (AGPLv3) integrado para leer artículos y documentación técnica sin anuncios ni scripts intrusivos.
Históricamente, los metabuscadores open-source enfocados en privacidad (como SearXNG o Whoogle) nacieron y fueron diseñados estrictamente pensando en entornos GNU/Linux o despliegues Cloud. Si un usuario de Windows deseaba correrlos localmente, debía enfrentarse a una odisea de fricción técnica: instalar WSL2 (Subsistema de Windows para Linux), dedicar recursos de memoria fijos para máquinas virtuales, configurar demonios de Docker, lidiar con configuraciones de red de contenedores (NAT bridging), y gastar gigabytes de almacenamiento solo para arrancar una barra de búsqueda.
searXena elimina por completo todas estas barreras. No tenemos rivales en este ecosistema porque somos 100% nativos.
| Característica | 👾 Los "Rivales" (SearXNG / Whoogle) | 👑 searXena |
|---|---|---|
| Arquitectura en Windows | Virtualización Forzada (Docker / WSL2) | Directa al Kernel (vía Python nativo) |
| Consumo de Memoria | ~1 GB a 2 GB (Por sobrecarga de VM / Contenedores) | ~30 MB - 60 MB (Ejecución Pura) |
| Tiempo de Arranque | Lento (Inicia Docker Engine, luego levanta el stack) | Instantáneo (Menor a un segundo) |
| Experiencia de Instalación | Compleja, comandos de sysadmin orientados a Linux | Simple (Scripts .ps1 auto-configurables) |
| Tool Calling LLM | Adaptadores comunitarios externos requeridos | API JSON Nativa construida desde el día uno |
| Extracción de Datos (RAG) | Scraping ruidoso de HTML (externo) | O-ZEN Engine nativo (Modo lectura listo para LLM) |
A menos que quieras rentar un VPS en la nube, searXena es la única respuesta lógica, viable y de altísimo rendimiento para el usuario de Windows exigente que desea soberanía de datos in-house.
searXena elimina las barreras de acceso a la web para el desarrollo de Inteligencia Artificial:
-
Adiós a las API Keys: Olvida la necesidad de gestionar múltiples llaves API o cuotas de suscripción dinámicas. searXena es tu propio nodo de búsqueda infinito.
-
Costo Cero por Consulta: Escala tus agentes y sistemas RAG sin preocuparte por la factura al final del mes.
-
Datos de Grado Industrial: Entrega un flujo de datos limpio y estructurado diseñado para ser procesado por modelos de lenguaje. Hemos diseñado el motor para que sirva como el par de "ojos" en tiempo real para tus modelos de lenguaje (LLMs).
-
Exploración de Internet para IA: Proporciona un flujo de datos limpio y estructurado que permite a los agentes navegar e investigar en la web sin la fricción del renderizado visual.
-
Tool Calling Nativo: Compatible con el estándar de "Functions" de OpenAI/Anthropic desde el núcleo.
-
Ranking Curado para RAG: Los resultados están priorizados para alimentar sistemas de Retrieval-Augmented Generation, filtrando el ruido comercial y priorizando fuentes sustanciales de información técnica y enciclopédica.
searXena prioriza que tus datos jamás se utilicen para el perfilado publicitario por parte de terceros, asumiendo un rol de protección técnica por debajo de la interfaz gráfica. Aún así, la arquitectura requiere ciertos consensos técnicos, reportados aquí transparentemente:
Cuando buscas cualquier consulta general (Noticias, TI, Código), searXena protege tu identidad a través del motor asíncrono backend. Modificamos de forma sistemática los User-Agent. Toda URL de imagen devuelta por los motores comerciales pasa de manera coordinada por nuestro sistema interno de /proxify, asegurando que tu IP no se exponga directamente a servidores de terceros.
Al interactuar con la pestaña especializada de Mapas, searXena implementa reglas un poco más permeables para lograr darte interactividad útil (arrastrar, hacer zoom), conservando el anonimato comercial:
- Geocodificación Limpia: La petición nominal (ej. "Buscar Jalisco") va blindada mediante el core backend a favor del anonimato. OSM jamás sabe las palabras de tu búsqueda.
- Transparencia IP (El Iframe Interactivo): Para que experimentes un mapa funcional arrastrable dentro de la sección Mapas, inyectamos un
iframedinámico referenciando aopenstreetmap.org. Esto hace que tu navegador realice una conexión directa a OSM revelando temporalmente tu IP pública para la descarga de mosaicos visuales (tiles). - El trade-off: OSM es una fundación abierta pro-privacidad sin motores que subasten telemetría ni cookies inter-rastreo, por lo que la exposición de IP nativa es benigna y se justifica a cambio de integrar la cartografía funcional.
Siguiendo nuestra arquitectura de "Direct Media Delivery" para optimizar el rendimiento sin sacrificar la privacidad:
- Nodos de Alta Confianza: searXena identifica a los servidores de Wikipedia y Wikimedia como fuentes de infraestructura pública educativa de alta confianza.
- Optimización de Carga: Al ser plataformas libres de rastreadores publicitarios y cookies de terceros, permitimos la carga directa de sus recursos multimedia. Esto garantiza una experiencia de usuario fluida y de alta resolución, aprovechando que estas instituciones operan bajo protocolos de confidencialidad estrictos compatibles con la filosofía de searXena.
searXena no es solo para consumo humano. Está diseñado desde su base web para actuar como el motor de búsqueda de investigación de tus propios agentes de IA (LLMs) locales o en la nube, proveyendo soporte nativo de Tool Calling estrictamente estandarizado (formato OpenAI/Anthropic/Gemini).
A través de la ruta /api/v1/search, tu asistente puede automatizar consultas y recibir respuestas en JSON limpio, indexado y estructurado, suprimiendo el HTML, CSS o el costoso ruido visual derivado de los scrapers crudos.
- Endpoints Listos para IA:
GET /api/v1/tools_schema: Devuelve un esquema literalfunction_declarationsinyectable directo hacia tu LLM con todos los parámetros habilitados disponibles.POST /api/v1/search: Webhook de comunicación que ejecuta la búsqueda y devuelve metadata analítica de profundidad.
- Smart Ranking Anti-Alucinaciones: El filtro heurístico procesa los retornos a favor del agente; bajo la categoría "TI", oculta de cara al LLM los sitios publicitarios y le alimenta directamente de documentación técnica oficial y repositorios de código abierto sustanciales.
¿Construyendo un Agente RAG? Echa un vistazo profundo a los payloads, headers preconstruidos y recomendaciones del System Prompt alojados en la Guía de Integración AI incluida en este repositorio oficial.
🚀 Próximamente: searXena vendrá incluido por defecto en nuestro proyecto en desarrollo mikuBot Dashboard, un asistente personal de IA enfocado al público general, también de código abierto y disponible próximamente.
- Clona el repositorio a un directorio local:
git clone https://github.com/NeuralArchLabs/searXena.git cd searXena - (Opcional) Si tu sistema bloquea los scripts, dales permisos:
Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser
- Ejecuta el instalador automático en la terminal base:
.\win_setup.ps1
- Inicia el motor searXena:
.\run.ps1
Abre tu navegador de confianza y entra directamente en http://127.0.0.1:8000. searXena ya está listo para enmascararte.
- Licencia: Este proyecto es software libre, distribuido bajo la licencia GNU Affero General Public License v3.0 (AGPL-3.0).
- Créditos del Motor: El motor de extracción O-ZEN Engine es un componente nativo de searXena diseñado para garantizar la soberanía de datos del usuario y el cumplimiento del copyleft profesional.
- Agradecimientos: Reconocemos la base teórica y técnica establecida por el ecosistema SearXNG, cuyos estándares de privacidad han inspirado esta arquitectura nativa.
- Fuentes de Información: searXena actúa como un agregador de señales públicas. Reconocemos y respetamos la inmensa labor de indexación y el valor tecnológico proporcionado por los distintos motores de búsqueda externos. Este software funciona como una herramienta de visualización y anonimización de datos públicos para el usuario final.
- Uso Educativo y de Investigación: searXena se proporciona únicamente con fines de investigación y uso personal. El desarrollador no promueve ni se responsabiliza por el uso de esta herramienta para violar los Términos de Servicio de terceros. searXena ofrece una experiencia de búsqueda neutral; si requiere de la personalización y comodidades basadas en algoritmos de seguimiento, le recomendamos el uso directo de plataformas comerciales de búsqueda.
AVISO LEGAL: searXena se distribuye "TAL CUAL", sin garantías de ningún tipo. El usuario asume toda la responsabilidad legal derivada del uso del software, incluyendo el cumplimiento de las leyes locales y los contratos con proveedores de datos externos. El desarrollador no se hace responsable de bloqueos de IP, acciones legales de terceros o cualquier otro perjuicio derivado del uso de este código.