Este repo contiene listados de palabras en formato JSON para que sean usados libremente por creadores de bots o cualquier otra persona haciendo labores de NLP.
Si estás buscando información sobre la convocatoria #DiaDeTodosLosCorpus, están en el fichero 1NOV. Si lo que buscas son instrucciones sobre cómo colaborar, están en el fichero CONTRIBUTING.
Este repositorio está fuertemente inspirado en el corpora de dariusk, al que rendimos homenaje.
Permitir prototipado rápido y pruebas de conceptos. Como tal, los listados de vocabulario virtualmente infinitos no deben sobrepasar en ningún caso los mil elementos. No se trata de hacer una enciclopedia, sino de recopilar suficientes ejemplos para juguetear.
El formato ofrecido es JSON para que sea compatible con cualquier plataforma de desarrollo; de igual forma, el objetivo del repositorio es únicamente la colección de datos y no de ningún código auxiliar.
Hasta donde permita la ley, todos los creadores de contenido de este repositorio renuncian a todo copyright y derechos relacionados con este producto. Esta obra se publica desde España.
Cualquier pull-request u ofrenda de añadido sobre este repositorio se entenderá como una renuncia por tu parte en condiciones similares a la arriba expuesta.