-
Notifications
You must be signed in to change notification settings - Fork 0
Exportación de documentos completos a HTML funcionando
andrescg2sj edited this page Apr 21, 2020
·
2 revisions
La versión actual de PDFTableToHTML
en Courseminer está funcionando, al menos para cierto tipo de ficheros.
Un ejemplo es este documento.
Se puede probar con el siguiente comando:
java -cp target/crminer-app-1.0-SNAPSHOT-jar-with-dependencies.jar org.sj.punidos.crminer.PDFTableToHTML res/CEPI-1-1.pdf -o test.htm
Esto exporta las tres tablas en ese PDF a un un fichero llamado test.htm
.
Actualmente, los argumentos disponibles para línea de comandos en PDFTableToHTML
son:
PDFTableToHTML [OPTIONS] [PDF-filename-in]
usage: utility-name
-c,--clip <arg> format: x,y,width,height
-o,--output <arg> output file
-p,--proximity <arg> minimum distance between tables
-t,--thickness <arg> máximum line thickness
Puedes ver más ejemplos de lo que Courseminer puede hacer hasta ahora en esta You can check out more examples of what Courseminer is able to do so far in esta carpeta.
La carpeta pdf contiene documentos de ejemplo con tablas, y la carpeta html contiene los ficheros genrados por ExampleGenerator
.
Puedes ejecutar ExampleGenerator
con este comando:
java -cp target/crminer-app-1.0-SNAPSHOT-jar-with-dependencies.jar org.sj.punidos.crminer.ExampleGenerator