Skip to content

Exportación de documentos completos a HTML funcionando

andrescg2sj edited this page Apr 21, 2020 · 2 revisions

La versión actual de PDFTableToHTML en Courseminer está funcionando, al menos para cierto tipo de ficheros.

Un ejemplo es este documento.

Se puede probar con el siguiente comando:

java -cp target/crminer-app-1.0-SNAPSHOT-jar-with-dependencies.jar org.sj.punidos.crminer.PDFTableToHTML res/CEPI-1-1.pdf -o test.htm

Esto exporta las tres tablas en ese PDF a un un fichero llamado test.htm.

Referencia

Actualmente, los argumentos disponibles para línea de comandos en PDFTableToHTML son:

PDFTableToHTML [OPTIONS] [PDF-filename-in]
usage: utility-name
 -c,--clip <arg>        format: x,y,width,height
 -o,--output <arg>      output file
 -p,--proximity <arg>   minimum distance between tables
 -t,--thickness <arg>   máximum line thickness

Más ejemplos

Puedes ver más ejemplos de lo que Courseminer puede hacer hasta ahora en esta You can check out more examples of what Courseminer is able to do so far in esta carpeta.

La carpeta pdf contiene documentos de ejemplo con tablas, y la carpeta html contiene los ficheros genrados por ExampleGenerator.

Puedes ejecutar ExampleGenerator con este comando:

java -cp target/crminer-app-1.0-SNAPSHOT-jar-with-dependencies.jar org.sj.punidos.crminer.ExampleGenerator