为解决使用 lwarp
过程中内部调用 poppler
中的 pdftotext.exe
转换 pdf
时出现的文章顺序错误问题,用 pdf-extract 的测试例子改了下做成 pdf2text
用法:
编译后把 pdf2text.exe
复制到 pdftotext.exe
同一目录,找到 lwarpmk.lua
中的 pdftohtml
函数,把
os.execute("pdftotext -enc " .. pdftotextenc .. " -nopgbrk -layout "
.. sourcename .. "_html.pdf " .. sourcename .. "_html.html")
改为
os.execute("pdf2text " .. sourcename .. "_html.pdf " .. sourcename .. "_html.html")