Major Changes:
主要变更:
Major Changes:
- Added a new parameter
static_resized_shape
when initializingMathFormulaDetector
, which is used to resize the input image to a fixed size. Some formats of models require fixed-size input images during inference, such asCoreML
.
主要变更:
MathFormulaDetector
初始化时加入了参数static_resized_shape
, 用于把输入图片 resize 为固定大小。某些格式的模型在推理时需要固定大小的输入图片,如CoreML
。
Major changes:
- Support the new mathematical formula detection models (MFD): breezedeus/pix2text-mfd (Mirror), which significantly improves the accuracy of formula detection.
See details: Pix2Text V1.1.1 Released, Bringing Better Mathematical Formula Detection Models | Breezedeus.com.
主要变更:
- 支持新的数学公式检测模型(MFD):breezedeus/pix2text-mfd (国内镜像),公式检测精度获得较大提升。
具体说明请见:Pix2Text V1.1.1 发布,带来更好的数学公式检测模型 | Breezedeus.com。
Major changes:
- adapted with cnstd>=1.2.4, thanks to @g1y5x3 .
主要变更:
- 适配 cnstd>=1.2.4 ,感谢 @g1y5x3 。
Major changes:
- Fix: The Text OCR incorrectly carried over the configuration from previous calls when it was called multiple times.
主要变更:
- 修复 bug:Text OCR 多次调用时错误沿用了之前的配置信息。
Major changes:
- Fixed bugs such as that in
._parse_remaining
.
主要变更:
- 修复
._parse_remaining
等 bug。
Major changes:
- set
table_as_image
asTrue
ifself.table_ocr
is not available. - fix typo: #108 . Thanks to @billvsme.
主要变更:
Major changes:
- A new paid model,
mfr-plus
, has been added, which offers better recognition for multi-line formulas. - When recognizing only English, CnOCR does not output Chinese.
- Bugs have been fixed.
主要变更:
- 加入新的付费模型:
mfr-plus
,对多行公式的识别效果更好。 - 在只识别英文时,CnOCR 不输出中文。
- 修复 bugs。
Major changes:
- Fixed the error caused by empty lines in
merge_line_texts
.
主要变更:
- 修复
merge_line_texts
中空行导致的错误。
Major changes:
- Fix the exception occurring when saving files on Windows.
主要变更:
- 修复 Windows 下存储文件时出现的异常。
Major changes:
- Added layout analysis and table recognition models, supporting the conversion of images with complex layouts into Markdown format. See examples: Pix2Text Online Documentation / Examples.
- Added support for converting entire PDF files to Markdown format. See examples: Pix2Text Online Documentation / Examples.
- Enhanced the interface with more features, including adjustments to existing interface parameters.
- Launched the Pix2Text Online Documentation.
主要变更:
- 加入了版面分析和表格识别模型,支持把复杂排版的图片转换为 Markdown 格式,示例见:Pix2Text 在线文档/Examples。
- 支持把整个 PDF 文件转换为 Markdown 格式,示例见:Pix2Text 在线文档/Examples。
- 加入了更丰富的接口,已有接口的参数也有所调整。
- 上线了 Pix2Text 在线文档。
Major changes:
- Fixed the issue caused by
merge_line_texts
, see details at: #84. - Optimized the post-processing logic to handle some abnormal sequences.
主要变更:
- 修复
merge_line_texts
带来的错误,具体见:#84 。 - 优化了后处理逻辑,处理部分不正常的序列。
Major changes:
- The previously used
output_logits
argument is incompatible with transformers < 4.38.0, replaced by theoutput_scores
argument. #81 - Fixed a bug in
serve.py
that was not compatible with the new pix2text version.
主要变更:
- 之前使用的
output_logits
参数不兼容 transformers < 4.38.0,换为output_scores
参数。 #81 - 修复
serve.py
中未兼容新版接口的 bug。
Major Changes:
- Fixed mishandling of LaTeX expressions during post-processing, such as replacing
\rightarrow
witharrow
. - Added
rec_config
parameter to.recognize_text()
and.recognize_formula()
methods for passing additional parameters for recognition.
主要变更:
- 修复对 LaTeX 表达式进行后处理时引入的误操作,如
\rightarrow
被替换为arrow
。 - 对
.recognize_text()
和.recognize_formula()
加入了rec_config
参数,以便传入用于识别的额外参数。
Major Changes:
- Optimized the recognition process, improving the recognition of boundary punctuation that may have been missed before.
- Enhanced the LaTeX recognition results by restoring the formula tags to the formulas.
- Adjusted the output format of the recognition results, adding the
return_text
parameter to control whether to return only text or more detailed information. When returning more detailed information, confidence scorescore
and position informationposition
will also be provided. Thanks to @hiroi-sora for the suggestion: #67.
主要变更:
- 优化了识别的逻辑,以前可能漏识的边界标点现在可以比较好的识别。
- 对 Latex 识别结果进行了优化,把公式的 tag 还原到公式中。
- 调整了识别结果的输出格式,增加了参数
return_text
来控制结果是只返回文本还是更丰富的信息。当返回更丰富信息时,会返回置信度score
以及位置信息position
。感谢 @hiroi-sora 的建议:#67 。
主要变更:
- 修复在 CUDA 环境下使用
LatexOCR
时出现的错误,具体见:#65 (comment) ,感谢 @MSZ-006NOC。
主要变更:
- 数学公式识别(MFR)模型使用新架构,在新的数据集上训练,获得了 SOTA 的精度。具体说明请见:Pix2Text V1.0 新版发布:最好的开源公式识别模型 | Breezedeus.com。
主要变更:
-
支持识别
80+
种语言,详细语言列表见 支持的语言列表; -
模型自动下载增加国内站点;
-
优化对检测 boxes 的合并逻辑。
主要变更:
- fix: bugfixed from @hiroi-sora , thanks much.
主要变更:
- fix: 去掉
consts.py
无用的CATEGORY_MAPPINGS
。
主要变更:
- 修复了
self.recognize_by_clf
返回结果中不包含line_number
字段导致merge_line_texts
报错的bug。
主要变更:
- 优化了对检测出的boxes的排序逻辑,以及对混合图片的处理逻辑,使得最终识别效果更符合直觉。具体参考:Pix2Text 新版公式识别模型 | Breezedeus.com 。
- 修复了模型文件自动下载的功能。HuggingFace似乎对下载文件的逻辑做了调整,导致之前版本的自动下载失败,当前版本已修复。但由于HuggingFace国内被墙,国内下载仍需 梯子(VPN)。
- 更新了各个依赖包的版本号。
主要变更:
- 基于新标注的数据,重新训练了 MFD YoloV7 模型,目前新模型已部署到 P2T网页版 。具体说明见:Pix2Text (P2T) 新版公式检测模型 | Breezedeus.com 。
- 之前的 MFD YoloV7 模型已开放给星球会员下载,具体说明见:P2T YoloV7 数学公式检测模型开放给星球会员下载 | Breezedeus.com 。
主要变更:
- 修复bug。
主要变更:
- 修复旋转框导致的识别结果错误;
- 去掉代码中不小心包含的
breakpoint()
。
主要变更:
主要变更:
- 利用 CnSTD 新版的数学公式检测(Mathematical Formula Detection,简称 MFD)能力,P2T V0.2 支持识别既包含文字又包含公式的混合图片。
主要变更:
- Fix: remove the character which causes error on Windows
- 初版发布