更新日志¶

Doctra 的所有重要更改都将记录在此文件中。

格式基于 Keep a Changelog，本项目遵循语义化版本。

[0.4.3] - 2024-XX-XX¶

这是 Doctra 的当前稳定版本。

多种 PDF 解析器
- StructuredPDFParser：完整的文档处理
- EnhancedPDFParser：带图像恢复的解析
- ChartTablePDFParser：专门的图表/表格提取
图像恢复
- DocRes 集成用于文档增强
- 6 种恢复任务：appearance、dewarping、deshadowing、deblurring、binarization、end2end
- GPU 加速支持
VLM 集成
- 支持 OpenAI、Gemini、Anthropic、OpenRouter、Qianfan 和 Ollama
- 从图表和表格中提取结构化数据
- 自动转换为 Excel/HTML/JSON
输出格式
- 带嵌入图像的 Markdown
- 用于 Web 查看的 HTML
- 用于数据分析的 Excel
- 用于程序化访问的 JSON
- 高质量图像提取
用户界面
- 基于 Gradio 的 Web UI
- 全面的 CLI
- 完整的 Python API
可视化
- 布局检测可视化
- 边界框叠加
- 置信度分数
- 多页面网格显示

具有完整功能集的当前稳定版本。

具有核心功能的初始公开版本。

没有破坏性更改。只需升级：

pip install --upgrade doctra

有关以下信息，请参阅我们的贡献指南：