目前支持的功能 支持 文字/公式/表格/图像 的识别, 支持多栏的识别, 还原阅读顺序 只支持 中文(简体/繁体), 英文与西欧国家等语言的解析, 更多语言正在支持中, 预计24年底发布 跨页表格合并/手写识别/竖排文字/多级标题支持, 但效果不一定很好, 还在不断迭代 不支持 超长图/超宽图的识别
网站名称:Doc2X
网站地址:https://doc2x.noedgeai.com/
2.高精度识别 Doc2X 识别功能适配论文,财报,教育,书籍等场景,支持多栏,公式,表格,代码块识别。识别准确率高于市面上绝大部分识别方法,能够快速精准的把pdf里面的内容转换成markdown,LaTeX,Word,Html,处理时间最快可以达到1秒10页,能够极大提升数据收集和处理的效率
3. 大模型加持的双语对照PDF翻译和文档对话 基于高精准的识别引擎,Doc2X提供了大模型加持的双语对照PDF翻译。Doc2X中支持多种AI引擎:支持GPT、Deepseek、GLM,豆包等模型。 Doc2X会把排版复杂的文档还原成单栏,同时保证里面的公式结构完整,从而实现在手机上也能有非常好的阅读体验。
除了将PDF还原成单栏文档后翻译,Doc2X最近还推出了保留位置的翻译功能;Doc2X的保留位置翻译解决了市面上常见的文字重叠/公式丢失等问题,在学术论文/课程PPT等场景上翻译效果上表现十分稳定,翻译得到的成品PDF可以直接分享传阅。
4. 配合Zotero实现文献自由管理Doc2X最新还提供了Zotero插件,可以直接把PDF的对照翻译的Markdown和保留位置翻译的PDF直接通过Zotero进行管理,无缝接入你的科研进程。Zotero插件目前还在测试中,可以在用户群下载相关插件。
5. 全面提升阅读效率的文档对话Doc2X还内置了ChatPDF功能,可以直接对文档内容进行提问,文档总结/内容衍生/细节追踪都可以靠对话实现;Doc2X也即将接入deepseek-r1,使用强大的思考模型加深理解文档的所有内容。