Doc2X文献翻译公式识别 | 我的学习信息记录

目前支持的功能支持文字/公式/表格/图像的识别, 支持多栏的识别, 还原阅读顺序只支持中文(简体/繁体), 英文与西欧国家等语言的解析, 更多语言正在支持中, 预计24年底发布跨页表格合并/手写识别/竖排文字/多级标题支持, 但效果不一定很好, 还在不断迭代不支持超长图/超宽图的识别
网站名称：Doc2X
网站地址：https://doc2x.noedgeai.com/

2.高精度识别 Doc2X 识别功能适配论文,财报,教育,书籍等场景，支持多栏，公式，表格，代码块识别。识别准确率高于市面上绝大部分识别方法，能够快速精准的把pdf里面的内容转换成markdown，LaTeX，Word，Html，处理时间最快可以达到1秒10页，能够极大提升数据收集和处理的效率

3. 大模型加持的双语对照PDF翻译和文档对话基于高精准的识别引擎，Doc2X提供了大模型加持的双语对照PDF翻译。Doc2X中支持多种AI引擎：支持GPT、Deepseek、GLM，豆包等模型。 Doc2X会把排版复杂的文档还原成单栏，同时保证里面的公式结构完整，从而实现在手机上也能有非常好的阅读体验。

除了将PDF还原成单栏文档后翻译，Doc2X最近还推出了保留位置的翻译功能；Doc2X的保留位置翻译解决了市面上常见的文字重叠/公式丢失等问题，在学术论文/课程PPT等场景上翻译效果上表现十分稳定，翻译得到的成品PDF可以直接分享传阅。

4. 配合Zotero实现文献自由管理Doc2X最新还提供了Zotero插件，可以直接把PDF的对照翻译的Markdown和保留位置翻译的PDF直接通过Zotero进行管理，无缝接入你的科研进程。Zotero插件目前还在测试中，可以在用户群下载相关插件。

5. 全面提升阅读效率的文档对话Doc2X还内置了ChatPDF功能，可以直接对文档内容进行提问，文档总结/内容衍生/细节追踪都可以靠对话实现；Doc2X也即将接入deepseek-r1，使用强大的思考模型加深理解文档的所有内容。