DeepSeek OCR PDF
DeepSeek-OCR 是一款先进的 AI 驱动的光学字符识别模型,能够准确地从 100 多种语言的图像和文档中提取文本,并具有处理复杂布局、手写、图表和数学公式的专业功能。

DeepSeek-OCR 是一款先进的光学字符识别模型,它利用尖端的人工智能技术和上下文光学压缩,高效地从图像和文档中提取文本。
能够以高精度识别 100 多种语言的文本,包括英语、中文、日语、韩语、阿拉伯语、西里尔语和印度语言。
在单个 A100-40G GPU 上每天可处理超过 200,000 页,速度高达每秒 2,500 个 tokens。
超越了简单的文本提取,具备图表解析、复杂公式识别、几何图形理解和深度文档结构分析等功能。
能够准确地从具有复杂布局的文档(包括表格、表单)中提取文本,并在转换为 Markdown 时保留格式。
通过先进的可视化 token 处理,在草书和印刷体手写识别方面均达到 92% 以上的准确率。
通过加密处理和 24 小时内自动删除来确保数据安全,并提供自托管部署选项。
通过多种部署选项开始使用 DeepSeek-OCR,这些选项根据您的需求量身定制。
根据您对速度、规模和隐私的要求,从在线工具、Python API、vLLM 批量处理或自托管部署中进行选择。
通过 Web 界面或 API 上传图像或 PDF 文件。支持的格式包括 JPG、PNG、TIFF 和多页 PDF。
指定文档类型、语言偏好和输出格式。根据需要启用高级功能,如图表解析或公式识别。
提交您的文档进行处理。该模型将提取文本,并保留结构、格式,并自动处理复杂元素。
以您喜欢的格式下载提取的文本,或通过 API 直接集成到您的工作流程中,以实现自动处理管道。
DeepSeek-OCR 支持 100 多种语言,并处理具有复杂布局、公式和图表的文档。对于生产工作负载,请考虑使用 Python API 或 vLLM 批量处理以获得最佳性能。
DeepSeek-OCR 在广泛的文档处理场景中表现出色,从简单的文本提取到复杂的学术和商业应用。
将印刷档案、历史文档和扫描书籍转换为可编辑的数字格式,并保留格式和结构。
自动从发票、收据、合同和表单中录入数据,以简化工作流程并减少手动处理时间。
处理研究论文、教科书和科学文档,包括数学公式、化学方程式和复杂图表。
处理包含多种语言的文档,无需手动干预,非常适合国际组织和翻译服务。
从图表、图形、表格和技术插图中提取数据,用于分析和报告目的。
将手写笔记、表单和签名转换为数字文本,具有高精度,便于存档和搜索。
关于 DeepSeek-OCR 以及如何充分利用该模型的常见问题。
DeepSeek-OCR 支持 100 多种语言,包括拉丁文字(英语、西班牙语、法语、德语)、亚洲语言(中文、日语、韩语)、阿拉伯文字、西里尔文字(俄语、乌克兰语)和印度语言(印地语、孟加拉语、泰米尔语等)。该模型会自动检测混合语言文档中的语言。
DeepSeek-OCR 使用先进的上下文光学压缩技术,采用一种新颖的架构,结合了 DeepEncoder 和一个 3B 参数的 MoE 解码器。它超越了文本提取,提供 OCR 2.0 功能,包括图表解析、复杂公式识别、几何图形理解和深度文档结构分析。
是的,DeepSeek-OCR 在草书和印刷体手写识别方面均达到 92% 以上的准确率。为了获得最佳效果,请确保充足的光照、良好的对比度和手写文档的笔直对齐。
DeepSeek-OCR 可以在单个 A100-40G GPU 上每天处理超过 200,000 页,当使用 vLLM 批量处理时,速度高达每秒 2,500 个 tokens。性能因文档复杂性和部署方法而异。
当然可以。DeepSeek-OCR 擅长理解复杂布局,包括表格、表单、多列文档,并在转换为 Markdown 时保留格式。它还可以解析图表并识别数学和化学公式。
是的,DeepSeek-OCR 使用加密处理,并在使用在线工具时自动在 24 小时内删除数据。为了获得最大的隐私和控制,您可以使用自托管部署选项在您自己的基础设施上部署该模型。
DeepSeek-OCR 提供四种部署选项:(1)用于即时处理的在线工具,(2)用于脚本编写和原型设计的 Python API,(3)用于生产工作负载的 vLLM 批量处理,以及(4)在您的基础设施上使用 Docker、Kubernetes 或云平台支持的自托管部署。
是的,DeepSeek-OCR 包括高级图表解析功能,可以准确地从图形、条形图、饼图和其他可视化内容中提取数据,使其成为处理报告和分析文档的理想选择。
体验 DeepSeek-OCR 先进的光学字符识别的强大功能,它支持 100 多种语言、图表解析和复杂布局理解。
开源模型,在 MIT 许可证下可用。在线部署或自托管以获得最大的隐私和控制。