删除 PDF 文本
突出显示和删除 PDF 中的文本
将您的PDF 文件拖放到此处或
从您的设备上传
从Google云端硬盘上传
从DropBox上传
从网址上传(URL)
档案大小上限:128 MB
Powered by GdPicture PDF Editor SDK | 点击此处了解更多信息 - PSPDFKit GdPicture.NET PDF Editor
您的文件是安全的!
我们使用最佳的加密方法来保护您的数据。
30分钟后,所有文档都会自动从我们的服务器中删除。
如果愿意,您可以在处理后立即通过单击bin图标手动删除文件。
如何在线删除PDF文本:
- 首先,拖放您的PDF文件或从您的设备或云存储服务上传它。
- 选择您的设置,然后单击“删除文本”按钮。
- 将PDF文件下载到您的计算机或直接将其保存到您的云存储服务。
博客文章
你知道吗?
我们拿两个PDF文件:一个是用文字处理器(例如MS Word)创建的,另一个是扫描的文档。这两个文件都以.pdf扩展名结尾。但是,这些文件不相同。如果打开使用文字处理器创建的PDF文件,则可以按CTRL + F,输入所需的单词,然后PDF查看器软件将突出显示文档的结果。
但是,在扫描纸质文档后,请尝试选择或搜索由扫描仪软件生成的PDF中的文本,这是不可能的。这是因为扫描的PDF文档不是基于文本的。它是基于图像的。这种类型的PDF称为 PDF栅格 ,并且很快成为存储,传输和交换扫描文档的标准格式
然后,有矢量PDF,通常是从 计算机辅助设计 格式或图形设计程序(如Adobe Illustrator)。
但是,在扫描纸质文档后,请尝试选择或搜索由扫描仪软件生成的PDF中的文本,这是不可能的。这是因为扫描的PDF文档不是基于文本的。它是基于图像的。这种类型的PDF称为 PDF栅格 ,并且很快成为存储,传输和交换扫描文档的标准格式
然后,有矢量PDF,通常是从 计算机辅助设计 格式或图形设计程序(如Adobe Illustrator)。
文本是本机PDF中的独立元素。您可能会在PDF中看到文本字符,但是这些字符不一定是PDF文本元素。您如何分辨差异?
正如我们已经看到的,文本可以是文本的光栅图像或文本的矢量图像。在所有情况下,它看起来都是文本,但计算机无法识别出文本,因此无法选择或搜索文本。
由文字处理程序创建的文本既不是光栅也不是矢量图像,(适当地)称为“真实文本”或PDF文本元素。真实文本是可搜索和可选的。与放大的矢量文本和像素化的光栅文本相反,即使在缩放时也显得清晰。
像 马格利特的 在PDF世界中的一幅著名画作中,文本的图像与文本本身不是一回事。
正如我们已经看到的,文本可以是文本的光栅图像或文本的矢量图像。在所有情况下,它看起来都是文本,但计算机无法识别出文本,因此无法选择或搜索文本。
由文字处理程序创建的文本既不是光栅也不是矢量图像,(适当地)称为“真实文本”或PDF文本元素。真实文本是可搜索和可选的。与放大的矢量文本和像素化的光栅文本相反,即使在缩放时也显得清晰。
像 马格利特的 在PDF世界中的一幅著名画作中,文本的图像与文本本身不是一回事。
要使扫描文档的文本可搜索,您需要通过OCR运行它。此过程在PDF中添加了一层不可见的文本,因此OCR引擎可以识别字符并“读取”文本。在打印或查看PDF文档时不会使用此文本,并且用户看不到该文本。
为什么需要删除PDF的隐藏文本?有时,已扫描为OCRed的文本在查看器中无法很好地显示。在某些情况下,技巧是删除隐藏的文本并使用其他工具(例如 AvePDF OCR PDF )。
您使用的OCR引擎也可能需要更新,并且您想重新处理文档或切换到性能更好的其他工具。最后一个考虑因素是,如果将一批包含OCRed文件的文档另存为PDF / OCR,则结果文件将更重。
为什么需要删除PDF的隐藏文本?有时,已扫描为OCRed的文本在查看器中无法很好地显示。在某些情况下,技巧是删除隐藏的文本并使用其他工具(例如 AvePDF OCR PDF )。
您使用的OCR引擎也可能需要更新,并且您想重新处理文档或切换到性能更好的其他工具。最后一个考虑因素是,如果将一批包含OCRed文件的文档另存为PDF / OCR,则结果文件将更重。