删除文字

删除PDF文本

将文件放在这里或
档案大小上限:500 MB
  • 从您的设备上传
  • 从Google云端硬盘上传
  • 从DropBox上传

您的文件是安全的!

我们使用最佳的加密方法来保护您的数据。

30分钟后,所有文档都会自动从我们的服务器中删除。

如果愿意,您可以在处理后立即通过单击bin图标手动删除文件。

如何在线删除PDF文本:

  1. 首先,拖放您的PDF文件或从您的设备或云存储服务上传它。
  2. 选择您的设置,然后单击“删除文本”按钮。
  3. 将PDF文件下载到您的计算机或直接将其保存到您的云存储服务。

你知道吗?

并非所有PDF都是一样的
文本有时不是PDF中的文本
许多PDF包含不可见的文本
我们拿两个PDF文件:一个是用文字处理器(例如MS Word)创建的,另一个是扫描的文档。这两个文件都以.pdf扩展名结尾。但是,这些文件不相同。如果打开使用文字处理器创建的PDF文件,则可以按CTRL + F,输入所需的单词,然后PDF查看器软件将突出显示文档的结果。
但是,在扫描纸质文档后,请尝试选择或搜索由扫描仪软件生成的PDF中的文本,这是不可能的。这是因为扫描的PDF文档不是基于文本的。它是基于图像的。这种类型的PDF称为 PDF栅格 ,并且很快成为存储,传输和交换扫描文档的标准格式
然后,有矢量PDF,通常是从 计算机辅助设计 格式或图形设计程序(如Adobe Illustrator)。
文本是本机PDF中的独立元素。您可能会在PDF中看到文本字符,但是这些字符不一定是PDF文本元素。您如何分辨差异?
正如我们已经看到的,文本可以是文本的光栅图像或文本的矢量图像。在所有情况下,它看起来都是文本,但计算机无法识别出文本,因此无法选择或搜索文本。
由文字处理程序创建的文本既不是光栅也不是矢量图像,(适当地)称为“真实文本”或PDF文本元素。真实文本是可搜索和可选的。与放大的矢量文本和像素化的光栅文本相反,即使在缩放时也显得清晰。
马格利特的 在PDF世界中的一幅著名画作中,文本的图像与文本本身不是一回事。
要使扫描文档的文本可搜索,您需要通过OCR运行它。此过程在PDF中添加了一层不可见的文本,因此OCR引擎可以识别字符并“读取”文本。在打印或查看PDF文档时不会使用此文本,并且用户看不到该文本。
为什么需要删除PDF的隐藏文本?有时,已扫描为OCRed的文本在查看器中无法很好地显示。在某些情况下,技巧是删除隐藏的文本并使用其他工具(例如 AvePDF OCR PDF )。
您使用的OCR引擎也可能需要更新,并且您想重新处理文档或切换到性能更好的其他工具。最后一个考虑因素是,如果将一批包含OCRed文件的文档另存为PDF / OCR,则结果文件将更重。
其他工具