Avelyn
AIアシスタントを備えたクラウドベースのPDFビューア
Tool Icon

PDF テキストを削除

PDF 内のテキストを強調表示して削除する

PDF ファイルをここにドロップするか、
デバイスからアップロード
Googleドライブからアップロード
DropBoxからアップロード
Webアドレス(URL)からアップロード
最大ファイルサイズ:128 MB

あなたのファイルは安全です!

私たちはあなたのデータを保護するために最高の暗号化方法を使用しています。

すべてのドキュメントは30分後にサーバーから自動的に削除されます。

必要に応じて、ビンのアイコンをクリックして、処理の直後にファイルを手動で削除できます。

オンラインでPDFのテキストを削除する方法:

  1. 開始するには、PDFファイルをドロップするか、デバイスまたはクラウドストレージサービスからアップロードします。
  2. 設定を選択し、[テキストを削除]ボタンをクリックします。
  3. PDFファイルをコンピューターにダウンロードするか、クラウドストレージサービスに直接保存します。

知ってますか?

すべてのPDFが同じように作成されるわけではありません
2つのPDFファイルを見てみましょう。1つはたとえばMS Wordなどのワードプロセッサで作成され、もう1つはスキャンされたドキュメントです。両方のファイルの拡張子は.pdfです。ただし、これらのファイルは同じではありません。ワードプロセッサで作成されたPDFファイルを開く場合は、CTRL + Fを押して、探している単語を入力すると、PDFビューアソフトウェアがドキュメントの結果を強調表示します。
ただし、紙のドキュメントをスキャンしたときに、スキャナーソフトウェアで生成されたPDFのテキストを選択または検索してみてください。これは不可能です。これは、スキャンされたPDFドキュメントがテキストベースではないためです。画像ベースです。このタイプのPDFは、 PDFラスター 、スキャンされたドキュメントを保存、転送、交換するための標準フォーマットになる
そして、ベクターPDFがあり、 CAD 形式、またはAdobe Illustratorなどのグラフィックデザインプログラム。
テキストがPDFのテキストではない場合がある
テキストはネイティブPDFの独立した要素です。 PDFにテキスト文字が表示される場合がありますが、これらの文字は必ずしもPDFテキスト要素ではありません。どのように違いを見分けることができますか?
今見たように、テキストはテキストのラスター画像またはテキストのベクトル画像です。いずれの場合もテキストのように見えますが、コンピューターはそれをテキストとして認識せず、選択または検索できません。
ワードプロセッサによって作成されたテキストは、ラスターでもベクターイメージでもありません。(適切に)リアルテキストまたはPDFテキストエレメントと呼ばれます。リアルテキストは検索および選択可能です。ズームしてもシャープに見えますが、かたまりに見えるベクターテキストやピクセル化されたラスターテキストとは対照的です。
のように マグリット 有名な絵画、PDFの世界では、テキストのイメージはテキスト自体と同じではありません。
多くのPDFには非表示のテキストが含まれています
スキャンしたドキュメントのテキストを検索可能にするには、OCRを介して実行する必要があります。このプロセスにより、PDFに不可視テキストのレイヤーが追加され、OCRエンジンが文字を認識してテキストを「読み取る」ことができます。このテキストは、PDFドキュメントの印刷または表示中には使用されず、ユーザーには表示されません。
PDFの隠しテキストを削除する必要があるのはなぜですか? OCRedでスキャンされたテキストがビューアでうまく表示されない場合があります。場合によっては、隠しテキストを削除して、別のツール( AvePDF OCR PDF )。
また、使用しているOCRエンジンを更新する必要があり、ドキュメントを再処理したり、パフォーマンスの高い別のツールに切り替えたりしたい場合もあります。最後の考慮事項として、すでにOCRedファイルを含むドキュメントのバッチをPDF / OCRとして保存すると、結果ファイルは大きくなります。