PDF のクリーンアップ
PDF の黒枠の消去、パンチ ホールの除去、斑点除去、ページの自動傾き補正
PDF ファイルをここにドロップするか、
デバイスからアップロード
Googleドライブからアップロード
DropBoxからアップロード
Webアドレス(URL)からアップロード
最大ファイルサイズ:128 MB
Powered by GdPicture OCR Preprocessing SDK | 詳細はこちら - PSPDFKit GdPicture.NET OCR Preprocessing
あなたのファイルは安全です!
私たちはあなたのデータを保護するために最高の暗号化方法を使用しています。
すべてのドキュメントは30分後にサーバーから自動的に削除されます。
必要に応じて、ビンのアイコンをクリックして、処理の直後にファイルを手動で削除できます。
オンラインでPDFファイルのページをクリーンアップする方法:
- 開始するには、PDFファイルをドロップするか、デバイスまたはクラウドストレージサービスからアップロードします。
- ドキュメントに適用するフィルターをクリックします:黒の境界線の消去、自動傾き補正、パンチ穴の除去、斑点除去。
- フィルターエンジンは自動的にドキュメントをクリーンアップします。
- 保存ボタンをクリックします。
- クリーンアップしたPDFファイルをコンピューターにダウンロードするか、クラウドストレージサービスに直接保存します。
知ってますか?
スキャンしたドキュメントを最適化することがなぜそれほど重要なのですか?ファイルの読みやすさと外観の向上に加えて、スキャンしたドキュメントをクリーンアップすることには他の利点があります。
のような任意の検出エンジン OCR 明確なドキュメントでより良い結果を提供します。それはまたの場合です バーコードの認識 、試験フォームのチェックボックス、小切手の特別なフォント、およびその他の要素。
また、クリーンアップされたドキュメントでより良い圧縮結果が得られます。のようなツール ハイパーコンプレッション 多くの最適化アルゴリズムのおかげで、PDFの最高の品質/読みやすさの比率を確保し、場合によってはスキャンされたドキュメントの読みやすさを向上させることさえできます。
ドキュメントがクリーンアップされたら、圧縮して次のように変換できます。 PDF / A 長期的なアーカイブと保存のために。将来あなたのドキュメントを使用する人々はこれに感謝します!
のような任意の検出エンジン OCR 明確なドキュメントでより良い結果を提供します。それはまたの場合です バーコードの認識 、試験フォームのチェックボックス、小切手の特別なフォント、およびその他の要素。
また、クリーンアップされたドキュメントでより良い圧縮結果が得られます。のようなツール ハイパーコンプレッション 多くの最適化アルゴリズムのおかげで、PDFの最高の品質/読みやすさの比率を確保し、場合によってはスキャンされたドキュメントの読みやすさを向上させることさえできます。
ドキュメントがクリーンアップされたら、圧縮して次のように変換できます。 PDF / A 長期的なアーカイブと保存のために。将来あなたのドキュメントを使用する人々はこれに感謝します!
スキャンされたドキュメントには、「ノイズ」と呼ばれる不要でランダムに拡散したアーティファクトが含まれていることがよくあります。イメージングドメインには、「ソルトアンドペッパーノイズ」もあります。これは、誰かがドキュメントにソルトアンドペッパー粒子を注いだかのように、暗い領域に明るいピクセル、明るいイメージ領域に暗いピクセルです(イメージングは比喩が好きです)。
スキャンしたドキュメントからノイズを除去するための多くのフィルターがあります。
スペックル除去フィルターは、エッジをぼかすことなく画像からノイズを除去します。複雑な領域を検出し、ノイズが目立つ領域を滑らかにしながら、これらをそのまま残そうとします。スペックル除去は、スキャン後にスポットやスペックルを示す汚れた図面や色あせた図面をクリーンアップできます。
ザ・ メディアンフィルター アルゴリズムを使用して選択範囲内のピクセルの明るさをブレンドすることにより、レイヤーのノイズを低減します。フィルタは、類似した輝度のピクセルを検索し、隣接するピクセルと大きく異なるピクセルを破棄し、中央のピクセルを検索されたピクセルの輝度の中央値に置き換えます。これは、画像内の動きの外観や、スキャンした画像に表示される可能性のある望ましくないパターンを排除または軽減するのに役立ちます。
メディアンフィルタリングは、ノイズを除去しますがエッジを保持するため、OCRの結果を特に向上させます。
スキャンしたドキュメントからノイズを除去するための多くのフィルターがあります。
スペックル除去フィルターは、エッジをぼかすことなく画像からノイズを除去します。複雑な領域を検出し、ノイズが目立つ領域を滑らかにしながら、これらをそのまま残そうとします。スペックル除去は、スキャン後にスポットやスペックルを示す汚れた図面や色あせた図面をクリーンアップできます。
ザ・ メディアンフィルター アルゴリズムを使用して選択範囲内のピクセルの明るさをブレンドすることにより、レイヤーのノイズを低減します。フィルタは、類似した輝度のピクセルを検索し、隣接するピクセルと大きく異なるピクセルを破棄し、中央のピクセルを検索されたピクセルの輝度の中央値に置き換えます。これは、画像内の動きの外観や、スキャンした画像に表示される可能性のある望ましくないパターンを排除または軽減するのに役立ちます。
メディアンフィルタリングは、ノイズを除去しますがエッジを保持するため、OCRの結果を特に向上させます。
スキューは、ドキュメントのスキャンプロセス中に表示される可能性のあるアーティファクトであり、ドキュメントのテキスト/画像をわずかな角度で回転させることで構成されます。ほとんどの場合、用紙がスキャナーに置き忘れられたときに発生します。 Autodeskew はスキャンされたファイルでこの問題を検出して修正するプロセスであるため、デスキューされた画像ではテキスト/画像が正しく配置されます。
このフィルターは、位置合わせされたテキストが画像分析を実行するときにOCRソフトウェアが遭遇することになっているものにはるかに近いため、文字認識の精度を向上させます。 明るさとコントラスト は非常によく知られている画像調整であり、読みやすさを大幅に向上させることができるため、スキャンされたドキュメントにとって特に重要です。
ガンマ補正を忘れることがよくありますが、非常に明るい画像のガンマ設定を変更すると、暗くすることなく読みやすくなります。その目的は、白黒の要素を維持しながら、中間調のコントラストと明るさを最適化することです。
A 切り抜きツール ページの不要な領域を切り取る必要がある場合に便利です。また、黒い境界線やパンチ穴を削除する必要がある場合は、クリーンアップウィジェットが自動的に行います。
このフィルターは、位置合わせされたテキストが画像分析を実行するときにOCRソフトウェアが遭遇することになっているものにはるかに近いため、文字認識の精度を向上させます。 明るさとコントラスト は非常によく知られている画像調整であり、読みやすさを大幅に向上させることができるため、スキャンされたドキュメントにとって特に重要です。
ガンマ補正を忘れることがよくありますが、非常に明るい画像のガンマ設定を変更すると、暗くすることなく読みやすくなります。その目的は、白黒の要素を維持しながら、中間調のコントラストと明るさを最適化することです。
A 切り抜きツール ページの不要な領域を切り取る必要がある場合に便利です。また、黒い境界線やパンチ穴を削除する必要がある場合は、クリーンアップウィジェットが自動的に行います。