Tool Icon

Очистить PDF-файлы

Стирание черных границ, удаление перфорированных отверстий, удаление пятен и автоматическое устранение перекоса страниц PDF

Перетащите файл PDF сюда или
Загрузить с вашего устройства
Загрузить с Google Drive
Загрузить из DropBox
Загрузить с веб-адреса (URL)
Максимальный размер файла: 128 МБ
Powered by GdPicture OCR Preprocessing SDK | Узнайте больше здесь - PSPDFKit GdPicture.NET OCR Preprocessing

Ваши файлы в безопасности!

Мы используем лучшие методы шифрования для защиты ваших данных.

Все документы автоматически удаляются с наших серверов через 30 минут.

При желании вы можете удалить файл вручную сразу после обработки, щелкнув значок корзины.

Как очистить страницы PDF-файла онлайн:

  1. Для начала удалите файл PDF или загрузите его со своего устройства или из службы облачного хранения.
  2. Нажмите на фильтр, который вы хотите применить к документу: стереть черные границы, автоматическое выравнивание, удаление дырокола, удаление пятен.
  3. Механизм фильтра автоматически очищает документ.
  4. Нажмите на кнопку Сохранить.
  5. Загрузите очищенный PDF-файл на свой компьютер или сохраните его непосредственно в облачном хранилище.

Вы знали?

Каждый рабочий процесс сканирования должен включать этап очистки
Почему так важна оптимизация отсканированных документов? Помимо лучшей читаемости и внешнего вида файлов, есть и другие преимущества для очистки отсканированных документов.
Любой механизм обнаружения, например OCR обеспечит лучшие результаты на четком документе. Это также относится к распознавание штрих-кодов , флажки в экзаменационных формах, специальные шрифты в чеках и любые другие элементы.
Вы также получите лучшие результаты сжатия для очищенных документов. Такие инструменты, как гиперкомпрессия обеспечить наилучшее соотношение качества / читаемости для ваших PDF-файлов, а иногда даже улучшить читаемость отсканированных документов благодаря множеству алгоритмов оптимизации.
После того, как ваши документы будут очищены, вы можете сжать и преобразовать их в PDF / A для длительного архивирования и сохранения. Люди, которые будут использовать ваши документы в будущем, будут вам за это благодарны!
Отсканированные документы могут быть шумными
Отсканированные документы довольно часто содержат нежелательные и беспорядочно распространяемые артефакты, известные как «шум». В области визуализации у нас даже есть «шум соли и перца», который представляет собой яркие пиксели на более темных участках и темные пиксели на более светлых участках изображения, как если бы кто-то насыпал частицы соли и перца на документ (изображение любит метафоры).
Существует множество фильтров для удаления шума из отсканированного документа.
Фильтр Despeckle удаляет шум с изображений без размытия краев. Он пытается обнаружить сложные области и оставить их нетронутыми, сглаживая участки, где будет заметен шум. Удаление пятен позволяет очистить грязные или выцветшие рисунки, на которых после сканирования видны пятна или крапинки.
В Медианный фильтр уменьшает шум в слое, смешивая яркость пикселей в выделенном фрагменте с помощью алгоритма. Фильтр ищет пиксели одинаковой яркости, отбрасывая пиксели, которые слишком сильно отличаются от соседних пикселей, и заменяет центральный пиксель средним значением яркости найденных пикселей. Это помогает устранить или уменьшить появление движения на изображении или нежелательных узоров, которые могут появиться на отсканированном изображении.
Медианная фильтрация особенно улучшает результаты распознавания текста, поскольку она удаляет шум, но сохраняет края.
Есть много способов улучшить отсканированный документ
Перекос - это артефакт, который может появиться в процессе сканирования документа, и он заключается в том, что текст / изображения документа повернуты под небольшим углом. В большинстве случаев это происходит, когда бумага неправильно помещена в сканер. Autodeskew - это процесс обнаружения и исправления этой проблемы в отсканированных файлах, поэтому в искаженных изображениях текст / изображения будут правильно выровнены.
Этот фильтр увеличивает точность распознавания символов, потому что выровненный текст намного ближе к тому, с чем должно столкнуться программное обеспечение OCR при выполнении анализа изображения. Яркость и контраст являются хорошо известными настройками изображения и особенно важны для отсканированных документов, поскольку они могут значительно улучшить читаемость.
Мы часто забываем о гамма-коррекции, но изменение настроек гаммы на очень светлом изображении сделает его читабельным, не затемняя его. Его цель - оптимизировать контраст и яркость в полутонах, сохраняя при этом черные и белые элементы.
А инструмент для обрезки полезен, когда вам нужно вырезать ненужные области страницы. А если вам нужно удалить черные границы и пробить дыры, наш виджет очистки сделает это за вас!