Почистване на PDF файлове
Изтриване на черни граници, премахване на пробиване на дупки, премахване на петна и автоматично изкривяване на страници на PDF
Пуснете вашия PDF файл тук или
Качване от вашето устройство
Качване от Google Drive
Качване от DropBox
Качване от уеб адрес (URL)
Максимален размер на файла: 128 MB
Powered by GdPicture OCR Preprocessing SDK | Научете повече тук - PSPDFKit GdPicture.NET OCR Preprocessing
Вашите файлове са безопасни!
Ние използваме най-добрите методи за криптиране, за да защитим вашите данни.
Всички документи се изтриват автоматично от нашите сървъри след 30 минути.
Ако предпочитате, можете да изтриете файла си ръчно веднага след обработката, като щракнете върху иконата на кошчето.
Как да почистите страниците на PDF файл онлайн:
- За да започнете, пуснете PDF файла или го качете от устройството си или от услугата си за съхранение в облак.
- Кликнете върху филтъра, който искате да приложите във вашия документ: изтрийте черни рамки, автоматично премахване на декупаж, премахване на дупчица за отваряне, десплей.
- Двигателят на филтъра автоматично почиства документа.
- Кликнете върху бутона Запиши.
- Изтеглете изчистения PDF файл на вашия компютър или го запишете директно в услугата за съхранение в облак.
Публикации в блога
Знаеше ли?
Защо оптимизирането на сканираните документи е толкова важно? Освен по-добра четливост и визуален външен вид на файловете, има и други предимства за почистване на сканирани документи.
Всеки механизъм за откриване като OCR ще осигури по-добри резултати на ясен документ. Това е така и за разпознаване на баркодове , квадратчета за отметки във формуляри за изпити, специални шрифтове в чекове и всеки друг елемент.
Получавате и по-добри резултати за компресиране на почистени документи. Инструменти като хиперкомпресия осигурете най-доброто съотношение качество / четливост за вашите PDF файлове и понякога дори подобрете четливостта на сканираните документи, благодарение на много алгоритми за оптимизация.
След като документите ви бъдат почистени, можете да ги компресирате и конвертирате в PDF / A за дългосрочно архивиране и съхранение. Хората, които ще използват вашите документи в бъдеще, ще ви благодарят за това!
Всеки механизъм за откриване като OCR ще осигури по-добри резултати на ясен документ. Това е така и за разпознаване на баркодове , квадратчета за отметки във формуляри за изпити, специални шрифтове в чекове и всеки друг елемент.
Получавате и по-добри резултати за компресиране на почистени документи. Инструменти като хиперкомпресия осигурете най-доброто съотношение качество / четливост за вашите PDF файлове и понякога дори подобрете четливостта на сканираните документи, благодарение на много алгоритми за оптимизация.
След като документите ви бъдат почистени, можете да ги компресирате и конвертирате в PDF / A за дългосрочно архивиране и съхранение. Хората, които ще използват вашите документи в бъдеще, ще ви благодарят за това!
Сканираните документи доста често съдържат нежелани и произволно разпространени артефакти, известни като „шум“. В домейна за изображения имаме дори „шум от сол и черен пипер“, който представлява ярки пиксели на по-тъмни области и тъмни пиксели на по-светли области на изображение, сякаш някой е излял частици сол и черен пипер върху документа (изображенията харесват метафори).
Има много филтри за премахване на шума от сканиран документ.
Филтърът Despeckle премахва шума от изображенията без замъгляване на ръбовете. Той се опитва да открие сложни зони и да ги остави непокътнати, докато изглажда областите, където ще се забелязва шум. Despeckle може да почисти мръсни или избледнели рисунки, които показват петна или петна след сканиране.
The Среден филтър намалява шума в слой чрез смесване на яркостта на пикселите в селекцията с помощта на алгоритъм. Филтърът търси пиксели с подобна яркост, изхвърляйки пиксели, които се различават твърде много от съседните пиксели, и замества централния пиксел със средната стойност на яркостта на търсените пиксели. Той помага да се премахне или намали появата на движение в изображение или нежелани модели, които могат да се появят в сканирано изображение.
Средното филтриране подобрява особено OCR резултатите, защото премахва шума, но запазва ръбовете.
Има много филтри за премахване на шума от сканиран документ.
Филтърът Despeckle премахва шума от изображенията без замъгляване на ръбовете. Той се опитва да открие сложни зони и да ги остави непокътнати, докато изглажда областите, където ще се забелязва шум. Despeckle може да почисти мръсни или избледнели рисунки, които показват петна или петна след сканиране.
The Среден филтър намалява шума в слой чрез смесване на яркостта на пикселите в селекцията с помощта на алгоритъм. Филтърът търси пиксели с подобна яркост, изхвърляйки пиксели, които се различават твърде много от съседните пиксели, и замества централния пиксел със средната стойност на яркостта на търсените пиксели. Той помага да се премахне или намали появата на движение в изображение или нежелани модели, които могат да се появят в сканирано изображение.
Средното филтриране подобрява особено OCR резултатите, защото премахва шума, но запазва ръбовете.
Косото е артефакт, който може да се появи по време на процеса на сканиране на документа и се състои в завъртане на текста / изображенията на документа под лек ъгъл. По-голямата част от времето се случва, когато хартията е поставена неправилно в скенера. Autodeskew е процесът на откриване и отстраняване на този проблем върху сканираните файлове, така че декивираните изображения ще имат правилно подравнен текст / изображения.
Този филтър увеличава степента на точност на разпознаване на символи, тъй като подравненият текст е много по-близо до това, което софтуерът OCR трябва да срещне при извършване на анализ на изображението. Яркост и контраст са много добре известни корекции на изображенията и са особено важни за сканираните документи, защото могат значително да подобрят четливостта.
Често забравяме за гама корекцията, но промяната на гама настройките на много леко изображение ще го направи четим, без да го затъмнява. Целта му е да оптимизира контраста и яркостта в средните тонове, като същевременно запази черно-белите елементи.
A инструмент за изрязване е полезно, когато трябва да изрежете нежелани области на страница. И ако трябва да премахнете черни граници и да пробиете дупки, нашата джаджа за почистване ще го направи вместо вас!
Този филтър увеличава степента на точност на разпознаване на символи, тъй като подравненият текст е много по-близо до това, което софтуерът OCR трябва да срещне при извършване на анализ на изображението. Яркост и контраст са много добре известни корекции на изображенията и са особено важни за сканираните документи, защото могат значително да подобрят четливостта.
Често забравяме за гама корекцията, но промяната на гама настройките на много леко изображение ще го направи четим, без да го затъмнява. Целта му е да оптимизира контраста и яркостта в средните тонове, като същевременно запази черно-белите елементи.
A инструмент за изрязване е полезно, когато трябва да изрежете нежелани области на страница. И ако трябва да премахнете черни граници и да пробиете дупки, нашата джаджа за почистване ще го направи вместо вас!