Avelyn
Pregledovalnik PDF v oblaku s pomočnikom AI
Tool Icon

Odstrani besedilo PDF

Označite in izbrišite besedilo v PDF-ju

Spustite datoteko PDF sem ali
Naložite iz svoje naprave
Naloži iz Google Drive
Naloži s DropBoxa
Naloži s spletnega naslova (URL)
Največja velikost datoteke: 128 MB

Vaše datoteke so varne!

Za zaščito vaših podatkov uporabljamo najboljše načine šifriranja.

Vsi dokumenti se samodejno izbrišejo iz naših strežnikov po 30 minutah.

Če želite, lahko datoteko po obdelavi ročno izbrišete s klikom na ikono koša.

Kako odstraniti besedila PDF v spletu:

  1. Za začetek spustite datoteko PDF ali jo naložite iz naprave ali iz storitve za shranjevanje v oblaku.
  2. Izberite nastavitve in kliknite gumb Odstrani besedilo.
  3. Prenesite datoteko PDF v računalnik ali jo shranite neposredno v storitev za shranjevanje v oblaku.

Ali si vedel?

Vsi PDF-ji niso ustvarjeni enako
Vzemimo dve datoteki PDF: eno, ustvarjeno z urejevalnikom besedil, na primer MS Word, in en optično prebran dokument. Obe datoteki se končata s pripono .pdf. Vendar te datoteke niso enake. Če odprete datoteko PDF, ustvarjeno z urejevalnikom besedil, lahko pritisnete CTRL + F, vnesete iskane besede in programska oprema za pregledovanje PDF bo poudarila rezultate dokumenta.
Toda poskusite izbrati ali iskati besedilo v dokumentu PDF, ki ga je ustvarila programska oprema za optični bralnik, ko skenirate dokumente na papirju, to ni mogoče. Razlog je, da skenirani dokument PDF ne temelji na besedilu; je na sliki. Ta vrsta PDF se imenuje a PDF rastrski , kmalu pa bo postala standardna oblika za shranjevanje, prevoz in izmenjavo skeniranih dokumentov
In potem obstajajo vektorski PDF-ji, ki so pogosto ustvarjeni iz CAD formati ali programi za grafično oblikovanje, kot je Adobe Illustrator.
Besedilo včasih ni besedilo v dokumentu PDF
Besedilo je neodvisen element v izvornih dokumentih PDF. V dokumentu PDF lahko vidite besedilne znake, vendar ti elementi niso nujno elementi besedila PDF. Kako lahko ugotovite razliko?
Kot smo pravkar videli, je besedilo lahko rastrska slika besedila ali vektorska slika besedila. V vseh primerih je videti kot besedilo, vendar ga računalnik ne prepozna kot takega in ga ne more izbrati ali iskati.
Besedilo, ki ga je ustvaril urejevalnik besedil, ni niti rastrska niti vektorska slika, ampak se (ustrezno) imenuje Real Text ali PDF Text Element. Pravo besedilo je možno iskati in izbrati. Tudi pri povečavi je videti ostro, nasprotno od vektorskega besedila, ki je videti grudastega, in rastrskega besedila, ki je slikovno slikovno.
Kot v Magritte's znana slika, v svetu PDF, podoba besedila ni ista stvar kot samo besedilo.
Veliko dokumentov PDF vključuje nevidno besedilo
Če želite besedilo skeniranega dokumenta iskati, ga morate zagnati prek OCR. Ta postopek doda plast nevidnega besedila v dokumentu PDF, tako da OCR motor prepozna znake in jih "prebere". To besedilo se med tiskanjem ali pregledovanjem dokumenta PDF ne uporablja in je uporabniku nevidno.
Zakaj bi morali odstraniti skriti tekst PDF-ja? Včasih se skenirano besedilo, ki je bilo OCRed, v gledalcu ne prikaže dobro. V nekaterih primerih je trik odstraniti skrito besedilo in znova obdelati dokument z drugim orodjem (npr AvePDF OCR PDF ).
Možno je tudi, da je treba posodobiti OCR motor, ki ga uporabljate, in želite znova obdelati svoje dokumente ali preiti na drugo orodje z boljšimi zmogljivostmi. Zadnji premislek, če shranite kot PDF / OCR sveženj dokumentov, ki vključujejo že datoteke OCRed, bo datoteka z rezultati težja.