Poista teksti

Poista PDF-tiedoston teksti

Pudota tiedosto tänne tai
Tiedoston enimmäiskoko: 500 MB
  • Lataa laitteeltasi
  • Lataa Google Drivesta
  • Lataa DropBoxista

Tiedostosi ovat turvassa!

Käytämme parhaita salausmenetelmiä tietosi suojelemiseksi.

Kaikki asiakirjat poistetaan automaattisesti palvelimistamme 30 minuutin kuluttua.

Voit halutessasi poistaa tiedoston manuaalisesti heti käsittelyn jälkeen napsauttamalla bin-kuvaketta.

Kuinka poistaa PDF-tiedoston tekstit verkossa:

  1. Aloita pudottamalla PDF-tiedosto tai lähettämällä se laitteeltasi tai pilvitallennuspalvelustasi.
  2. Valitse asetukset ja napsauta Poista teksti -painiketta.
  3. Lataa PDF-tiedosto tietokoneellesi tai tallenna se suoraan pilvitallennuspalveluun.

Tiesitkö?

Kaikkia PDF-tiedostoja ei luoda yhtä suuret
Teksti ei joskus ole PDF-tiedoston teksti
Monissa PDF-tiedostoissa on näkymätöntä tekstiä
Otetaan kaksi PDF-tiedostoa: toinen luodaan tekstinkäsittelyohjelmalla, kuten esimerkiksi MS Word, ja toinen skannattu asiakirja. Molemmat tiedostot päättyvät .pdf-tiedostotunnisteeseen. Nämä tiedostot eivät kuitenkaan ole samoja. Jos avaat tekstinkäsittelyohjelmalla luodun PDF-tiedoston, voit painaa CTRL + F, kirjoittaa etsimäsi sanat. PDF-katseluohjelmisto korostaa asiakirjan tulokset.
Mutta yritä valita tai etsiä tekstiä skanneriohjelmiston tuottamasta PDF-tiedostosta, kun olet skannannut paperiasiakirjoja, se ei ole mahdollista. Syynä on, että skannattu PDF-dokumentti ei ole tekstipohjainen; se on kuvapohjainen. Tämän tyyppistä PDF: tä kutsutaan a PDF-rasteri , ja siitä on pian tulossa vakioformaatti skannattujen asiakirjojen varastointiin, kuljettamiseen ja vaihtamiseen
Ja sitten on vektoripdf-tiedostoja, jotka usein luodaan CAD muodot tai graafisen suunnittelun ohjelmat, kuten Adobe Illustrator.
Teksti on natiivien PDF-tiedostojen itsenäinen elementti. Saatat nähdä tekstimerkkejä PDF-muodossa, mutta ne eivät välttämättä ole PDF-tekstielementtejä. Kuinka voit kertoa eron?
Kuten olemme juuri nähneet, teksti voi olla tekstistä rasterikuva tai vektorikuva. Kaikissa tapauksissa se näyttää tekstiltä, mutta tietokone ei tunnista sitä sellaisenaan eikä voi valita tai etsiä sitä.
Tekstinkäsittelyohjelman luoma teksti ei ole rasteri eikä vektorikuva, sitä kutsutaan (riittävästi) Oikea teksti tai PDF-tekstiosa. Oikea teksti on haettavissa ja valittavissa. Se näyttää terävältä myös zoomaamalla, päinvastoin kuin vektoriteksti, joka näyttää kömpelöltä, ja rasteriteksti, joka pikselöidään.
Kuten sisään Magritte n kuuluisa maalaus, PDF-maailmassa kuva tekstistä ei ole sama asia kuin itse teksti.
Jotta skannatun asiakirjan teksti olisi haettavissa, se on suoritettava OCR: n kautta. Tämä prosessi lisää kerroksen näkymätöntä tekstiä PDF: ään, jotta OCR-moottori tunnistaa merkit ja ”lukee” tekstin. Tätä tekstiä ei käytetä tulostettaessa tai katseltaessa PDF-dokumenttia, ja se on käyttäjän näkymätön.
Miksi sinun pitäisi poistaa PDF-tiedoston piilotettu teksti? Joskus OCR-skannattu teksti ei näy hyvin katseluohjelmassa. Joissain tapauksissa temppu on piilotetun tekstin poistaminen ja asiakirjan uudelleenkäsittely toisella työkalulla (kuten AvePDF OCR PDF ).
On myös mahdollista, että käyttämäsi OCR-moottori on päivitettävä, ja haluat käsitellä asiakirjat uudelleen tai vaihtaa toiseen työkaluun, jolla on parempi suorituskyky. Viimeinen huomio, jos tallennat PDF / OCR-tiedostoina erän asiakirjoja, jotka sisältävät jo OCRed-tiedostot, tulostiedosto on raskaampi.
Muut työkalut