Tool Icon

PDF-szöveg eltávolítása

Szöveg kiemelése és törlése a PDF-ben

Dobja ide a PDF fájlt, vagy
Töltse fel az eszközéről
Töltse fel a Google Drive-ból
Töltse fel a DropBoxból
Feltöltés webcímről (URL)
Maximális fájlméret: 128 MB
Powered by GdPicture PDF Editor SDK | Tudjon meg többet itt - PSPDFKit GdPicture.NET PDF Editor

A fájlok biztonságban vannak!

Az Ön adatainak védelme érdekében a legjobb titkosítási módszereket használjuk.

Az összes dokumentum 30 perc elteltével automatikusan törlődik szervereinkről.

Ha úgy tetszik, akkor azonnal törölheti a fájlt a feldolgozás után, ha rákattint a tálca ikonra.

A PDF-fájlok online eltávolítása:

  1. A kezdéshez dobja el a PDF-fájlt, vagy töltse fel a készülékéről vagy a felhőalapú tárolási szolgáltatásból.
  2. Válassza ki a beállításokat, és kattintson a Szöveg eltávolítása gombra.
  3. Töltse le a PDF fájlt a számítógépére, vagy mentse közvetlenül a felhőalapú tárolási szolgáltatásra.

Tudtad?

Az összes PDF nem egyenlő
Vegyünk két PDF-fájlt: az egyiket egy szövegszerkesztővel, például például MS Word készítik, és egy beolvasott dokumentumot. Mindkét fájl a .pdf kiterjesztéssel zárul. Ezek a fájlok azonban nem azonosak. Ha megnyitja a szövegszerkesztővel létrehozott PDF fájlt, akkor nyomja meg a CTRL + F billentyűket, írja be a kívánt szavakat, és a PDF megjelenítő szoftver kiemeli a dokumentum eredményét.
De próbáljon meg szelektálni vagy keresni szöveget a lapolvasó szoftver által készített PDF-fájlban, amikor beszkennelt papír dokumentumokat használ, ez nem lehetséges. Ennek oka az, hogy a beolvasott PDF dokumentum nem szöveges alapú; kép-alapú. Az ilyen típusú PDF fájlt a PDF raszter , és hamarosan a beolvasott dokumentumok tárolásának, szállításának és cseréjének szabványos formátumává válik
És akkor vannak vektor-PDF-ek, amelyek gyakran a webhelyről készülnek CAD formátumok vagy grafikai tervező programok, például az Adobe Illustrator.
A szöveg néha nem egy szöveg egy PDF-fájlban
A szöveg független elem a natív PDF-fájlokban. Lehet, hogy szöveges karaktereket lát a PDF-fájlban, de ezek a karakterek nem feltétlenül PDF-elemek. Hogyan tudod megmondani a különbséget?
Mint láttuk, a szöveg lehet a szöveg raszteres képe vagy a szöveg vektorképe. Minden esetben szövegesnek tűnik, de a számítógép nem ismeri fel ilyenként, és nem tudja kiválasztani vagy keresni.
A szövegszerkesztő által létrehozott szöveg nem raszteres, sem vektor kép, azt (megfelelően) valódi szövegnek vagy PDF szöveg elemnek hívják. A Valós szöveg kereshető és választható. Élesnek tűnik még nagyításkor is, ellenkező esetben a vektoros szöveg, amely pontyosnak tűnik, és a raszteres szöveg pixelizálva van.
Mint-ban-ben Magritte híres festmény, a PDF-világban a szöveg képe nem ugyanaz, mint maga a szöveg.
Sok PDF-fájl láthatatlan szöveget tartalmaz
A beolvasott dokumentum szövegének kereshetővé tételéhez az OCR segítségével kell futtatnia. Ez a folyamat láthatatlan szövegréteget ad a PDF-fájlban, így az OCR motor képes felismerni a karaktereket és „elolvasni” a szöveget. Ezt a szöveget nem használják a PDF dokumentum nyomtatásakor vagy megtekintésekor, és a felhasználó számára láthatatlan.
Miért kellene eltávolítania a PDF rejtett szövegét? Időnként az OCR-formátumú beolvasott szöveg nem jelenik meg jól a nézőben. Bizonyos esetekben az a trükk, hogy eltávolítják a rejtett szöveget és újra feldolgozzák a dokumentumot egy másik eszközzel (például AvePDF OCR PDF ).
Lehetséges az is, hogy a használt OCR-motort frissíteni kell, és újra feldolgozni szeretné a dokumentumait, vagy át szeretne váltani egy másik, jobb teljesítményű eszközre. Az utolsó szempont, ha PDF / OCR formátumban elmenti egy olyan dokumentumcsomagot, amely már OCRed fájlokat tartalmaz, az eredményfájl nehezebb lesz.