Avelyn
Molnbaserad PDF-visare med en AI-assistent
Tool Icon

Ta bort PDF-text

Markera och ta bort text i din PDF

Släpp din PDF-fil här eller
Ladda upp från din enhet
Ladda upp från Google Drive
Ladda upp från DropBox
Ladda upp från webbadress (URL)
Max filstorlek: 128 MB

Dina filer är säkra!

Vi använder de bästa krypteringsmetoderna för att skydda dina data.

Alla dokument raderas automatiskt från våra servrar efter 30 minuter.

Om du föredrar det, kan du radera din fil manuellt direkt efter bearbetning genom att klicka på fackikonen.

Hur man tar bort texter av en PDF online:

  1. För att starta, släpp din PDF-fil eller ladda upp den från din enhet eller din molnlagringstjänst.
  2. Välj dina inställningar och klicka på knappen Ta bort text.
  3. Ladda ner PDF-filen till din dator eller spara den direkt till din molnlagringstjänst.

Visste du?

Alla PDF-filer skapas inte lika
Låt oss ta två PDF-filer: en skapad med en ordbehandlare, till exempel MS Word, och en skannad dokument. Båda filerna slutar med .pdf-förlängningen. Dessa filer är dock inte desamma. Om du öppnar PDF-filen skapad med din ordbehandlare kan du trycka på CTRL + F, ange orden du letar efter och PDF-visningsprogramvaran kommer att markera dokumentets resultat.
Men försök att välja eller söka efter text i en PDF som produceras av din skannermjukvara när du har skannat pappersdokument, det är inte möjligt. Det beror på att det skannade PDF-dokumentet inte är textbaserat; det är bildbaserat. Denna typ av PDF kallas a PDF-raster , och det kommer snart att bli ett standardformat för att lagra, transportera och utbyta skannade dokument
Och sedan finns det vektor-PDF-filer, ofta skapade från CAD format eller grafiska designprogram som Adobe Illustrator.
Text är ibland inte text i en PDF
Text är ett oberoende element i ursprungliga PDF-filer. Du kan se texttecken i PDF, men dessa tecken är inte nödvändigtvis PDF-textelement. Hur kan du se skillnaden?
Som vi just har sett kan text vara en rasterbild av text eller en vektorbild av text. I alla fall ser det ut som text, men datorn känner inte igen den som sådan och kan inte välja eller söka i den.
Text som skapas av en ordbehandlare är varken en raster eller en vektorbild, den kallas (tillräckligt) Real Text eller PDF Text Element. Real Text är sökbar och kan väljas. Det ser skarpt ut även när du zoomer, tvärtom mot vektortekst som verkar klumpig och rastertext som är pixeliserad.
Som i Magrittes berömd målning, i PDF-världen, är en bild av en text inte samma sak som själva texten.
Många PDF-filer innehåller osynlig text
För att göra texten i ett skannat dokument sökbart måste du köra den genom OCR. Denna process lägger till ett lager av osynlig text i PDF, så OCR-motorn kan känna igen tecknen och "läsa" texten. Den här texten används inte under utskrift eller visning av PDF-dokumentet, och den är osynlig för användaren.
Varför skulle du behöva ta bort den dolda texten i en PDF? Ibland visas en skannad text som har OCR inte bra i en tittare. I vissa fall är tricket att ta bort dold text och behandla dokumentet på nytt med ett annat verktyg (som AvePDF OCR PDF ).
Det är också möjligt att OCR-motorn du använder måste uppdateras och du vill bearbeta dina dokument eller byta till ett annat verktyg med bättre prestanda. Den sista överväganden, om du sparar som PDF / OCR en bunt med dokument som innehåller redan OCR-filer, blir resultatfilen tyngre.