Supprimer le texte

Effacer le texte d'un PDF

Déposez un fichier ici ou
Taille maximale du fichier : 500 Mo
  • Télécharger depuis votre appareil
  • Télécharger depuis Google Drive
  • Télécharger depuis DropBox

Vos fichiers sont en sécurité !

Nous utilisons les meilleures méthodes de cryptage pour protéger vos données.

Tous les documents sont automatiquement supprimés de nos serveurs après 30 minutes.

Si vous préférez, vous pouvez supprimer votre fichier manuellement juste après le traitement en cliquant sur l'icône de la corbeille.

Comment supprimer les textes d'un PDF en ligne :

  1. Pour commencer, déposez votre fichier PDF ou téléchargez-le depuis votre appareil ou votre service de stockage cloud.
  2. Choisissez vos paramètres et cliquez sur le bouton Supprimer le texte.
  3. Téléchargez le fichier PDF sur votre ordinateur ou enregistrez-le directement dans votre service de stockage cloud.

Le saviez-vous?

Tous les PDF ne sont pas créés égaux
Le texte n'est parfois pas du texte dans un PDF
De nombreux PDF incluent du texte invisible
Prenons deux fichiers PDF : un créé avec un traitement de texte, comme MS Word, par exemple, et un PDF scanné. Les deux fichiers se terminent par l'extension .pdf. Cependant, ce ne sont pas les mêmes. Si vous ouvrez le fichier PDF créé avec votre traitement de texte, vous pouvez faire CTRL + F, entrer les mots que vous recherchez et le logiciel mettra en évidence les résultats dans le document.
Mais essayez de sélectionner ou de rechercher du texte dans un PDF produit par votre logiciel de numérisation lorsque vous avez scanné des documents papier, ce n'est pas possible. C'est parce que le document PDF numérisé n'est pas basé sur du texte, il est basé sur une image. Ce type de PDF est appelé PDF raster , un format prochainement normalisé pour le stockage et l'échange de documents numérisés
Il existe aussi les PDF vectoriels, souvent créés à partir de formats CAO , ou de programmes de conception graphique comme Adobe Illustrator.
Le texte est un élément indépendant dans les fichiers PDF natifs (PDF Text Element). Vous pouvez voir des caractères dans un PDF, mais ces caractères ne sont pas nécessairement des éléments de texte. Comment faire la différence ?
Comme nous venons de le voir, le texte peut être une image raster de texte ou une image vectorielle de texte. Dans tous les cas, il ressemble à du texte, mais l'ordinateur ne le reconnaît pas comme tel et ne peut pas le sélectionner ni le rechercher.
Le texte créé par un traitement de texte n'est ni raster ni une image vectorielle, il est (adéquatement) appelé texte réel (Real Text), ou élément de texte PDF (PDF Text Element). Le texte réel peut être sélectionné et faire l’objet d’une recherche. Il reste net même en zoomant, contrairement au texte vectoriel qui apparaît grumeleux et au texte raster qui est pixellisé
Comme dans la célèbre peinture de Magritte , dans le monde du PDF, une image d'un texte n'est pas le texte lui-même.
Pour rendre le texte d'un document numérisé consultable, vous devez utiliser l’OCR. Ce processus ajoute une couche de texte invisible dans le PDF, afin que le moteur OCR puisse reconnaître les caractères et « lire » le texte. Ce texte n'est pas utilisé lors de l'impression ou de la visualisation du document PDF et il est invisible pour l'utilisateur.
Pourquoi auriez-vous besoin de supprimer ce texte caché ? Parfois, un texte numérisé et océrisé ne s'affiche pas bien à l’écran. Dans certains cas, l'astuce consiste à supprimer le texte masqué et à retraiter le document avec un autre outil (comme AvePDF OCR PDF ).
Il est également possible que le moteur OCR que vous utilisez doive être mis à jour ou que vous souhaitiez passer à un autre outil avec de meilleures performances. Enfin, si vous enregistrez au format PDF/OCR un lot de documents qui contient déjà des fichiers océrisés, le fichier sortant sera plus lourd.
Autres outils