إزالة النص

حذف نص ملف PDF

إسقاط ملفك هنا أو
الحجم الأقصى للملف: 500 ميغابايت
  • حمّل من جهازك
  • تحميل من جوجل درايف
  • تحميل من DropBox

ملفاتك آمنة!

نستخدم أفضل طرق التشفير لحماية بياناتك.

يتم حذف جميع المستندات تلقائيًا من خوادمنا بعد 30 دقيقة.

إذا كنت تفضل ذلك ، يمكنك حذف ملفك يدويًا بعد معالجته مباشرةً بالنقر فوق رمز السلة.

كيفية إزالة نصوص PDF على الإنترنت:

  1. للبدء ، قم بإسقاط ملف PDF أو تحميله من جهازك أو خدمة التخزين السحابي.
  2. اختر الإعدادات الخاصة بك وانقر على زر إزالة النص.
  3. قم بتنزيل ملف PDF على جهاز الكمبيوتر الخاص بك أو احفظه مباشرة في خدمة التخزين السحابي.

هل كنت تعلم؟

لم يتم إنشاء جميع ملفات PDF على قدم المساواة
في بعض الأحيان لا يكون النص نصًا في ملف PDF
تتضمن العديد من ملفات PDF نصًا غير مرئي
لنأخذ ملفين PDF: أحدهما تم إنشاؤه باستخدام معالج نصوص ، مثل MS Word ، على سبيل المثال ، ومستند ممسوح ضوئيًا. ينتهي كلا الملفين بامتداد .pdf. ومع ذلك ، هذه الملفات ليست هي نفسها. إذا قمت بفتح ملف PDF الذي تم إنشاؤه باستخدام معالج النصوص الخاص بك ، فيمكنك الضغط على CTRL + F ، وإدخال الكلمات التي تبحث عنها ، وسوف يبرز برنامج عارض PDF نتائج المستند.
ولكن حاول تحديد أو البحث عن نص في ملف PDF تم إنتاجه بواسطة برنامج الماسح الضوئي عندما تقوم بمسح مستندات ورقية ضوئيًا ، فهذا غير ممكن. ذلك لأن مستند PDF الممسوح ضوئيًا ليس مستندًا إلى نص ؛ إنه قائم على الصورة. يسمى هذا النوع من PDF a ملفات PDF النقطية ، وسيصبح قريبًا تنسيقًا قياسيًا لتخزين المستندات الممسوحة ضوئيًا ونقلها وتبادلها
ثم ، هناك ملفات PDF متجهة ، غالبًا ما يتم إنشاؤها من نذل - وغد التنسيقات ، أو برامج التصميم الجرافيكي مثل Adobe Illustrator.
النص هو عنصر مستقل في ملفات PDF الأصلية. قد ترى أحرف نصية في ملف PDF ، لكن تلك الأحرف ليست بالضرورة عناصر نصية بتنسيق PDF. كيف يمكنك معرفة الفرق؟
كما رأينا للتو ، يمكن أن يكون النص صورة نقطية للنص أو صورة متجهة للنص. في جميع الحالات ، يبدو النص ، ولكن الكمبيوتر لا يتعرف عليه على هذا النحو ولا يمكنه تحديده أو البحث عنه.
النص الذي تم إنشاؤه بواسطة معالج النصوص ليس خطوطًا نقطية ولا صورة متجهة ، إنه (بشكل كاف) يسمى Real Text أو PDF Text Element. النص الحقيقي قابل للبحث والتحديد. يبدو حادًا حتى عند التكبير ، على عكس النص المتجه الذي يبدو متكتلًا ، والنص النقطي الذي يتم بيكسله.
كما هو الحال في ماغريت اللوحة الشهيرة ، في عالم PDF ، صورة النص ليست نفس الشيء مثل النص نفسه.
لجعل نص المستند الممسوح ضوئيًا قابلاً للبحث ، تحتاج إلى تشغيله من خلال OCR. تضيف هذه العملية طبقة من النص غير المرئي في PDF ، بحيث يمكن لمحرك OCR التعرف على الأحرف و "قراءة" النص. لا يتم استخدام هذا النص أثناء طباعة أو عرض مستند PDF ، وهو غير مرئي للمستخدم.
لماذا تحتاج إلى إزالة النص المخفي لملف PDF؟ في بعض الأحيان ، لا يتم عرض النص الذي تم مسحه ضوئيًا والذي تم التعرف عليه ضوئيًا بشكل جيد في العارض. في بعض الحالات ، تكمن الحيلة في إزالة النص المخفي وإعادة معالجة المستند باستخدام أداة أخرى (مثل AvePDF OCR PDF ).
من الممكن أيضًا أن يتم تحديث محرك OCR الذي تستخدمه ، وتريد إعادة معالجة مستنداتك أو التبديل إلى أداة أخرى ذات أداء أفضل. الاعتبار الأخير ، إذا قمت بحفظ كملف PDF / OCR دفعة من المستندات التي تتضمن ملفات OCRed بالفعل ، سيكون ملف النتيجة أثقل.
أدوات أخرى