पाठ निकालें

एक पीडीएफ का पाठ हटाएँ

अपनी फ़ाइल को यहाँ छोड़ें या
अधिकतम फ़ाइल का आकार: 500 एमबी
  • अपने डिवाइस से अपलोड करें
  • Google ड्राइव से अपलोड करें
  • ड्रॉपबॉक्स से अपलोड करें

आपकी फाइलें सुरक्षित हैं!

हम आपके डेटा की सुरक्षा के लिए सर्वोत्तम एन्क्रिप्शन विधियों का उपयोग करते हैं।

सभी दस्तावेज़ 30 मिनट के बाद हमारे सर्वर से स्वचालित रूप से हटा दिए जाते हैं।

यदि आप चाहें, तो आप बिन आइकन पर क्लिक करके प्रसंस्करण के बाद मैन्युअल रूप से अपनी फ़ाइल को हटा सकते हैं।

ऑनलाइन पीडीएफ के ग्रंथों को कैसे निकालना है:

  1. शुरू करने के लिए, अपनी पीडीएफ फाइल को ड्रॉप करें या अपने डिवाइस या अपनी क्लाउड स्टोरेज सेवा से अपलोड करें।
  2. अपनी सेटिंग्स चुनें और निकालें टेक्स्ट बटन पर क्लिक करें।
  3. अपने कंप्यूटर पर पीडीएफ फाइल डाउनलोड करें या इसे सीधे अपने क्लाउड स्टोरेज सर्विस में सेव करें।

क्या तुम्हें पता था?

सभी PDF को समान नहीं बनाया गया है
पाठ कभी-कभी पीडीएफ में पाठ नहीं होता है
कई PDF में अदृश्य पाठ शामिल है
आइए दो पीडीएफ फाइलें लें: एक शब्द प्रोसेसर के साथ बनाया गया, जैसे एमएस वर्ड, उदाहरण के लिए, और एक स्कैन किया हुआ दस्तावेज़। दोनों फाइलें .pdf एक्सटेंशन के साथ समाप्त होती हैं। हालाँकि, ये फ़ाइलें समान नहीं हैं। यदि आप अपने वर्ड प्रोसेसर के साथ बनाई गई पीडीएफ फाइल को खोलते हैं, तो आप CTRL + F दबा सकते हैं, उन शब्दों को दर्ज कर सकते हैं जिन्हें आप ढूंढ रहे हैं, और पीडीएफ दर्शक सॉफ्टवेयर दस्तावेज़ के परिणामों को उजागर करेगा।
लेकिन जब आप स्कैन किए गए कागज़ात दस्तावेज़ों के द्वारा अपने स्कैनर सॉफ्टवेयर द्वारा निर्मित पीडीएफ में पाठ को चुनने या खोजने का प्रयास करते हैं, तो यह संभव नहीं है। इसका कारण यह है कि स्कैन किए गए पीडीएफ दस्तावेज़ पाठ-आधारित नहीं है; यह छवि-आधारित है। इस प्रकार के पीडीएफ को a कहा जाता है पीडीएफ रेखापुंज , और यह स्कैन किए गए दस्तावेजों के भंडारण, परिवहन और विनिमय के लिए एक मानक प्रारूप बनने वाला है
और फिर, वेक्टर पीडीएफ होते हैं, जिन्हें अक्सर बनाया जाता है सीएडी प्रारूप, या ग्राफिक डिजाइन प्रोग्राम जैसे Adobe Illustrator।
मूल PDF में पाठ एक स्वतंत्र तत्व है। आप पीडीएफ में पाठ वर्ण देख सकते हैं, लेकिन वे वर्ण पीडीएफ पाठ तत्व नहीं हैं। आप अंतर कैसे बता सकते हैं?
जैसा कि हमने अभी देखा है, पाठ पाठ की रेखापुंज छवि या पाठ की सदिश छवि हो सकती है। सभी मामलों में, यह पाठ जैसा दिखता है, लेकिन कंप्यूटर इसे इस रूप में नहीं पहचानता है और इसे चुन या खोज नहीं सकता है।
शब्द प्रोसेसर द्वारा बनाया गया पाठ न तो एक रेखापुंज है और न ही एक वेक्टर छवि है, यह (पर्याप्त रूप से) वास्तविक पाठ, या पीडीएफ पाठ तत्व कहा जाता है। वास्तविक पाठ खोज योग्य और चयन योग्य है। यह जूम करते समय भी तेज दिखता है, वेक्टर पाठ के विपरीत जो कि ढेलेदार दिखता है, और रेखापुंज पाठ जो कि पिक्सेलित होता है।
जैसे की Magritte की प्रसिद्ध पेंटिंग, पीडीएफ दुनिया में, पाठ की एक छवि पाठ के रूप में एक ही चीज नहीं है।
स्कैन किए गए दस्तावेज़ के पाठ को खोज योग्य बनाने के लिए, आपको इसे ओसीआर के माध्यम से चलाने की आवश्यकता है। यह प्रक्रिया पीडीएफ में अदृश्य पाठ की एक परत जोड़ती है, इसलिए ओसीआर इंजन पात्रों को पहचान सकता है और पाठ को "पढ़" सकता है। यह पाठ पीडीएफ दस्तावेज़ को देखने या देखने के दौरान उपयोग नहीं किया जाता है, और यह उपयोगकर्ता के लिए अदृश्य है।
आपको पीडीएफ के छिपे हुए पाठ को निकालने की आवश्यकता क्यों होगी? कभी-कभी, एक स्कैन किया हुआ पाठ जो OCRed किया गया है वह एक दर्शक में अच्छी तरह से प्रदर्शित नहीं होता है। कुछ मामलों में, ट्रिक छिपे हुए टेक्स्ट को हटाने और दस्तावेज़ को किसी अन्य टूल (जैसे) के साथ फिर से प्रोसेस करने के लिए है AvePDF ओसीआर पीडीएफ )।
यह भी संभव है कि जिस ओसीआर इंजन का आप उपयोग कर रहे हैं उसे अपडेट किया जाना है, और आप अपने दस्तावेज़ों को फिर से संसाधित करना चाहते हैं या बेहतर प्रदर्शन के साथ किसी अन्य टूल पर स्विच करना चाहते हैं। अंतिम विचार, यदि आप पीडीएफ / ओसीआर दस्तावेजों के एक बैच के रूप में सहेजते हैं जिसमें पहले से ही ओसीआर फ़ाइलें शामिल हैं, तो परिणाम फ़ाइल भारी हो जाएगी।
अन्य उपकरण