go back
Tool Icon

पाठ निकालें

एक पीडीएफ से पाठ, छिपे हुए पाठ या सभी पाठ के क्षेत्र हटाएं

  • अपने डिवाइस से अपलोड करें
  • Google ड्राइव से अपलोड करें
  • ड्रॉपबॉक्स से अपलोड करें
अधिकतम फ़ाइल का आकार: 256 एमबी
Policy Protect

आपकी फाइलें सुरक्षित हैं!

हम आपके डेटा की सुरक्षा के लिए सर्वोत्तम एन्क्रिप्शन विधियों का उपयोग करते हैं।

सभी दस्तावेज़ 30 मिनट के बाद हमारे सर्वर से स्वचालित रूप से हटा दिए जाते हैं।

यदि आप चाहें, तो आप बिन आइकन पर क्लिक करके प्रसंस्करण के बाद मैन्युअल रूप से अपनी फ़ाइल को हटा सकते हैं।

ऑनलाइन पीडीएफ के ग्रंथों को कैसे निकालना है:

  1. शुरू करने के लिए, अपनी पीडीएफ फाइल को ड्रॉप करें या अपने डिवाइस या अपनी क्लाउड स्टोरेज सेवा से अपलोड करें।
  2. अपनी सेटिंग्स चुनें और निकालें टेक्स्ट बटन पर क्लिक करें।
  3. अपने कंप्यूटर पर पीडीएफ फाइल डाउनलोड करें या इसे सीधे अपने क्लाउड स्टोरेज सर्विस में सेव करें।
How to use

क्या तुम्हें पता था?

सभी PDF को समान नहीं बनाया गया है
पाठ कभी-कभी पीडीएफ में पाठ नहीं होता है
कई PDF में अदृश्य पाठ शामिल है
आइए दो पीडीएफ फाइलें लें: एक शब्द प्रोसेसर के साथ बनाया गया, जैसे एमएस वर्ड, उदाहरण के लिए, और एक स्कैन किया हुआ दस्तावेज़। दोनों फाइलें .pdf एक्सटेंशन के साथ समाप्त होती हैं। हालाँकि, ये फ़ाइलें समान नहीं हैं। यदि आप अपने वर्ड प्रोसेसर के साथ बनाई गई पीडीएफ फाइल को खोलते हैं, तो आप CTRL + F दबा सकते हैं, उन शब्दों को दर्ज कर सकते हैं जिन्हें आप ढूंढ रहे हैं, और पीडीएफ दर्शक सॉफ्टवेयर दस्तावेज़ के परिणामों को उजागर करेगा।
लेकिन जब आप स्कैन किए गए कागज़ात दस्तावेज़ों के द्वारा अपने स्कैनर सॉफ्टवेयर द्वारा निर्मित पीडीएफ में पाठ को चुनने या खोजने का प्रयास करते हैं, तो यह संभव नहीं है। इसका कारण यह है कि स्कैन किए गए पीडीएफ दस्तावेज़ पाठ-आधारित नहीं है; यह छवि-आधारित है। इस प्रकार के पीडीएफ को a कहा जाता है पीडीएफ रेखापुंज , और यह स्कैन किए गए दस्तावेजों के भंडारण, परिवहन और विनिमय के लिए एक मानक प्रारूप बनने वाला है
और फिर, वेक्टर पीडीएफ होते हैं, जिन्हें अक्सर बनाया जाता है सीएडी प्रारूप, या ग्राफिक डिजाइन प्रोग्राम जैसे Adobe Illustrator।
मूल PDF में पाठ एक स्वतंत्र तत्व है। आप पीडीएफ में पाठ वर्ण देख सकते हैं, लेकिन वे वर्ण पीडीएफ पाठ तत्व नहीं हैं। आप अंतर कैसे बता सकते हैं?
जैसा कि हमने अभी देखा है, पाठ पाठ की रेखापुंज छवि या पाठ की सदिश छवि हो सकती है। सभी मामलों में, यह पाठ जैसा दिखता है, लेकिन कंप्यूटर इसे इस रूप में नहीं पहचानता है और इसे चुन या खोज नहीं सकता है।
शब्द प्रोसेसर द्वारा बनाया गया पाठ न तो एक रेखापुंज है और न ही एक वेक्टर छवि है, यह (पर्याप्त रूप से) वास्तविक पाठ, या पीडीएफ पाठ तत्व कहा जाता है। वास्तविक पाठ खोज योग्य और चयन योग्य है। यह जूम करते समय भी तेज दिखता है, वेक्टर पाठ के विपरीत जो कि ढेलेदार दिखता है, और रेखापुंज पाठ जो कि पिक्सेलित होता है।
जैसे की Magritte की प्रसिद्ध पेंटिंग, पीडीएफ दुनिया में, पाठ की एक छवि पाठ के रूप में एक ही चीज नहीं है।
स्कैन किए गए दस्तावेज़ के पाठ को खोज योग्य बनाने के लिए, आपको इसे ओसीआर के माध्यम से चलाने की आवश्यकता है। यह प्रक्रिया पीडीएफ में अदृश्य पाठ की एक परत जोड़ती है, इसलिए ओसीआर इंजन पात्रों को पहचान सकता है और पाठ को "पढ़" सकता है। यह पाठ पीडीएफ दस्तावेज़ को देखने या देखने के दौरान उपयोग नहीं किया जाता है, और यह उपयोगकर्ता के लिए अदृश्य है।
आपको पीडीएफ के छिपे हुए पाठ को निकालने की आवश्यकता क्यों होगी? कभी-कभी, एक स्कैन किया हुआ पाठ जो OCRed किया गया है वह एक दर्शक में अच्छी तरह से प्रदर्शित नहीं होता है। कुछ मामलों में, ट्रिक छिपे हुए टेक्स्ट को हटाने और दस्तावेज़ को किसी अन्य टूल (जैसे) के साथ फिर से प्रोसेस करने के लिए है AvePDF ओसीआर पीडीएफ )।
यह भी संभव है कि जिस ओसीआर इंजन का आप उपयोग कर रहे हैं उसे अपडेट किया जाना है, और आप अपने दस्तावेज़ों को फिर से संसाधित करना चाहते हैं या बेहतर प्रदर्शन के साथ किसी अन्य टूल पर स्विच करना चाहते हैं। अंतिम विचार, यदि आप पीडीएफ / ओसीआर दस्तावेजों के एक बैच के रूप में सहेजते हैं जिसमें पहले से ही ओसीआर फ़ाइलें शामिल हैं, तो परिणाम फ़ाइल भारी हो जाएगी।
अन्य उपकरण