यदि आपने कभी सामग्री, शब्दों, या अन्य जानकारी के लिए दस्तावेजों के ढेर के माध्यम से घंटों बिताए हैं, तो ओसीआर आपका नया सबसे अच्छा दोस्त हो सकता है। एक पीडीएफ रीडर या अन्य दस्तावेज़ प्रबंधन उपकरण का उपयोग करने की क्षमता रखने से आपका बहुत समय बच सकता है। व्यवसाय में हम में से अधिकांश लोग लगातार दक्षता में सुधार और संचालन को कारगर बनाने के तरीकों की खोज कर रहे हैं।
इस प्रयास में ओसीआर एक उपयोगी उपकरण हो सकता है। हम इस टुकड़े में ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) पर करीब से नज़र डालेंगे, जिसमें यह क्या है, यह कैसे काम करता है, और बहुत कुछ शामिल है।
तो, वास्तव में (OCR) ऑप्टिकल कैरेक्टर रिकग्निशन क्या है?
टेक्स्ट रिकग्निशन ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) का दूसरा नाम है।
ओसीआर टूल का उपयोग करके स्कैन किए गए पेपर, कैमरा फोटो और इमेज-ओनली पीडीएफ से डेटा निकाला और फिर से तैयार किया जाता है। ओसीआर सॉफ्टवेयर छवियों से अक्षरों को निकालता है, उन्हें शब्दों में परिवर्तित करता है, और फिर वाक्यों को इकट्ठा करता है, जिससे मूल पाठ तक पहुंच और परिवर्तन की अनुमति मिलती है।
यह हाथ से डेटा दर्ज करने की आवश्यकता को भी हटा देता है। OCR सिस्टम हार्डवेयर और सॉफ्टवेयर के मिश्रण का उपयोग करके भौतिक, मुद्रित दस्तावेज़ों को मशीन-पठनीय पाठ में बदल देता है। पाठ को हार्डवेयर द्वारा कॉपी या पढ़ा जाता है (जैसे कि एक ऑप्टिकल स्कैनर या समर्पित सर्किट बोर्ड), और अतिरिक्त प्रसंस्करण आमतौर पर सॉफ्टवेयर द्वारा नियंत्रित किया जाता है।
आर्टिफिशियल इंटेलिजेंस (एआई) का उपयोग ओसीआर सॉफ्टवेयर में बुद्धिमान चरित्र पहचान (आईसीआर) की अधिक जटिल तकनीकों को प्राप्त करने के लिए किया जा सकता है, जैसे कि विशिष्ट भाषाएं या लिखावट शैली। ओसीआर का उपयोग आमतौर पर हार्ड कॉपी कानूनी या ऐतिहासिक दस्तावेजों को पीडीएफ दस्तावेजों में बदलने के लिए किया जाता है, जिसे बाद में संपादित, स्वरूपित और खोजा जा सकता है जैसे कि वे एक वर्ड प्रोसेसर का उपयोग करके लिखे गए हों।
जब आप किसी प्रपत्र या रसीद को स्कैन करते हैं, उदाहरण के लिए, आपका कंप्यूटर इसे एक छवि फ़ाइल के रूप में संग्रहीत करता है। आप टेक्स्ट एडिटर के साथ चित्र फ़ाइल में शब्दों को संशोधित, खोज या गिन नहीं सकते हैं। हालाँकि, आप चित्र को टेक्स्ट दस्तावेज़ में बदलने और सामग्री को टेक्स्ट डेटा के रूप में सहेजने के लिए OCR का उपयोग कर सकते हैं।
यह कैसे काम करता है?
जैसा कि पहले कहा गया है, एक OCR सिस्टम में हार्डवेयर और सॉफ्टवेयर दोनों होते हैं। सेवा का लक्ष्य भौतिक दस्तावेज़ की सामग्री का मूल्यांकन करना और टुकड़ों को एक स्क्रिप्ट में बदलना है जिसका उपयोग डेटा को संसाधित करने के लिए किया जा सकता है।
उदाहरण के लिए, डाक और मेल छँटाई सेवाओं पर विचार करें। मेल को अधिक कुशलता से वर्गीकृत करने के लिए ओसीआर स्रोत और वापसी पते को त्वरित रूप से संसाधित करने की उनकी क्षमता के लिए आवश्यक है। कार्यक्रम की सफलता के लिए निम्नलिखित तीन दृष्टिकोण महत्वपूर्ण हैं:
1. छवि पूर्व प्रसंस्करण
तकनीक पहले चरण में दस्तावेज़ के वास्तविक आकार को एक छवि में बदल देती है, जैसे रिकॉर्ड चित्र। इस चरण का लक्ष्य किसी भी अवांछित विचलन को समाप्त करते हुए मशीन के प्रतिनिधित्व को यथासंभव सटीक बनाना है।
उसके बाद, अवधारणा को काले और सफेद में परिवर्तित किया जाता है और उज्ज्वल बनाम अंधेरे क्षेत्रों (वर्णों) के लिए मूल्यांकन किया जाता है। OCR तकनीक का उपयोग करते हुए, चित्र को स्प्रैडशीट्स, टेक्स्ट या इनसेट ग्राफ़िक्स जैसे असतत भागों में विभाजित किया जाता है।
2. एआई कैरेक्टर रिकग्निशन
अक्षरों और अंकों में अंतर करने के लिए, AI छवि के अंधेरे क्षेत्रों की जांच करता है। एक समय में एक शब्द, वाक्यांश या अनुच्छेद को लक्षित करने के लिए, AI आमतौर पर निम्नलिखित विधियों में से एक का उपयोग करता है:
- पैटर्न पहचान: एआई सिस्टम को प्रशिक्षित करने के लिए, प्रौद्योगिकियां विभिन्न भाषाओं, टेक्स्ट प्रारूपों और हस्तलेखन का उपयोग करती हैं। मैचों की पहचान करने के लिए, एल्गोरिथ्म पता लगाए गए अक्षर छवि पर अक्षरों की तुलना उन नोटों से करता है जो उसने पहले ही सीखे हैं।
- फ़ीचर पहचान: नए वर्णों को पहचानने के लिए, सिस्टम कुछ वर्ण विशेषताओं के आधार पर नियमों को लागू करता है। एक विशेषता एक अक्षर में कोणों, क्रॉस या घुमावदार रेखाओं की संख्या है।
एल्गोरिथ्म अद्वितीय वर्णों का पता लगाने के लिए कुछ वर्ण गुणों के आधार पर मानदंड का उपयोग करता है। उदाहरण के लिए, किसी वर्ण में कोण वाली, क्रॉसिंग या झुकने वाली रेखाओं की मात्रा एक विशेषता है।
3. पोस्ट-प्रीप्रोसेसिंग
पोस्ट-प्रोसेसिंग के दौरान, AI अंतिम फ़ाइल में त्रुटियों को ठीक करता है। एक रणनीति एआई को शब्दावली के शब्दकोश पर शिक्षित करना है जिसका उपयोग पेपर में किया जाएगा। फिर, यह सुनिश्चित करने के लिए कि कोई व्याख्या एआई की शब्दावली से परे नहीं है, एआई के आउटपुट को उन शब्दों/प्रारूपों तक सीमित करें।
ओसीआर . के लाभ
- OCR तकनीक के प्रमुख लाभ समय की बचत और घटी हुई गलतियाँ हैं। यह डेटा को ज़िप फ़ाइलों में संपीड़ित करने की भी अनुमति देता है, कुछ वास्तविक मुद्रित पृष्ठ पूरा नहीं कर सकता है।
- ऑप्टिकल कैरेक्टर रिकग्निशन का उपयोग करके डेटा खोजा जा सकता है। स्कैन की गई फ़ाइलें जिन्हें मशीन-पठनीय फ़ाइलों में परिवर्तित किया गया है, उन्हें किसी भी प्रारूप में संग्रहीत किया जा सकता है जिसे किसी संगठन के आंतरिक सर्वर पर खोजा जा सकता है या इंटरनेट पर विश्व स्तर पर उपलब्ध कराया जा सकता है।
- OCR का उपयोग अक्सर अन्य कृत्रिम बुद्धिमत्ता प्रणालियों के संयोजन में किया जाता है। उदाहरण के लिए, सेल्फ-ड्राइविंग कार लाइसेंस प्लेट और सड़क के संकेतों को स्कैन और पढ़ती है, सोशल मीडिया पोस्टिंग में ब्रांड लोगो को पहचानती है, और विज्ञापन तस्वीरों में उत्पाद पैकेजिंग को पहचानती है। इस तरह की आर्टिफिशियल इंटेलिजेंस तकनीक फर्मों को बेहतर मार्केटिंग और परिचालन निर्णय लेने में मदद करती है जो पैसे बचाते हैं और ग्राहकों की संतुष्टि को बढ़ाते हैं।
- मौजूदा और नई जानकारी को पूरी तरह से खोजने योग्य ज्ञान संग्रह में बदला जा सकता है। वे अतिरिक्त ज्ञान प्रसंस्करण के लिए टेक्स्ट डेटाबेस को स्वचालित रूप से संसाधित करने के लिए डेटा एनालिटिक्स टूल का भी उपयोग कर सकते हैं।
- ऑप्टिकल कैरेक्टर रिकॉग्निशन (ओसीआर) एक शक्तिशाली उपकरण है जो किसी भी भाषा की लिपि को पहचान सकता है। ओसीआर की यह क्षमता, जब यूनिकोड मानक और Google अनुवाद जैसे अनुवाद सॉफ़्टवेयर के साथ जोड़ी जाती है, तो प्रत्येक स्कैन किए गए और डिजीटल दस्तावेज़ को किसी अन्य भाषा में अनुवादित करने की अनुमति मिलती है। एक ऐसा लाभ जो मानव अनुवादकों की आवश्यकता और उनके समय लेने वाले प्रयासों को समाप्त करता है।
ओसीआर के मामलों का प्रयोग करें
ऑप्टिकल कैरेक्टर रिकग्निशन का सबसे प्रसिद्ध उपयोग मुद्रित पेपर दस्तावेज़ों को मशीन-पठनीय टेक्स्ट दस्तावेज़ों (ओसीआर) में परिवर्तित करना है। स्कैन किए गए पेपर दस्तावेज़ को ओसीआर-प्रोसेस करने के बाद, टेक्स्ट को माइक्रोसॉफ्ट वर्ड या Google डॉक्स जैसे वर्ड प्रोसेसर का उपयोग करके संपादित किया जा सकता है।
हमारे दैनिक जीवन में कई प्रसिद्ध प्रणालियाँ और सेवाएँ OCR पर निर्भर करती हैं, जिसका उपयोग आमतौर पर एक अनदेखी तकनीक के रूप में किया जाता है।
डेटा इनपुट ऑटोमेशन, नेत्रहीन और नेत्रहीनों की सहायता करना, और खोज इंजनों के लिए अनुक्रमण दस्तावेज़, जैसे पासपोर्ट, लाइसेंस प्लेट, चालान, बैंक स्टेटमेंट, व्यवसाय कार्ड, और स्वचालित नंबर प्लेट पहचान, OCR तकनीक के सभी आवश्यक लेकिन कम ज्ञात उपयोग हैं। .
कागज और स्कैन किए गए चित्र दस्तावेज़ों को मशीन-पठनीय, खोज योग्य पीडीएफ फाइलों में बदलकर, ओसीआर बड़े-डेटा मॉडलिंग के अनुकूलन की अनुमति देता है। उन दस्तावेज़ों पर ओसीआर लागू किए बिना जिनमें पहले से टेक्स्ट लेयर नहीं हैं, महत्वपूर्ण जानकारी को संसाधित करना और निकालना स्वचालित नहीं हो सकता है।
स्कैन किए गए कागजात अब एक बड़े डेटा सिस्टम में शामिल किए जा सकते हैं जो ओसीआर टेक्स्ट पहचान के लिए बैंक स्टेटमेंट, अनुबंधों और अन्य आवश्यक मुद्रित दस्तावेजों से ग्राहक डेटा पढ़ सकते हैं।
संगठन डेटा माइनिंग इनपुट चरण को स्वचालित करने के लिए OCR का उपयोग कर सकते हैं, बजाय इसके कि कर्मियों को असंख्य चित्र दस्तावेज़ों का विश्लेषण करने और मैन्युअल रूप से एक स्वचालित बिग-डेटा प्रोसेसिंग पाइपलाइन में इनपुट फीड करने हों।
OCR सॉफ्टवेयर छवियों में पाठ को पहचान सकता है, तस्वीरों से पाठ निकाल सकता है, और पाठ फ़ाइलों को निम्नलिखित स्वरूपों में सहेज सकता है: JPG, JPEG, PNG, BMP, tiff, PDF, और अन्य।
कानूनी व्यवसाय, जो सबसे अधिक कागजी कार्रवाई करता है, विभिन्न तरीकों से ऑप्टिकल चरित्र पहचान का उपयोग करता है। सभी मुद्रित दस्तावेज़ - हलफनामे, निर्णय, फाइलें, घोषणाएं, वसीयत, और इसी तरह - को सरलतम OCR स्कैनर का उपयोग करके डिजीटल, संग्रहीत और खोजा जा सकता है।
इन विधियों का उपयोग अन्य भाषाई लिपियों में कानूनी रिकॉर्ड के लिए किया जा सकता है, जैसे कि जापानी और हिंदी, क्योंकि ओसीआर तकनीक उन भाषाओं में फैलती है जो रोमन वर्ण का उपयोग नहीं करती हैं। OCR तकनीक अतीत के कई उदाहरणों तक एक ऐसे व्यवसाय के लिए सुगम पहुँच प्रदान कर सकती है जो अतीत पर महत्वपूर्ण रूप से निर्भर करता है।
ओसीआर . के अनुप्रयोग
- यातायात संकेतों को पहचानना।
- कैमरे से आप नंबर प्लेट को पहचान सकते हैं।
- डेटा का प्रवेश, निष्कर्षण और प्रसंस्करण सभी स्वचालित हैं।
- हवाई अड्डों पर पासपोर्ट की पहचान की जाती है और डेटा निकाला जाता है।
- व्यवसाय कार्ड की जानकारी का उपयोग करके संपर्क सूची बनाना।
- नेत्रहीन और दृष्टिबाधित लोगों को पढ़ने के लिए पढ़ने के लिए कागजात का डिक्रिप्शन।
- मुद्रित सामग्री की इलेक्ट्रॉनिक छवियों के माध्यम से खोजना संभव बनाना।
- ऐतिहासिक सामग्री जैसे पत्रिकाओं और समाचार पत्रों के खोज योग्य संग्रह बनाना।
- वाणिज्यिक दस्तावेजों जैसे चेक, पासपोर्ट, चालान, बैंक विवरण, रसीदें, और प्रो फॉर्म चालान, आदि के लिए डेटा प्रविष्टि।
निष्कर्ष
OCR (ऑप्टिकल कैरेक्टर रिकॉग्निशन) कागज के दस्तावेजों को स्कैन और डिजिटाइज़ करने की एक तकनीक है। यह फ़ोटो, हस्तलिखित सामग्री और मुद्रित दस्तावेज़ों से पूरी तरह से खोजने योग्य डिजिटल फ़ाइलें बनाता है।
चूंकि ये प्रौद्योगिकियां अधिक किफायती और उपलब्ध हो जाती हैं, ओसीआर इस बात का एक आदर्श उदाहरण है कि एआई समाधान डेटाबेस आधुनिकीकरण को कैसे चला रहे हैं।
संक्षेप में कहें तो ओसीआर एक शानदार तकनीक है जिसमें अपार संभावनाएं हैं। इस तरह के उपकरण आज की दुनिया में पहले से ही काफी परिष्कृत हैं। दूसरी ओर, ऑप्टिकल कैरेक्टर रिकग्निशन में भविष्य में सुधार होगा।
आर्टिफिशियल इंटेलिजेंस (एआई) अगले वर्षों में सबसे प्रभावशाली रुझानों में से एक बनने की ओर अग्रसर है, जिससे हम सूचना के बारे में सोचने के तरीके को बदल सकते हैं।
एक जवाब लिखें