உள்ளடக்கம், சொற்கள் அல்லது பிற தகவல்களுக்கான ஆவணங்களின் அடுக்கை நீங்கள் எப்போதாவது மணிநேரம் செலவழித்திருந்தால், OCR உங்கள் புதிய சிறந்த நண்பராக இருக்கலாம். PDF ரீடர் அல்லது பிற ஆவண மேலாண்மைக் கருவியைப் பயன்படுத்தும் திறனைக் கொண்டிருப்பது உங்களுக்கு நிறைய நேரத்தை மிச்சப்படுத்தும். வணிகத்தில் உள்ள நம்மில் பெரும்பாலோர் செயல்திறனை மேம்படுத்துவதற்கும் செயல்பாடுகளை நெறிப்படுத்துவதற்கும் தொடர்ந்து வழிகளைத் தேடுகிறோம்.
இந்த முயற்சியில், OCR ஒரு பயனுள்ள கருவியாக இருக்கும். ஆப்டிகல் கேரக்டர் ரெகக்னிஷனை (OCR) இது என்ன, அது எப்படி வேலை செய்கிறது மற்றும் பலவற்றை உள்ளடக்கிய இந்த பகுதியில் நாம் கூர்ந்து கவனிப்போம்.
எனவே, (OCR) ஆப்டிகல் கேரக்டர் ரெகக்னிஷன் என்றால் என்ன?
உரை அங்கீகாரம் என்பது ஆப்டிகல் கேரக்டர் ரெகக்னிஷனின் (OCR) மற்றொரு பெயர்.
OCR கருவியைப் பயன்படுத்தி ஸ்கேன் செய்யப்பட்ட காகிதங்கள், கேமரா புகைப்படங்கள் மற்றும் படம் மட்டும் pdf ஆகியவற்றிலிருந்து தரவு பிரித்தெடுக்கப்பட்டு மீண்டும் உருவாக்கப்படுகிறது. OCR மென்பொருள் படங்களிலிருந்து எழுத்துக்களைப் பிரித்தெடுத்து, அவற்றை வார்த்தைகளாக மாற்றுகிறது, பின்னர் வாக்கியங்களைச் சேகரித்து, அசல் உரையை அணுகவும் மாற்றவும் அனுமதிக்கிறது.
இது கையால் தரவு உள்ளிடுவதற்கான அவசியத்தையும் நீக்குகிறது. OCR அமைப்புகள் வன்பொருள் மற்றும் மென்பொருளின் கலவையைப் பயன்படுத்தி இயற்பியல், அச்சிடப்பட்ட ஆவணங்களை இயந்திரம் படிக்கக்கூடிய உரையாக மாற்றுகின்றன. வன்பொருள் (ஆப்டிகல் ஸ்கேனர் அல்லது பிரத்யேக சர்க்யூட் போர்டு போன்றவை) மூலம் உரை நகலெடுக்கப்படுகிறது அல்லது படிக்கப்படுகிறது, மேலும் கூடுதல் செயலாக்கம் பொதுவாக மென்பொருளால் கையாளப்படுகிறது.
செயற்கை நுண்ணறிவு (AI) மொழிகள் அல்லது கையெழுத்து பாணிகளை வேறுபடுத்துதல் போன்ற நுண்ணறிவு எழுத்து அங்கீகாரத்தின் (ICR) மிகவும் சிக்கலான நுட்பங்களை அடைய OCR மென்பொருளில் பயன்படுத்தப்படலாம். OCR பொதுவாக கடின நகல் சட்ட அல்லது வரலாற்று ஆவணங்களை pdf ஆவணங்களாக மாற்றப் பயன்படுகிறது, பின்னர் அவை ஒரு சொல் செயலியைப் பயன்படுத்தி எழுதப்பட்டதைப் போல் திருத்தலாம், வடிவமைக்கலாம் மற்றும் தேடலாம்.
நீங்கள் ஒரு படிவம் அல்லது ரசீதை ஸ்கேன் செய்யும் போது, எடுத்துக்காட்டாக, உங்கள் கணினி அதை ஒரு படக் கோப்பாக சேமிக்கிறது. டெக்ஸ்ட் எடிட்டர் மூலம் படக் கோப்பில் உள்ள வார்த்தைகளை மாற்றவோ, தேடவோ, எண்ணவோ முடியாது. இருப்பினும், நீங்கள் OCR ஐப் பயன்படுத்தி படத்தை உரை ஆவணமாக மாற்றலாம் மற்றும் உள்ளடக்கங்களை உரைத் தரவாகச் சேமிக்கலாம்.
இது எப்படி வேலை செய்கிறது?
முன்பு கூறியது போல், OCR அமைப்பு வன்பொருள் மற்றும் மென்பொருள் இரண்டையும் கொண்டுள்ளது. ஒரு இயற்பியல் ஆவணத்தின் உள்ளடக்கத்தை மதிப்பிடுவதும், துண்டுகளை ஸ்கிரிப்டாக மாற்றுவதும், பின்னர் தரவைச் செயலாக்கப் பயன்படுவதே சேவையின் குறிக்கோள்.
உதாரணமாக, அஞ்சல் மற்றும் அஞ்சல் வரிசையாக்க சேவைகளைக் கவனியுங்கள். அஞ்சலை மிகவும் திறமையாக வகைப்படுத்த, மூலத்தை விரைவாகச் செயலாக்குவதற்கும், முகவரிகளைத் திருப்பி அனுப்புவதற்கும் அவர்களின் திறனுக்கு OCR இன்றியமையாதது. திட்டத்தின் வெற்றிக்கு பின்வரும் மூன்று அணுகுமுறைகள் முக்கியமானவை:
1. பட முன் செயலாக்கம்
நுட்பம் ஆவணத்தின் உண்மையான வடிவத்தை முதல் படியில் பதிவு படம் போன்ற படமாக மாற்றுகிறது. இந்த படிநிலையின் குறிக்கோள், இயந்திரத்தின் பிரதிநிதித்துவத்தை முடிந்தவரை துல்லியமாக மாற்றுவதும், தேவையற்ற விலகல்களை நீக்குவதும் ஆகும்.
அதன் பிறகு, கருத்து கருப்பு மற்றும் வெள்ளைக்கு மாற்றப்பட்டு பிரகாசமான மற்றும் இருண்ட பகுதிகளுக்கு (எழுத்துகள்) மதிப்பிடப்படுகிறது. OCR தொழில்நுட்பத்தைப் பயன்படுத்தி, படம் பின்னர் விரிதாள்கள், உரை அல்லது இன்செட் கிராபிக்ஸ் போன்ற தனித்தனி பகுதிகளாகப் பிரிக்கப்படுகிறது.
2. AI எழுத்து அங்கீகாரம்
எழுத்துக்கள் மற்றும் இலக்கங்களை வேறுபடுத்த, AI படத்தின் இருண்ட பகுதிகளை ஆய்வு செய்கிறது. ஒரு நேரத்தில் ஒரு சொல், சொற்றொடர் அல்லது பத்தியைக் குறிவைக்க, AI பொதுவாக பின்வரும் முறைகளில் ஒன்றைப் பயன்படுத்துகிறது:
- வடிவ அங்கீகாரம்: AI அமைப்பைப் பயிற்றுவிக்க, தொழில்நுட்பங்கள் பல்வேறு மொழிகள், உரை வடிவங்கள் மற்றும் கையெழுத்து ஆகியவற்றைப் பயன்படுத்துகின்றன. பொருத்தங்களை அடையாளம் காண, அல்காரிதம் கண்டறியப்பட்ட கடிதப் படத்தில் உள்ள எழுத்துக்களை ஏற்கனவே கற்றுக்கொண்ட குறிப்புகளுடன் ஒப்பிடுகிறது.
- அம்சம் அறிதல்: புதிய எழுத்துக்களை அடையாளம் காண, கணினி சில எழுத்துப் பண்புகளின் அடிப்படையில் விதிகளைப் பயன்படுத்துகிறது. ஒரு பண்பு என்பது ஒரு கடிதத்தில் உள்ள கோண, குறுக்கு அல்லது வளைந்த கோடுகளின் எண்ணிக்கை.
அல்காரிதம் தனிப்பட்ட எழுத்துகளைக் கண்டறிய சில எழுத்துப் பண்புகளை அடிப்படையாகக் கொண்ட அளவுகோல்களைப் பயன்படுத்துகிறது. எடுத்துக்காட்டாக, ஒரு எழுத்தில் உள்ள கோண, கடக்கும் அல்லது வளைக்கும் கோடுகளின் அளவு ஒரு அம்சமாகும்.
3. பிந்தைய செயலாக்கம்
பிந்தைய செயலாக்கத்தின் போது, இறுதி கோப்பில் உள்ள பிழைகளை AI சரிசெய்கிறது. தாளில் பயன்படுத்தப்படும் சொற்களஞ்சிய அகராதியை AIக்கு கற்பிப்பது ஒரு உத்தி. பின்னர், AI இன் சொற்களஞ்சியத்திற்கு அப்பாற்பட்ட எந்த விளக்கங்களும் இல்லை என்பதை உறுதிப்படுத்த, AI இன் வெளியீட்டை அந்த வார்த்தைகள்/வடிவங்களுக்கு வரம்பிடவும்.
OCR இன் நன்மைகள்
- OCR தொழில்நுட்பத்தின் முக்கிய நன்மைகள் நேர சேமிப்பு மற்றும் குறைந்த தவறுகள் ஆகும். இது ஜிப் கோப்புகளில் தரவை சுருக்கவும் அனுமதிக்கிறது, ஒரு உண்மையான அச்சிடப்பட்ட பக்கத்தால் சாதிக்க முடியாது.
- ஆப்டிகல் கேரக்டர் ரெகக்னிஷனைப் பயன்படுத்தி தரவைத் தேடலாம். கணினியில் படிக்கக்கூடிய கோப்புகளாக மாற்றப்பட்ட ஸ்கேன் செய்யப்பட்ட கோப்புகள், நிறுவனத்தின் உள் சேவையகத்தில் தேடப்படும் அல்லது இணையத்தில் உலகளவில் கிடைக்கக்கூடிய எந்த வடிவத்திலும் சேமிக்கப்படும்.
- மற்ற செயற்கை நுண்ணறிவு அமைப்புகளுடன் இணைந்து OCR அடிக்கடி பயன்படுத்தப்படுகிறது. எடுத்துக்காட்டாக, சுய-ஓட்டுநர் கார்கள் உரிமத் தகடுகள் மற்றும் சாலை அடையாளங்களை ஸ்கேன் செய்து படிக்கின்றன, சமூக ஊடக இடுகைகளில் பிராண்ட் லோகோக்களை அங்கீகரிக்கின்றன மற்றும் விளம்பரப் புகைப்படங்களில் தயாரிப்பு பேக்கேஜிங்கை அங்கீகரிக்கின்றன. இது போன்ற செயற்கை நுண்ணறிவு தொழில்நுட்பம், பணத்தை மிச்சப்படுத்தும் மற்றும் வாடிக்கையாளர் திருப்தியை அதிகரிக்கும் சிறந்த சந்தைப்படுத்தல் மற்றும் செயல்பாட்டு முடிவுகளை எடுக்க நிறுவனங்களுக்கு உதவுகிறது.
- ஏற்கனவே உள்ள மற்றும் புதிய தகவல்களை முழுமையாக தேடக்கூடிய அறிவுக் காப்பகமாக மாற்றலாம். கூடுதல் அறிவு செயலாக்கத்திற்காக உரை தரவுத்தளத்தை தானாக செயலாக்க தரவு பகுப்பாய்வு கருவிகளையும் அவர்கள் பயன்படுத்தலாம்.
- ஆப்டிகல் கேரக்டர் ரெகக்னிஷன் (OCR) என்பது எந்த மொழி ஸ்கிரிப்டையும் அடையாளம் காணக்கூடிய சக்திவாய்ந்த கருவியாகும். OCR இன் இந்த திறன், யூனிகோட் தரநிலை மற்றும் கூகுள் டிரான்ஸ்லேட் போன்ற மொழிபெயர்ப்பு மென்பொருளுடன் இணைக்கப்படும் போது, ஸ்கேன் செய்யப்பட்ட மற்றும் டிஜிட்டல் மயமாக்கப்பட்ட ஒவ்வொரு ஆவணத்தையும் வேறு எந்த மொழியிலும் மொழிபெயர்க்க அனுமதிக்கிறது. மனித மொழிபெயர்ப்பாளர்களின் தேவையையும் அவர்களின் நேரத்தைச் செலவழிக்கும் முயற்சிகளையும் நீக்கும் ஒரு நன்மை.
OCR வழக்குகளைப் பயன்படுத்தவும்
ஆப்டிகல் கேரக்டர் அங்கீகாரத்தின் மிகவும் பிரபலமான பயன்பாடானது அச்சிடப்பட்ட காகித ஆவணங்களை இயந்திரம் படிக்கக்கூடிய உரை ஆவணங்களாக (OCR) மாற்றுவதாகும். ஸ்கேன் செய்யப்பட்ட காகித ஆவணத்தை OCR-செயலாக்கிய பிறகு, மைக்ரோசாஃப்ட் வேர்ட் அல்லது கூகுள் டாக்ஸ் போன்ற சொல் செயலியைப் பயன்படுத்தி உரையைத் திருத்தலாம்.
நம் அன்றாட வாழ்வில் பல நன்கு அறியப்பட்ட அமைப்புகள் மற்றும் சேவைகள் OCR ஐ நம்பியுள்ளன, இது பொதுவாக காணப்படாத தொழில்நுட்பமாகப் பயன்படுத்தப்படுகிறது.
தரவு உள்ளீடு ஆட்டோமேஷன், பார்வையற்றோர் மற்றும் பார்வையற்றோருக்கு உதவுதல் மற்றும் தேடுபொறிகளுக்கான குறியீட்டு ஆவணங்களான கடவுச்சீட்டுகள், உரிமத் தகடுகள், விலைப்பட்டியல்கள், வங்கி அறிக்கைகள், வணிக அட்டைகள் மற்றும் தானியங்கி நம்பர் பிளேட் அங்கீகாரம் போன்றவை OCR தொழில்நுட்பத்தின் இன்றியமையாதவை ஆனால் அதிகம் அறியப்படாத பயன்பாடுகளாகும். .
காகிதம் மற்றும் ஸ்கேன் செய்யப்பட்ட பட ஆவணங்களை இயந்திரம் படிக்கக்கூடிய, தேடக்கூடிய PDF கோப்புகளாக மாற்றுவதன் மூலம், OCR பெரிய-தரவு மாடலிங்கை மேம்படுத்த அனுமதிக்கிறது. ஏற்கனவே உரை அடுக்குகள் இல்லாத ஆவணங்களுக்கு ஆரம்பத்தில் OCR ஐப் பயன்படுத்தாமல், முக்கியமான தகவல்களை செயலாக்குவது மற்றும் பிரித்தெடுப்பது தானியங்கு செய்ய முடியாது.
வங்கி அறிக்கைகள், ஒப்பந்தங்கள் மற்றும் பிற அத்தியாவசிய அச்சிடப்பட்ட ஆவணங்களிலிருந்து OCR உரை அங்கீகாரத்திற்கு நன்றி செலுத்தும் வாடிக்கையாளர் தரவைப் படிக்கக்கூடிய பெரிய தரவு அமைப்பில் ஸ்கேன் செய்யப்பட்ட தாள்கள் இப்போது இணைக்கப்படலாம்.
நிறுவனங்கள் எண்ணற்ற பட ஆவணங்களை ஆய்வு செய்து, தானியங்கு பிக்-டேட்டா செயலாக்க பைப்லைனில் உள்ளீடுகளை கைமுறையாக ஊட்டுவதற்குப் பதிலாக, தரவுச் செயலாக்க உள்ளீட்டு நிலையை தானியக்கமாக்குவதற்கு OCR ஐப் பயன்படுத்தலாம்.
OCR மென்பொருளானது படங்களில் உள்ள உரையை அடையாளம் காணவும், புகைப்படங்களிலிருந்து உரையைப் பிரித்தெடுக்கவும், உரைக் கோப்புகளை பின்வரும் வடிவங்களில் சேமிக்கவும் முடியும்: JPG, JPEG, PNG, BMP, tiff, PDF மற்றும் பிற.
அதிக ஆவணங்களை உருவாக்கும் சட்ட வணிகம், பல்வேறு வழிகளில் ஒளியியல் எழுத்து அங்கீகாரத்தைப் பயன்படுத்துகிறது. அனைத்து அச்சிடப்பட்ட ஆவணங்களும் - பிரமாணப் பத்திரங்கள், தீர்ப்புகள், கோப்புகள், அறிவிப்புகள், உயில்கள் மற்றும் பலவற்றை - எளிய OCR ஸ்கேனர்களைப் பயன்படுத்தி டிஜிட்டல் மயமாக்கலாம், சேமிக்கலாம் மற்றும் தேடலாம்.
ரோமானிய எழுத்தைப் பயன்படுத்தாத மொழிகளுக்கு OCR தொழில்நுட்பம் விரிவடைவதால், ஜப்பானிய மற்றும் இந்தி போன்ற பிற மொழியியல் ஸ்கிரிப்டுகளில் சட்டப் பதிவுகளுக்கு இந்த முறைகள் பயன்படுத்தப்படலாம். OCR தொழில்நுட்பமானது கடந்த காலத்தை கணிசமாக நம்பியிருக்கும் ஒரு வணிகத்திற்கு கடந்த காலத்தின் பல எடுத்துக்காட்டுகளுக்கு மென்மையான அணுகலை வழங்க முடியும்.
OCR இன் பயன்பாடுகள்
- போக்குவரத்து அறிகுறிகளை அங்கீகரித்தல்.
- கேமரா மூலம் நம்பர் பிளேட்களை அடையாளம் காண முடியும்.
- தரவு உள்ளீடு, பிரித்தெடுத்தல் மற்றும் செயலாக்கம் அனைத்தும் தானியங்கு.
- விமான நிலையங்களில், பாஸ்போர்ட்கள் அங்கீகரிக்கப்பட்டு தரவு பிரித்தெடுக்கப்படுகிறது.
- வணிக அட்டைகளில் உள்ள தகவலைப் பயன்படுத்தி தொடர்பு பட்டியலை உருவாக்குதல்.
- பார்வையற்றோர் மற்றும் பார்வைக் குறைபாடுள்ளவர்களுக்காக அவர்களுக்கு உரக்கப் படிக்கும்படியான தாள்களை புரிந்துகொள்வது.
- அச்சிடப்பட்ட பொருட்களின் மின்னணு படங்கள் மூலம் தேடுவதை சாத்தியமாக்குகிறது.
- பத்திரிகைகள் மற்றும் செய்தித்தாள்கள் போன்ற வரலாற்றுப் பொருள்களின் தேடக்கூடிய ஆவணங்களை உருவாக்குதல்.
- காசோலைகள், பாஸ்போர்ட்கள், இன்வாய்ஸ்கள், வங்கி அறிக்கைகள், ரசீதுகள் மற்றும் சார்பு ஃபார்மா இன்வாய்ஸ்கள் போன்ற வணிக ஆவணங்களுக்கான தரவு உள்ளீடு.
தீர்மானம்
OCR (Optical Character Recognition) என்பது காகித ஆவணங்களை ஸ்கேன் செய்து டிஜிட்டல் மயமாக்குவதற்கான ஒரு நுட்பமாகும். இது புகைப்படங்கள், கையால் எழுதப்பட்ட பொருட்கள் மற்றும் அச்சிடப்பட்ட ஆவணங்களிலிருந்து முற்றிலும் தேடக்கூடிய டிஜிட்டல் கோப்புகளை உருவாக்குகிறது.
இந்த தொழில்நுட்பங்கள் மிகவும் சிக்கனமானதாகவும் கிடைக்கக்கூடியதாகவும் மாறும் போது, AI தீர்வுகள் தரவுத்தள நவீனமயமாக்கலை எவ்வாறு இயக்குகின்றன என்பதற்கு OCR சரியான விளக்கமாகும்.
சுருக்கமாக, OCR என்பது மகத்தான ஆற்றல் கொண்ட ஒரு அற்புதமான தொழில்நுட்பம். இத்தகைய கருவிகள் ஏற்கனவே இன்றைய உலகில் மிகவும் சிக்கலானவை. மறுபுறம், ஆப்டிகல் கேரக்டர் அங்கீகாரம் எதிர்காலத்தில் மேம்படும்.
செயற்கை நுண்ணறிவு (AI) அடுத்த ஆண்டுகளில் மிகவும் தாக்கத்தை ஏற்படுத்தும் போக்குகளில் ஒன்றாக மாற உள்ளது, இது தகவல்களைப் பற்றி நாம் சிந்திக்கும் விதத்தை மாற்றுகிறது.
ஒரு பதில் விடவும்