ඔබ කවදා හෝ අන්තර්ගතය, වචන, හෝ වෙනත් තොරතුරු සඳහා ලේඛන තොගයක් හරහා පැය ගණනක් ගත කර ඇත්නම්, OCR ඔබේ නව හොඳම මිතුරා විය හැකිය. PDF කියවනය හෝ වෙනත් ලේඛන කළමනාකරණ මෙවලමක් භාවිතා කිරීමේ හැකියාව තිබීම ඔබට බොහෝ කාලයක් ඉතිරි කර ගත හැක. ව්යාපාරයේ සිටින අපගෙන් බොහෝ දෙනෙක් කාර්යක්ෂමතාව වැඩි දියුණු කිරීමට සහ මෙහෙයුම් විධිමත් කිරීමට ක්රම සොයමින් සිටිති.
මෙම උත්සාහයේ දී, OCR ප්රයෝජනවත් මෙවලමක් විය හැකිය. අපි මෙම කොටසෙහි Optical Character Recognition (OCR) එය කුමක්ද, එය ක්රියා කරන ආකාරය සහ තවත් දේ ඇතුළුව වඩාත් සමීපව බලමු.
ඉතින්, ඇත්තටම මොකක්ද (OCR) Optical Character Recognition කියන්නේ?
Text recognition යනු දෘශ්ය අක්ෂර හඳුනාගැනීමේ (OCR) තවත් නමකි.
OCR මෙවලමක් භාවිතයෙන් ස්කෑන් කරන ලද කඩදාසි, කැමරා ඡායාරූප සහ පින්තූර-පමණි pdf වලින් දත්ත උපුටා ගෙන නැවත සකස් කර ඇත. OCR මෘදුකාංගය රූපවලින් අකුරු උකහා ගනී, ඒවා වචන බවට පරිවර්තනය කරයි, පසුව වාක්ය එකලස් කරයි, මුල් පිටපතට ප්රවේශ වීමට සහ වෙනස් කිරීමට ඉඩ සලසයි.
එය අතින් දත්ත ඇතුලත් කිරීමේ අවශ්යතාවයද ඉවත් කරයි. OCR පද්ධති භෞතික, මුද්රිත ලේඛන දෘඩාංග සහ මෘදුකාංග මිශ්රණයක් භාවිතයෙන් යන්ත්රයෙන් කියවිය හැකි පෙළ බවට පත් කරයි. දෘඪාංග (දෘෂ්ය ස්කෑනරයක් හෝ කැපවූ පරිපථ පුවරුවක් වැනි) මගින් පෙළ පිටපත් කිරීම හෝ කියවීම සිදු කරනු ලබන අතර අතිරේක සැකසුම් සාමාන්යයෙන් මෘදුකාංග මගින් හසුරුවනු ලැබේ.
කෘතිම බුද්ධිය (AI) භාෂාව වෙන්කර හඳුනා ගැනීම හෝ අත් අකුරු විලාසයන් වැනි බුද්ධිමත් චරිත හඳුනාගැනීමේ (ICR) වඩාත් සංකීර්ණ තාක්ෂණික ක්රම ලබා ගැනීමට OCR මෘදුකාංගයේ භාවිතා කළ හැක. OCR බොහෝ විට භාවිතා කරනුයේ දෘඩ පිටපත් නෛතික හෝ ඓතිහාසික ලේඛන pdf ලේඛන බවට පරිවර්තනය කිරීම සඳහා වන අතර, පසුව ඒවා වර්ඩ් ප්රොසෙසරයක් භාවිතයෙන් ලියා ඇති ආකාරයට සංස්කරණය කිරීමට, හැඩතල ගැන්වීමට සහ සෙවීමට හැකිය.
ඔබ පෝරමයක් හෝ රිසිට්පතක් පරිලෝකනය කරන විට, උදාහරණයක් ලෙස, ඔබේ පරිගණකය එය රූප ගොනුවක් ලෙස ගබඩා කරයි. ඔබට පෙළ සංස්කාරකයක් සමඟ පින්තූර ගොනුවේ වචන වෙනස් කිරීමට, සෙවීමට හෝ ගණන් කිරීමට නොහැකිය. කෙසේ වෙතත්, ඔබට පින්තූරය පෙළ ලේඛනයක් බවට පරිවර්තනය කිරීමට සහ අන්තර්ගතය පෙළ දත්ත ලෙස සුරැකීමට OCR භාවිතා කළ හැක.
එය ක්රියාත්මක වන්නේ කෙසේද?
කලින් සඳහන් කළ පරිදි, OCR පද්ධතිය දෘඩාංග සහ මෘදුකාංග යන දෙකින්ම සමන්විත වේ. සේවාවේ ඉලක්කය වන්නේ භෞතික ලේඛනයක අන්තර්ගතය ඇගයීම සහ දත්ත සැකසීමට භාවිතා කළ හැකි පිටපතක් බවට කෑලි පරිවර්තනය කිරීමයි.
උදාහරණයක් ලෙස තැපැල් සහ තැපැල් වර්ග කිරීමේ සේවා සලකා බලන්න. තැපැල් වඩාත් කාර්යක්ෂමව වර්ගීකරණය කිරීම සඳහා මූලාශ්ර ඉක්මනින් සැකසීමට සහ ලිපින ආපසු ලබා දීමට ඔවුන්ගේ හැකියාවට OCR අත්යවශ්ය වේ. වැඩසටහනේ සාර්ථකත්වය සඳහා පහත සඳහන් ප්රවේශ තුන ඉතා වැදගත් වේ.
1. රූප පෙර සැකසුම්
තාක්ෂණය පළමු පියවරේදී ලේඛනයේ සැබෑ හැඩය වාර්තා පින්තූරයක් වැනි රූපයක් බවට පත් කරයි. මෙම පියවරේ අරමුණ වන්නේ යන්ත්රයේ නිරූපනය හැකිතාක් නිවැරදි කරන අතරම අනවශ්ය අපගමනයන් ඉවත් කිරීමයි.
ඉන් පසුව, සංකල්පය කළු සහ සුදු බවට පරිවර්තනය කර දීප්තිමත් එදිරිව අඳුරු ප්රදේශ (අක්ෂර) සඳහා තක්සේරු කරනු ලැබේ. OCR තාක්ෂණය භාවිතයෙන්, පින්තූරය පැතුරුම්පත්, පෙළ හෝ ඇතුළත් චිත්රක වැනි විවික්ත කොටස්වලට බෙදා ඇත.
2. AI අක්ෂර හඳුනාගැනීම
අකුරු සහ ඉලක්කම් වෙන්කර හඳුනා ගැනීමට, AI රූපයේ අඳුරු ප්රදේශ පරීක්ෂා කරයි. වරකට එක් වචනයක්, වාක්ය ඛණ්ඩයක් හෝ ඡේදයක් ඉලක්ක කිරීමට, AI සාමාන්යයෙන් පහත ක්රමවලින් එකක් භාවිතා කරයි:
- රටා හඳුනාගැනීම: AI පද්ධතිය පුහුණු කිරීම සඳහා, තාක්ෂණයන් විවිධ භාෂා, පෙළ ආකෘති සහ අත් අකුරු භාවිතා කරයි. ගැලපීම් හඳුනා ගැනීම සඳහා, ඇල්ගොරිතම විසින් අනාවරණය කරගත් අකුරු රූපයේ අකුරු එය දැනටමත් ඉගෙන ගෙන ඇති සටහන් සමඟ සංසන්දනය කරයි.
- විශේෂාංග හඳුනාගැනීම: නව අක්ෂර හඳුනාගැනීම සඳහා, පද්ධතිය ඇතැම් චරිත ගුණාංග මත පදනම්ව නීති භාවිතා කරයි. එක් ලක්ෂණයක් වන්නේ අකුරක ඇති කෝණික, හරස් හෝ වක්ර රේඛා ගණනයි.
ඇල්ගොරිතම අද්විතීය අක්ෂර හඳුනා ගැනීම සඳහා ඇතැම් අක්ෂර ගුණාංග මත පදනම් වූ නිර්ණායක භාවිතා කරයි. උදාහරණයක් ලෙස චරිතයක කෝණික, හරස් හෝ නැමීමේ රේඛා ප්රමාණය එක් ලක්ෂණයකි.
3. පසු-පෙර සැකසීම
පසු සැකසුම් අතරතුර, AI අවසාන ගොනුවේ දෝෂ නිවැරදි කරයි. එක් උපාය මාර්ගයක් වන්නේ පත්රිකාවේ භාවිතා කරන පාරිභාෂික ශබ්ද කෝෂයක් පිළිබඳව AI දැනුවත් කිරීමයි. ඉන්පසුව, කිසිදු අර්ථකථනයක් AI හි වචන මාලාවෙන් ඔබ්බට නොවන බව සහතික කිරීම සඳහා, AI හි ප්රතිදානය එම වචන/ආකෘති වලට සීමා කරන්න.
OCR හි ප්රතිලාභ
- OCR තාක්ෂණයේ ප්රධාන ප්රතිලාභ වන්නේ කාලය ඉතිරි කර ගැනීම සහ වැරදි අඩු වීමයි. එය සැබෑ මුද්රිත පිටුවකට ඉටු කළ නොහැකි දෙයක්, zip ගොනු බවට දත්ත සම්පීඩනය කිරීමට ද ඉඩ සලසයි.
- Optical Character Recognition භාවිතයෙන් දත්ත සෙවිය හැක. යන්ත්රයෙන් කියවිය හැකි ගොනු බවට පරිවර්තනය කර ඇති ස්කෑන් කරන ලද ගොනු සංවිධානයක අභ්යන්තර සේවාදායකයේ සෙවිය හැකි හෝ අන්තර්ජාලයේ ගෝලීය වශයෙන් ලබා ගත හැකි ඕනෑම ආකෘතියකින් ගබඩා කළ හැක.
- OCR බොහෝ විට අනෙකුත් කෘතිම බුද්ධි පද්ධති සමඟ ඒකාබද්ධව භාවිතා වේ. උදාහරණයක් ලෙස, ස්වයං-රිය පැදවීමේ මෝටර් රථ බලපත්ර තහඩු සහ මාර්ග සංඥා පරිලෝකනය කර කියවීම, සමාජ මාධ්ය පළකිරීම්වල වෙළඳ නාම ලාංඡන හඳුනා ගැනීම සහ වෙළඳ ප්රචාරණ ඡායාරූපවල නිෂ්පාදන ඇසුරුම් හඳුනා ගැනීම. මෙවැනි කෘතිම බුද්ධි තාක්ෂණය මුදල් ඉතිරි කර පාරිභෝගික තෘප්තිය වැඩි කරන වඩා හොඳ අලෙවිකරණ සහ මෙහෙයුම් තීරණ ගැනීමට සමාගම්වලට සහාය වේ.
- පවතින සහ නව තොරතුරු සම්පූර්ණයෙන්ම සෙවිය හැකි දැනුම් සංරක්ෂිතයක් බවට පරිවර්තනය කළ හැක. අමතර දැනුම සැකසීම සඳහා පෙළ දත්ත ගබඩාව ස්වයංක්රීයව සැකසීමට ඔවුන්ට දත්ත විශ්ලේෂණ මෙවලම් ද භාවිත කළ හැක.
- Optical Character Recognition (OCR) යනු ඕනෑම භාෂා පිටපතක් හඳුනාගත හැකි ප්රබල මෙවලමකි. OCR හි මෙම හැකියාව, යුනිකෝඩ් ප්රමිතිය සහ Google Translate වැනි පරිවර්තන මෘදුකාංග සමඟ යුගල කළ විට, ස්කෑන් කරන ලද සහ ඩිජිටල් කළ සෑම ලේඛනයක්ම වෙනත් ඕනෑම භාෂාවකට පරිවර්තනය කිරීමට ඉඩ සලසයි. මානව පරිවර්තකයන්ගේ අවශ්යතාවය සහ ඔවුන්ගේ කාලය ගතවන ප්රයත්නයන් ඉවත් කරන ප්රතිලාභයකි.
OCR හි අවස්ථා භාවිතා කරන්න
දෘශ්ය අක්ෂර හඳුනාගැනීමේ වඩාත් ප්රකට භාවිතය වන්නේ මුද්රිත කඩදාසි ලේඛන යන්ත්ර කියවිය හැකි පෙළ ලේඛන (OCR) බවට පරිවර්තනය කිරීමයි. ස්කෑන් කරන ලද කඩදාසි ලේඛනයක් OCR-සැකසීමෙන් පසු, Microsoft Word හෝ Google Docs වැනි වචන සකසනයක් භාවිතයෙන් පෙළ සංස්කරණය කළ හැක.
අපගේ එදිනෙදා ජීවිතයේ බොහෝ ප්රසිද්ධ පද්ධති සහ සේවාවන් සාමාන්යයෙන් නොපෙනෙන තාක්ෂණයක් ලෙස භාවිතා කරන OCR මත රඳා පවතී.
දත්ත ආදාන ස්වයංක්රීයකරණය, අන්ධ සහ දෘශ්යාබාධිත අයට සහය වීම සහ විදේශ ගමන් බලපත්ර, බලපත්ර තහඩු, ඉන්වොයිසි, බැංකු ප්රකාශ, ව්යාපාරික කාඩ්පත් සහ ස්වයංක්රීය අංක තහඩු හඳුනාගැනීම වැනි සෙවුම් යන්ත්ර සඳහා සුචිගත කිරීමේ ලේඛන සියල්ල OCR තාක්ෂණයේ අත්යවශ්ය නමුත් අඩු ප්රසිද්ධ භාවිතයන් වේ. .
කඩදාසි සහ ස්කෑන් කළ පින්තූර ලේඛන යන්ත්රයෙන් කියවිය හැකි, සෙවිය හැකි PDF ගොනු බවට පරිවර්තනය කිරීමෙන්, OCR විශාල දත්ත ආකෘතිකරණය ප්රශස්ත කිරීමට ඉඩ සලසයි. දැනටමත් පෙළ ස්ථර නොමැති ලේඛන සඳහා මුලින් OCR යෙදීමෙන් තොරව, වැදගත් තොරතුරු සැකසීම සහ උපුටා ගැනීම ස්වයංක්රීය කළ නොහැක.
ස්කෑන් කරන ලද කඩදාසි දැන් OCR පෙළ හඳුනාගැනීම්වලට ස්තුතිවන්ත වන පරිදි බැංකු ප්රකාශන, කොන්ත්රාත්තු සහ අනෙකුත් අත්යවශ්ය මුද්රිත ලේඛනවලින් පාරිභෝගික දත්ත කියවිය හැකි විශාල දත්ත පද්ධතියකට ඇතුළත් කළ හැක.
දත්ත කැණීම් ආදාන අදියර ස්වයංක්රීය කිරීමට සංවිධානවලට OCR භාවිතා කළ හැක, පුද්ගලයන් අසංඛ්යාත පින්තූර ලේඛන විශ්ලේෂණය කර ස්වයංක්රීය විශාල දත්ත සැකසුම් නල මාර්ගයකට ආදාන අතින් පෝෂණය කරනවා වෙනුවට.
OCR මෘදුකාංගයට රූපවල ඇති පෙළ හඳුනා ගැනීමට, ඡායාරූපවලින් පෙළ උපුටා ගැනීමට සහ පහත ආකෘතිවලින් පෙළ ගොනු සුරැකීමට හැකිය: JPG, JPEG, PNG, BMP, tiff, PDF, සහ වෙනත්.
වඩාත්ම ලිපි ලේඛන නිර්මාණය කරන නීතිමය ව්යාපාරය විවිධ ආකාරවලින් දෘශ්ය අක්ෂර හඳුනාගැනීම භාවිතා කරයි. සියලුම මුද්රිත ලේඛන - දිවුරුම් ප්රකාශ, විනිශ්චයන්, ලිපිගොනු, ප්රකාශන, කැමැත්ත සහ යනාදිය - සරලම OCR ස්කෑනර් භාවිතයෙන් ඩිජිටල්කරණය කිරීමට, ගබඩා කිරීමට සහ සෙවීමට හැකිය.
OCR තාක්ෂණය රෝම අක්ෂර භාවිත නොකරන භාෂාවලට ව්යාප්ත වන බැවින්, ජපන් සහ හින්දි වැනි වෙනත් භාෂාමය අක්ෂරවල නීතිමය වාර්තා සඳහා මෙම ක්රම භාවිත කළ හැක. OCR තාක්ෂණයට අතීතය මත සැලකිය යුතු ලෙස රඳා පවතින ව්යාපාරයක් සඳහා අතීතයේ උදාහරණ රාශියකට සුමට ප්රවේශයක් සැපයිය හැකිය.
OCR හි යෙදුම්
- මාර්ග සංඥා හඳුනා ගැනීම.
- කැමරාවක් සමඟ, ඔබට අංක තහඩු හඳුනාගත හැකිය.
- දත්ත ඇතුල් කිරීම, නිස්සාරණය කිරීම සහ සැකසීම ස්වයංක්රීය වේ.
- ගුවන් තොටුපලවලදී, විදේශ ගමන් බලපත්ර හඳුනාගෙන දත්ත ලබා ගනී.
- ව්යාපාරික කාඩ්පත්වල තොරතුරු භාවිතයෙන් සම්බන්ධතා ලැයිස්තුවක් නිර්මාණය කිරීම.
- අන්ධ සහ දෘෂ්යාබාධිත පුද්ගලයින්ට ශබ්ද නඟා කියවීම සඳහා ලිපි ලේඛන විකේතනය කිරීම.
- මුද්රිත ද්රව්යවල විද්යුත් රූප හරහා සෙවීමට හැකි වීම.
- සඟරා සහ පුවත්පත් වැනි ඓතිහාසික තොරතුරු සෙවිය හැකි ලේඛනාගාර නිර්මාණය කිරීම.
- චෙක්පත්, විදේශ ගමන් බලපත්ර, ඉන්වොයිසි, බැංකු ප්රකාශ, රිසිට්පත් සහ ප්රො ෆෝමා ඉන්වොයිසි වැනි වාණිජ ලේඛන සඳහා දත්ත ඇතුළත් කිරීම.
නිගමනය
OCR (Optical Character Recognition) යනු කඩදාසි ලේඛන පරිලෝකනය කිරීම සහ ඩිජිටල්කරණය කිරීම සඳහා වූ තාක්ෂණයකි. එය ඡායාරූප, අතින් ලියන ලද ද්රව්ය සහ මුද්රිත ලේඛන වලින් සම්පූර්ණයෙන්ම සෙවිය හැකි ඩිජිටල් ගොනු නිර්මාණය කරයි.
මෙම තාක්ෂණයන් වඩාත් ලාභදායී සහ ලබා ගත හැකි වන පරිදි, OCR යනු AI විසඳුම් දත්ත සමුදාය නවීකරණය කරන ආකාරය පිළිබඳ පරිපූර්ණ නිදර්ශනයකි.
සාරාංශගත කිරීම සඳහා, OCR යනු අතිවිශාල විභවයන් සහිත අතිවිශිෂ්ට තාක්ෂණයකි. අද ලෝකයේ එවැනි උපකරණ දැනටමත් ඉතා සංකීර්ණයි. අනෙක් අතට Optical Character Recognition අනාගතයේදී වැඩිදියුණු වනු ඇත.
කෘත්රිම බුද්ධිය (AI) තොරතුරු පිළිබඳ අප සිතන ආකාරය වෙනස් කරමින් ඉදිරි වසරවල වඩාත්ම බලපෑම්කාරී ප්රවණතාවක් බවට පත්වීමට සූදානමින් සිටී.
ඔබමයි