ለይዘት፣ ለቃላት ወይም ለሌላ መረጃ የተደራረቡ ሰነዶችን በማጣራት ሰዓታትን ካሳለፉ፣ OCR አዲሱ የቅርብ ጓደኛዎ ሊሆን ይችላል። የፒዲኤፍ አንባቢ ወይም ሌላ የሰነድ አስተዳደር መሳሪያ የመጠቀም ችሎታ ብዙ ጊዜ ይቆጥብልዎታል። አብዛኞቻችን በንግድ ስራ ላይ ያለን ውጤታማነት ለማሻሻል እና ስራዎችን ለማቀላጠፍ መንገዶችን እንፈልጋለን።
በዚህ ጥረት ኦሲአር ጠቃሚ መሳሪያ ሊሆን ይችላል። ምን እንደሆነ፣ እንዴት እንደሚሰራ እና ሌሎችንም ጨምሮ በዚህ ክፍል ውስጥ ያለውን የOptical Character Recognition (OCR)ን ጠለቅ ብለን እንመለከታለን።
ስለዚህ፣ በትክክል (OCR) የጨረር ቁምፊ እውቅና ምንድን ነው?
የጽሑፍ ማወቂያ ሌላ የእይታ ቁምፊ ማወቂያ (OCR) ስም ነው።
መረጃው ከተቃኙ ወረቀቶች፣ የካሜራ ፎቶዎች እና የምስል-ብቻ ፒዲኤፍ የ OCR መሳሪያ በመጠቀም ይወጣና እንደገና ጥቅም ላይ ይውላል። OCR ሶፍትዌር ፊደሎችን ከምስሎች ያወጣል፣ ወደ ቃላት ይቀይራቸዋል፣ እና ዓረፍተ ነገሮችን ይሰበስባል፣ ይህም የዋናውን ጽሑፍ ለማግኘት እና ለመቀየር ያስችላል።
እንዲሁም በእጅ የመግባት አስፈላጊነትን ያስወግዳል። የ OCR ስርዓቶች የሃርድዌር እና የሶፍትዌር ድብልቅን በመጠቀም አካላዊ፣ የታተሙ ሰነዶችን በማሽን ሊነበብ ወደሚችል ጽሁፍ ይቀየራሉ። ጽሁፍ የሚቀዳው ወይም የሚነበበው በሃርድዌር ነው (እንደ ኦፕቲካል ስካነር ወይም የተለየ የወረዳ ሰሌዳ) እና ተጨማሪ ሂደት ብዙውን ጊዜ በሶፍትዌር ነው የሚሰራው።
ሰው ሰራሽነት (AI) እንደ ቋንቋዎች ወይም የእጅ አጻጻፍ ስልቶችን የመለየት ይበልጥ ውስብስብ የማሰብ ችሎታን ማወቂያ (ICR) ቴክኒኮችን ለማግኘት በኦሲአር ሶፍትዌር ውስጥ መጠቀም ይቻላል። OCR በተለምዶ ሃርድ ኮፒ ህጋዊ ወይም ታሪካዊ ሰነዶችን ወደ ፒዲኤፍ ሰነዶች ለመቀየር ጥቅም ላይ ይውላል፣ ከዚያም በቃላት ማቀናበሪያ የተፃፈ ያህል ሊስተካከል፣ ሊቀረጽ እና ሊፈለግ ይችላል።
ለምሳሌ ቅፅን ወይም ደረሰኝን ሲቃኙ ኮምፒውተርዎ እንደ ምስል ፋይል ያከማቻል። በምስል ፋይሉ ውስጥ ያሉትን ቃላት ከጽሑፍ አርታኢ ጋር መቀየር፣ መፈለግ ወይም መቁጠር አይችሉም። ስዕሉን ወደ ጽሑፍ ሰነድ ለመቀየር እና ይዘቱን እንደ የጽሑፍ ውሂብ ለማስቀመጥ ግን OCR ን መጠቀም ይችላሉ።
እንዴት ነው የሚሰራው?
ቀደም ሲል እንደተገለፀው የ OCR ስርዓት ሁለቱንም ሃርድዌር እና ሶፍትዌሮችን ያካትታል። የአገልግሎቱ ግብ የአካላዊ ሰነድ ይዘትን መገምገም እና ቁርጥራጮቹን ወደ ስክሪፕት መቀየር ሲሆን ከዚያም መረጃን ለመስራት ሊያገለግል ይችላል።
ለምሳሌ የፖስታ እና የደብዳቤ መደርደር አገልግሎቶችን ተመልከት። ደብዳቤን በብቃት ለመከፋፈል ምንጩን በፍጥነት ለመስራት እና አድራሻዎችን ለመመለስ OCR አስፈላጊ ነው። የሚከተሉት ሶስት አካሄዶች ለፕሮግራሙ ስኬት ወሳኝ ናቸው።
1. ምስል ቅድመ-ማቀነባበር
ቴክኒኩ የሰነዱን ትክክለኛ ቅርጽ ወደ ምስል ይለውጠዋል, ለምሳሌ እንደ መዝገብ ምስል, በመጀመሪያ ደረጃ. የዚህ እርምጃ ግብ የማሽኑን ውክልና በተቻለ መጠን ትክክለኛ ማድረግ ሲሆን እንዲሁም ያልተፈለጉ ልዩነቶችን ያስወግዳል።
ከዚያ በኋላ, ጽንሰ-ሐሳቡ ወደ ጥቁር እና ነጭነት ይለወጣል እና ለደማቅ እና ጥቁር አካባቢዎች (ገጸ-ባህሪያት) ይገመገማል. የ OCR ቴክኖሎጂን በመጠቀም ስዕሉ እንደ የተመን ሉሆች፣ ጽሁፍ ወይም ኢንሴት ግራፊክስ ወደሚገኙ ልዩ ክፍሎች ይከፈላል።
2. AI ባህሪ እውቅና
ፊደላትን እና አሃዞችን ለመለየት AI የምስሉን ጨለማ ቦታዎች ይመረምራል። አንድ ቃል፣ ሐረግ ወይም አንቀጽ በአንድ ጊዜ ለማነጣጠር፣ AI በተለምዶ ከሚከተሉት ዘዴዎች አንዱን ይጠቀማል።
- ስርዓተ-ጥለት እውቅና፡ የ AI ስርዓትን ለማሰልጠን ቴክኖሎጂዎች የተለያዩ ቋንቋዎችን፣ የጽሁፍ ቅርጸቶችን እና የእጅ ጽሁፍን ይጠቀማሉ። ተዛማጆችን ለመለየት ስልተ ቀመር በተገኘው የፊደል ምስል ላይ ያሉትን ፊደሎች አስቀድሞ ከተማረው ማስታወሻ ጋር ያወዳድራል።
- የባህሪ ማወቂያ፡ አዲስ ቁምፊዎችን ለመለየት ስርዓቱ በተወሰኑ የቁምፊ ባህሪያት ላይ የተመሰረቱ ደንቦችን ይጠቀማል። አንዱ ባህርይ በደብዳቤ ውስጥ ያሉ የማእዘን፣ የተሻገሩ ወይም የተጠማዘቡ መስመሮች ብዛት ነው።
አልጎሪዝም ልዩ ቁምፊዎችን ለመለየት በተወሰኑ የቁምፊ ባህሪያት ላይ የተመሰረተ መስፈርት ይጠቀማል. በቁምፊ ውስጥ ያሉ የማእዘን፣ የማቋረጫ ወይም የማጣመም መስመሮች ብዛት፣ ለምሳሌ አንድ ባህሪ ነው።
3. ድህረ-ቅድመ-ሂደት
በድህረ-ሂደት ወቅት, AI በመጨረሻው ፋይል ውስጥ ስህተቶችን ያስተካክላል. አንዱ ስልት AIን በወረቀቱ ላይ ጥቅም ላይ በሚውል የቃላት መዝገበ ቃላት ላይ ማስተማር ነው። ከዚያ ምንም አይነት ትርጓሜዎች ከ AI መዝገበ-ቃላት በላይ አለመሆናቸውን ለማረጋገጥ የ AI ውጤቱን በእነዚያ ቃላት/ቅርጸቶች ይገድቡ።
የ OCR ጥቅሞች
- የ OCR ቴክኖሎጂ ዋና ጥቅሞች ጊዜ መቆጠብ እና ስህተቶች መቀነስ ናቸው። እንዲሁም ውሂብ ወደ ዚፕ ፋይሎች እንዲጨመቅ ያስችላል፣ ይህ እውነተኛ የታተመ ገጽ ሊያሳካው አይችልም።
- ኦፕቲካል ካራክተር ማወቂያን በመጠቀም መረጃ መፈለግ ይቻላል። በማሽን ሊነበቡ ወደሚችሉ ፋይሎች የተቀየሩ የተቃኙ ፋይሎች በድርጅቱ የውስጥ አገልጋይ ላይ ሊፈለጉ ወይም በአለም አቀፍ ደረጃ በበይነመረብ ላይ ሊገኙ በሚችሉ ቅርጸቶች ሊቀመጡ ይችላሉ።
- OCR ከሌሎች አርቲፊሻል ኢንተለጀንስ ስርዓቶች ጋር በተደጋጋሚ ጥቅም ላይ ይውላል። ለምሳሌ፣ በራሳቸው የሚነዱ መኪኖች የሰሌዳዎችን እና የመንገድ ምልክቶችን ይቃኛሉ እና ያነባሉ፣ በማህበራዊ ሚዲያ መለጠፍ ላይ የምርት አርማዎችን ይወቁ እና በማስታወቂያ ፎቶዎች ውስጥ የምርት ማሸጊያዎችን ይገነዘባሉ። እንደዚህ አይነት ሰው ሰራሽ የማሰብ ቴክኖሎጂ ድርጅቶች ገንዘብን የሚቆጥቡ እና የደንበኞችን እርካታ የሚያጎለብቱ የተሻሉ የግብይት እና ተግባራዊ ውሳኔዎችን እንዲያደርጉ ይረዳል።
- ነባር እና አዲስ መረጃ ወደ ሙሉ ለሙሉ ሊፈለግ ወደሚችል የእውቀት መዝገብ ሊቀየር ይችላል። ለተጨማሪ የእውቀት ሂደት የጽሁፍ ዳታቤዙን በራስ ሰር ለማስኬድ የዳታ ትንታኔ መሳሪያዎችን መጠቀም ይችላሉ።
- ኦፕቲካል ካራክተር ማወቂያ (OCR) ማንኛውንም የቋንቋ ስክሪፕት የሚያውቅ ኃይለኛ መሳሪያ ነው። ይህ የOCR አቅም ከዩኒኮድ ስታንዳርድ እና የትርጉም ሶፍትዌር እንደ ጎግል ተርጓሚ ጋር ሲጣመር እያንዳንዱ የተቃኘ እና ዲጂታል የተደረገ ሰነድ ወደ ሌላ ቋንቋ እንዲተረጎም ያስችላል። የሰው ተርጓሚዎችን ፍላጎት እና ጊዜ የሚወስድ ጥረታቸውን የሚያስቀር ጥቅም።
የ OCR ጉዳዮችን ተጠቀም
በጣም የታወቀው የኦፕቲካል ቁምፊ ማወቂያ አጠቃቀም የታተሙ የወረቀት ሰነዶችን በማሽን ሊነበብ የሚችል የጽሑፍ ሰነዶች (OCR) መለወጥ ነው። ከኦሲአር የተቃኘ የወረቀት ሰነድ በኋላ፣ ጽሑፉ እንደ ማይክሮሶፍት ዎርድ ወይም ጎግል ሰነዶች ባሉ የቃል ፕሮሰሰር በመጠቀም ሊስተካከል ይችላል።
በዕለት ተዕለት ሕይወታችን ውስጥ ብዙ የታወቁ ስርዓቶች እና አገልግሎቶች በ OCR ላይ ይተማመናሉ፣ ይህም በተለምዶ እንደ የማይታይ ቴክኖሎጂ ነው።
የውሂብ ግብዓት አውቶማቲክ፣ ማየት የተሳናቸውን እና ማየት የተሳናቸውን መርዳት እና የፍለጋ ፕሮግራሞችን እንደ ፓስፖርት፣ ታርጋ፣ ደረሰኞች፣ የባንክ መግለጫዎች፣ የንግድ ካርዶች እና አውቶማቲክ የቁጥር ሰሌዳ ማወቂያ ሰነዶችን መጠቆም ሁሉም አስፈላጊ ነገር ግን ብዙም የታወቁ የ OCR ቴክኖሎጂ አጠቃቀሞች ናቸው። .
የወረቀት እና የተቃኙ የምስል ሰነዶችን በማሽን ሊነበቡ፣ ሊፈለጉ ወደሚችሉ ፒዲኤፍ ፋይሎች በመቀየር፣ OCR ትልቅ ዳታ ሞዴሊንግ ማመቻቸት ያስችላል። ቀደም ሲል የጽሑፍ ንብርብሮች በሌላቸው ሰነዶች ላይ OCR ን ተግባራዊ ሳያደርጉ አስፈላጊ መረጃዎችን ማካሄድ እና ማውጣት በራስ-ሰር ሊሠሩ አይችሉም።
የተቃኙ ወረቀቶች አሁን በ OCR የጽሁፍ ማወቂያ አማካኝነት የደንበኞችን ውሂብ ከባንክ መግለጫዎች፣ ኮንትራቶች እና ሌሎች አስፈላጊ የታተሙ ሰነዶችን ማንበብ በሚችል ትልቅ ዳታ ስርዓት ውስጥ ሊካተት ይችላል።
ድርጅቶች ሰራተኞች ስፍር ቁጥር የሌላቸውን የስዕል ሰነዶችን እንዲመረምሩ እና ግብዓቶችን በእጅ ወደ አውቶማቲክ ትልቅ-ዳታ ማቀነባበሪያ ቧንቧ ከማስገባት ይልቅ የመረጃ ማዕድን ግቤት ደረጃን በራስ ሰር ለመስራት OCR ን መጠቀም ይችላሉ።
OCR ሶፍትዌር በምስሎች ውስጥ ያለውን ጽሑፍ መለየት፣ ከፎቶግራፎች ላይ ጽሑፍ ማውጣት እና የጽሑፍ ፋይሎችን በሚከተሉት ቅርጸቶች ማስቀመጥ ይችላል፡ JPG፣ JPEG፣ PNG፣ BMP፣ tiff፣ PDF እና ሌሎችም።
በጣም ብዙ የወረቀት ስራዎችን የሚፈጥረው ህጋዊ ንግድ በተለያዩ መንገዶች የኦፕቲካል ቁምፊ እውቅናን ይጠቀማል. ሁሉም የታተሙ ሰነዶች - የምስክር ወረቀቶች, ፍርዶች, ፋይሎች, መግለጫዎች, ኑዛዜዎች እና የመሳሰሉት - በጣም ቀላል የሆነውን የ OCR ስካነሮችን በመጠቀም ዲጂታል ማድረግ, ማከማቸት እና መፈለግ ይችላሉ.
የ OCR ቴክኖሎጂ የሮማን ባህሪ ወደማይጠቀሙ ቋንቋዎች ስለሚሰፋ እነዚህ ዘዴዎች ለህጋዊ መዝገቦች እንደ ጃፓንኛ እና ሂንዲ ባሉ ሌሎች የቋንቋ ስክሪፕቶች መጠቀም ይችላሉ። የ OCR ቴክኖሎጂ ካለፈው ጊዜ ጀምሮ ጉልህ በሆነ መልኩ ለሚተማመን ንግድ ካለፉት ምሳሌዎችን በቀላሉ ማግኘት ይችላል።
የ OCR መተግበሪያዎች
- የትራፊክ ምልክቶችን ማወቅ.
- በካሜራ አማካኝነት የቁጥር ሰሌዳዎችን ማወቅ ይችላሉ።
- መረጃን ማስገባት፣ ማውጣት እና ማካሄድ ሁሉም በራስ-ሰር ናቸው።
- በአውሮፕላን ማረፊያዎች ፓስፖርቶች ይታወቃሉ እና መረጃው ይወጣል።
- በንግድ ካርዶች ላይ ያለውን መረጃ በመጠቀም የእውቂያ ዝርዝር መፍጠር.
- ማየት ለተሳናቸው እና ማየት ለተሳናቸው ሰዎች ጮክ ብለው እንዲነበቡላቸው ወረቀቶችን መፍታት።
- የታተሙ ቁሳቁሶችን በኤሌክትሮኒክ ምስሎች መፈለግን ያስችላል።
- እንደ መጽሔቶች እና ጋዜጦች ያሉ ሊፈለጉ የሚችሉ የታሪክ መዛግብቶችን መፍጠር።
- እንደ ቼኮች፣ ፓስፖርቶች፣ ደረሰኞች፣ የባንክ መግለጫዎች፣ ደረሰኞች እና ፕሮፎርማ ደረሰኞች ያሉ የንግድ ሰነዶች የውሂብ ግቤት እና ሌሎችም።
መደምደሚያ
OCR (Optical Character Recognition) የወረቀት ሰነዶችን የመቃኘት እና የዲጂታል አሰራር ዘዴ ነው። ሙሉ በሙሉ ሊፈለጉ የሚችሉ ዲጂታል ፋይሎችን ከፎቶዎች፣ በእጅ ከተጻፉ ነገሮች እና ከታተሙ ሰነዶች ይፈጥራል።
እነዚህ ቴክኖሎጂዎች የበለጠ ኢኮኖሚያዊ እና የሚገኙ ሲሆኑ፣ OCR የ AI መፍትሄዎች የውሂብ ጎታ ዘመናዊነትን እንዴት እንደሚመሩ የሚያሳይ ፍጹም ምሳሌ ነው።
ለማጠቃለል፣ OCR ትልቅ አቅም ያለው ድንቅ ቴክኖሎጂ ነው። እንደነዚህ ያሉ መሳሪያዎች በዘመናዊው ዓለም ውስጥ በጣም የተራቀቁ ናቸው. በሌላ በኩል የእይታ ባህሪ እውቅና ወደፊት ይሻሻላል።
አርቴፊሻል ኢንተለጀንስ (AI) በሚቀጥሉት አመታት ውስጥ በጣም ተፅዕኖ ከሚፈጥሩ አዝማሚያዎች አንዱ ለመሆን ተዘጋጅቷል፣ መረጃን በተመለከተ ያለንን አስተሳሰብ ይቀይራል።
መልስ ይስጡ