Haeba u kile ua qeta lihora u ntse u hlahloba letoto la litokomane tsa litaba, mantsoe, kapa lintlha tse ling, OCR e ka ba motsoalle oa hau e mocha oa hlooho ea khomo. Ho ba le bokhoni ba ho sebelisa sebali sa PDF kapa sesebelisoa se seng sa taolo ea litokomane ho ka u bolokela nako e ngata. Bongata ba rona khoebong re lula re batla mekhoa ea ho ntlafatsa ts'ebetso le ho tsamaisa ts'ebetso.
Boitekong bona, OCR e ka ba sesebelisoa se sebetsang. Re tla shebisisa Optical Character Recognition (OCR) karolong ena, ho kenyelletsa hore na ke eng, e sebetsa joang, le tse ling.
Joale, hantle-ntle (OCR) Optical Character Recognition ke eng?
Temoho ea mongolo ke lebitso le leng la ho lemoha litlhaku tsa optical (OCR).
Lintlha li ntšoa ebe li rekoa hape ho tsoa lipampiring tse hlahlobiloeng, linepe tsa khamera, le pdf ea litšoantšo feela ho sebelisoa sesebelisoa sa OCR. Software ea OCR e ntša litlhaku ho tsoa litšoantšong, e li fetolela ho mantsoe, ebe e kopanya lipolelo, e lumella ho fihlella le ho fetola mongolo oa mantlha.
E boetse e tlosa tlhokahalo ea data e kenang ka letsoho. Sistimi ea OCR e fetola litokomane tsa 'mele, tse hatisitsoeng hore e be mongolo o baloang ke mochini o sebelisa motsoako oa hardware le software. Mongolo o kopitsoa kapa o baloe ke hardware (joalo ka sehatisi sa optical kapa boto ea potoloho e inehetseng), 'me ts'ebetso e eketsehileng hangata e sebetsoa ke software.
Bohlale ba maiketsetso (AI) e ka sebelisoa ho software ea OCR ho fihlela mekhoa e rarahaneng ea ho lemoha litlhaku tse bohlale (ICR), joalo ka ho khetholla lipuo kapa mekhoa ea ho ngola ka letsoho. Hangata OCR e sebelisoa ho fetolela litokomane tse thata tsa molao kapa tsa nalane hore e be litokomane tsa pdf, tse ka hlophisoang, tsa hlophisoa, 'me tsa batlisisoa joalokaha eka li ngotsoe ho sebelisoa processor ea mantsoe.
Ha o skena foromo kapa rasiti, mohlala, komporo ea hau e e boloka e le faele ea setšoantšo. Ha o khone ho fetola, ho batla, kapa ho bala mantsoe a faeleng ea setšoantšo ka sehlophisi sa mongolo. Leha ho le joalo, u ka sebelisa OCR ho fetola setšoantšo hore e be tokomane ea mongolo le ho boloka litaba e le data ea mongolo.
Hona e sebetsa?
Joalokaha ho boletsoe pejana, sistimi ea OCR e na le lisebelisoa le software. Morero oa ts'ebeletso ke ho lekola litaba tsa tokomane ea 'mele le ho fetola likotoana hore e be mongolo o ka sebelisoang ho sebetsana le data.
Nahana ka litšebeletso tsa ho hlophisa poso le mangolo, mohlala. OCR e bohlokoa bokhoning ba bona ba ho sebetsana le liaterese tsa mohloli kapele le ho khutlisa e le hore ba arole mangolo ka mokhoa o atlehileng haholoanyane. Mekhoa e meraro e latelang e bohlokoa molemong oa katleho ea lenaneo:
1. Image Pre-processing
Mokhoa ona o fetola sebopeho sa 'nete sa tokomane hore e be setšoantšo, joalo ka setšoantšo sa rekoto, mohatong oa pele. Sepheo sa mohato ona ke ho etsa hore setšoantšo sa mochine se nepahale ka hohle kamoo ho ka khonehang ha ho ntse ho tlosoa liphapang leha e le life tse sa batleheng.
Ka mor'a moo, khopolo e fetoloa hore e be e ntšo le e tšoeu 'me e hlahlojoe bakeng sa libaka tse khanyang le tse lefifi (litlhaku). U sebelisa theknoloji ea OCR, setšoantšo se aroloa ka likarolo tse sa tšoaneng, tse kang li-spreadsheet, mongolo, kapa litšoantšo tse kentsoeng.
2. Tlhokomeliso ea Sebopeho sa AI
Ho khetholla litlhaku le linomoro, AI e hlahloba libaka tse lefifi tsa setšoantšo. Ho lebisa lentsoe, polelo, kapa serapa ka nako, AI hangata e sebelisa e 'ngoe ea mekhoa e latelang:
- Tlhokomeliso ea Paterone: Ho koetlisa sistimi ea AI, mahlale a sebelisa lipuo tse fapaneng, lifomate tsa mongolo le mongolo. Ho tseba lipapali, algorithm e bapisa litlhaku tse setšoantšong sa tlhaku e fumanoeng le lintlha tseo e seng e ithutile tsona.
- Tlhokomeliso ea Sebopeho: Ho lemoha litlhaku tse ncha, sistimi e sebelisa melao e ipapisitseng le litšobotsi tse itseng. Tšobotsi e 'ngoe ke palo ea mela e harelaneng, e tšetsoeng kapa e kobehileng tlhakung.
Algorithm e sebelisa mekhoa e ipapisitseng le litšobotsi tse itseng tsa sebopeho ho bona litlhaku tse ikhethang. Palo ea mela e tšekaletseng, e tšekang, kapa e kobehang sebopehong, mohlala, ke tšobotsi e le 'ngoe.
3. Post-preprocessing
Nakong ea Post-Processing, AI e lokisa liphoso faeleng ea ho qetela. Leano le leng ke ho ruta AI ka bukantswe ya mareo e tla sebediswa pampiring. Joale, ho etsa bonnete ba hore ha ho litlhaloso tse fetang tlotlontswe ea AI, fokotsa tlhahiso ea AI ho mantsoe/lifomete tseo.
Melemo ea OCR
- Melemo e meholo ea theknoloji ea OCR ke ho boloka nako le ho fokotsa liphoso. E boetse e lumella data ho hatelloa ho lifaele tsa zip, ntho eo leqephe le hatisitsoeng la 'nete le ke keng la e etsa.
- Lintlha li ka batloa ho sebelisoa Optical Character Recognition. Lifaele tse hlahlobiloeng tse fetoletsoeng ho lifaele tse baloang ke mochini li ka bolokoa ka mokhoa ofe kapa ofe o ka batlisisoang ho li-server tsa ka hare tsa mokhatlo kapa tsa fumaneha lefatšeng ka bophara Marang-rang.
- Hangata OCR e sebelisoa hammoho le mekhoa e meng ea bohlale ba maiketsetso. Ka mohlala, likoloi tse itsamaisang li skena le ho bala li-licence plate le matšoao a tsela, li lemoha matšoao a marang-rang mecheng ea litaba tsa sechaba, 'me li lemoha sephutheloana sa lihlahisoa lifotong tsa papatso. Theknoloji ea bohlale ba maiketsetso e kang ena e thusa lifeme ho etsa liqeto tse ntle tsa ho bapatsa le tsa ts'ebetso tse bolokang chelete le ho ntlafatsa khotsofalo ea bareki.
- Lintlha tse teng le tse ncha li ka fetoloa polokelo ea tsebo e batloang ka botlalo. Ba ka boela ba sebelisa lisebelisoa tsa tlhahlobo ea data ho iketsetsa polokelo ea litaba bakeng sa ts'ebetso e eketsehileng ea tsebo.
- Optical Character Recognition (OCR) ke sesebelisoa se matla se ka lemohang mongolo ofe kapa ofe oa puo. Bokhoni bona ba OCR, ha bo tsamaisana le Unicode standard le software ea phetolelo e kang Google Translate, e lumella tokomane e 'ngoe le e 'ngoe e hlahlobiloeng le ho fetoleloa puong efe kapa efe. Molemo o felisang tlhoko ea bafetoleli ba batho le boiteko ba bona bo jang nako.
Sebelisa Maemo a OCR
Tšebeliso e tsebahalang haholo ea ho lemoha litlhaku tsa optical ke ho fetolela litokomane tsa pampiri tse hatisitsoeng hore e be litokomane tse baloang ka mochini (OCR). Kamora hore OCR e sebedise tokomane ea pampiri e hlahlobiloeng, mongolo o ka hlophisoa ho sebelisoa processor ea mantsoe joalo ka Microsoft Word kapa Google Docs.
Litsamaiso le litšebeletso tse ngata tse tsebahalang bophelong ba rona ba letsatsi le letsatsi li itšetlehile ka OCR, eo hangata e sebelisoang e le theknoloji e sa bonahaleng.
Ho kenya data, ho thusa batho ba sa boneng le ba nang le bokooa ba pono, le litokomane tsa indexing bakeng sa lienjine tsa patlo, joalo ka liphasepoto, lipoleiti tsa laesense, li-invoice, litatemente tsa banka, likarete tsa khoebo, le kananelo ea linomoro tsa othomathike, kaofela ke ts'ebeliso ea bohlokoa empa e sa tsejoe haholo ea theknoloji ea OCR. .
Ka ho fetola litokomane tsa pampiri le litšoantšo tse hlahlobiloeng hore e be lifaele tsa PDF tse baloang ke mochini, tse batloang ke mochini, OCR e lumella ho ntlafatsoa ha mohlala oa data e kholo. Ntle le ho qala ho sebelisa OCR ho litokomane tse seng li se na likarolo tsa mongolo, ho sebetsa le ho ntša tlhahisoleseling ea bohlokoa ho ke ke ha e-ba teng.
Lipampiri tse hlahlobiloeng joale li se li ka kenyelletsoa tsamaisong ea data e kholo e ka balang lintlha tsa bareki ho tsoa litatementeng tsa banka, likonteraka le litokomane tse ling tsa bohlokoa tse hatisitsoeng ka lebaka la kananelo ea mongolo oa OCR.
Mekhatlo e ka sebelisa OCR ho iketsetsa mohato oa ho kenya data morafong, ho e-na le hore basebetsi ba sekaseke litokomane tse ngata tsa litšoantšo le ho fana ka lipeipi ka mokhoa o ikemetseng oa ho sebetsana le data e kholo.
Software ea OCR e ka lemoha mongolo litšoantšong, ea ntša mongolo lifotong, 'me ea boloka lifaele tsa mongolo ka liforomo tse latelang: JPG, JPEG, PNG, BMP, tiff, PDF, le tse ling.
Khoebo ea molao, e etsang lipampiri tse ngata ka ho fetisisa, e sebelisa ho lemoha litlhaku tsa optical ka litsela tse sa tšoaneng. Litokomane tsohle tse hatisitsoeng - li-afidavit, likahlolo, lifaele, liphatlalatso, thato, joalo-joalo - li ka bolokoa, tsa bolokoa, 'me tsa batlisisoa ho sebelisoa li-scanner tse bonolo tsa OCR.
Mekhoa ena e ka sebelisoa bakeng sa lirekoto tsa molao mangolong a mang a lipuo, joalo ka Sejapane le Sehindi, ha theknoloji ea OCR e ntse e hola ho ea lipuong tse sa sebeliseng litlhaku tsa Seroma. Theknoloji ea OCR e ka fana ka phihlello e bonolo ho mehlala e mengata ea nakong e fetileng bakeng sa khoebo e itšetlehileng haholo ka nako e fetileng.
Lisebelisoa tsa OCR
- Ho lemoha matšoao a sephethephethe.
- Ka khamera, u ka tseba li-number plate.
- Ho kenya, ho ntšoa, le ho sebetsa ha data kaofela li itirile.
- Libakeng tsa boema-fofane, li-passport lia tsejoa 'me data e ntšoa.
- Ho theha lethathamo la mabitso o sebelisa lintlha tse likareteng tsa khoebo.
- Lipampiri tse hlalosang batho ba sa boneng le ba sa boneng li lokela ho balloa holimo.
- Ho etsa hore ho khonehe ho batla ka litšoantšo tsa elektroniki tsa thepa e hatisitsoeng.
- Ho theha li-archives tse ka batlisisang tsa litaba tsa nalane joalo ka likoranta le likoranta.
- Ho kenngoa ha data bakeng sa litokomane tsa khoebo tse kang licheke, liphasepoto, li-invoice, litatemente tsa banka, lirisiti le li-invoice tsa pro forma, har'a tse ling.
fihlela qeto e
OCR (Optical Character Recognition) ke mokhoa oa ho skena le ho etsa litokomane tsa pampiri ka dijithale. E theha lifaele tsa dijithale tse ka batlisisoang ka botlalo ho tsoa linepe, lisebelisoa tse ngotsoeng ka letsoho le litokomane tse hatisitsoeng.
Ha mahlale ana a ntse a tsoela pele ho ba le moruo le ho fumaneha, OCR ke papiso e phethahetseng ea kamoo litharollo tsa AI li tsamaisang ntlafatso ea database.
Ho akaretsa, OCR ke theknoloji e ntle haholo e nang le bokhoni bo boholo. Lisebelisoa tse joalo li se li rarahane haholo lefatšeng la kajeno. Optical Character Recognition, ka lehlakoreng le leng, e tla ntlafala nakong e tlang.
Artificial Intelligence (AI) e mothating oa ho ba e 'ngoe ea litloaelo tse nang le tšusumetso e kholo lilemong tse tlang, ho fetola tsela eo re nahanang ka tlhahisoleseling.
Leave a Reply