Jekk qatt qattajt sigħat tgħarbel ma’ munzell ta’ dokumenti għal kontenut, kliem, jew informazzjoni oħra, l-OCR jista’ jkun l-aqwa ħabib ġdid tiegħek. Li jkollok l-abbiltà li tuża qarrej PDF jew għodda oħra ta 'ġestjoni tad-dokumenti tista' tiffranka ħafna ħin. Ħafna minna fin-negozju qegħdin kontinwament infittxu modi kif intejbu l-effiċjenza u nissimplifikaw l-operazzjonijiet.
F'dan l-isforz, l-OCR jista 'jkun għodda utli. Aħna ser nagħtu ħarsa aktar mill-qrib lejn ir-Rikonoxximent tal-Karattri Ottiċi (OCR) f'din il-biċċa, inkluż x'inhu, kif jaħdem, u aktar.
Allura, x'inhu eżattament (OCR) Rikonoxximent tal-Karattri Ottiċi?
Ir-rikonoxximent tat-test huwa isem ieħor għar-rikonoxximent ottiku tal-karattri (OCR).
Id-dejta tiġi estratta u repurposed minn karti skennjati, ritratti tal-kamera, u pdf bl-immaġni biss bl-użu ta 'għodda OCR. Is-softwer tal-OCR jiġbed ittri minn immaġini, jikkonvertihom fi kliem, u mbagħad jiġbor sentenzi, li jippermetti aċċess għal u alterazzjoni tat-test oriġinali.
Tneħħi wkoll il-ħtieġa għal data li tidħol bl-idejn. Is-sistemi OCR jibdlu dokumenti fiżiċi stampati f’test li jinqara mill-magni billi juża taħlita ta’ ħardwer u softwer. It-test huwa kkupjat jew jinqara minn ħardwer (bħal skaner ottiku jew bord ta 'ċirkwit iddedikat), u l-ipproċessar addizzjonali normalment jiġi mmaniġġjat minn softwer.
Intelliġenza artifiċjali (AI) jista 'jintuża f'softwer OCR biex jinkisbu tekniki aktar kumplessi ta' rikonoxximent intelliġenti ta 'karattri (ICR), bħal lingwi li jiddistingwu jew stili ta' kalligrafija. L-OCR huwa l-aktar tipikament użat biex jikkonverti dokumenti legali jew storiċi stampati f'dokumenti pdf, li mbagħad jistgħu jiġu editjati, ifformattjati, u mfittxija bħallikieku nkitbu permezz ta 'proċessur tal-kliem.
Meta tiskennja formola jew irċevuta, pereżempju, il-kompjuter tiegħek jaħżenha bħala fajl tal-immaġni. Ma tistax timmodifika, tfittex jew tgħodd il-kliem fil-fajl tal-istampa b'editur tat-test. Tista', madankollu, tutilizza l-OCR biex tittrasforma l-istampa f'dokument ta' test u ssalva l-kontenut bħala data tat-test.
Kif taħdem?
Kif intqal qabel, sistema OCR tikkonsisti kemm f'ħardwer kif ukoll f'softwer. L-għan tas-servizz huwa li jevalwa l-kontenut ta 'dokument fiżiku u jittrasforma l-biċċiet fi skript li mbagħad jista' jintuża biex jipproċessa d-data.
Ikkunsidra s-servizzi tal-posta u tal-issortjar tal-posta, pereżempju. L-OCR huwa essenzjali għall-kapaċità tagħhom li jipproċessaw malajr l-indirizzi tas-sors u r-ritorn sabiex jikkategorizzaw il-posta b'mod aktar effiċjenti. It-tliet approċċi li ġejjin huma kruċjali għas-suċċess tal-programm:
1. Ipproċessar minn qabel tal-immaġni
It-teknika tibdel il-forma attwali tad-dokument f'immaġni, bħal stampa rekord, fl-ewwel pass. L-għan ta 'dan il-pass huwa li r-rappreżentazzjoni tal-magna tkun preċiża kemm jista' jkun filwaqt li telimina wkoll kwalunkwe devjazzjoni mhux mixtieqa.
Wara dan, il-kunċett huwa kkonvertit għall-iswed u abjad u evalwat għal żoni bright vs skuri (karattri). Bl-użu tat-teknoloġija OCR, l-istampa mbagħad tinqasam f'partijiet diskreti, bħal spreadsheets, test, jew grafika inset.
2. Rikonoxximent tal-Karattri AI
Biex tiddistingwi ittri u ċifri, l-AI teżamina ż-żoni skuri tal-immaġni. Biex timmira kelma, frażi jew paragrafu waħda kull darba, l-AI tipikament timpjega wieħed mill-metodi li ġejjin:
- Rikonoxximent tal-mudelli: Biex iħarrġu s-sistema tal-AI, it-teknoloġiji jużaw varjetà ta’ lingwi, formati ta’ testi, u kalligrafija. Biex jidentifika logħbiet, l-algoritmu jqabbel l-ittri fuq l-immaġni tal-ittra misjuba man-noti li diġà tgħallem.
- Rikonoxximent tal-Karatteristiċi: Biex tirrikonoxxi karattri ġodda, is-sistema timpjega regoli bbażati fuq ċerti attributi tal-karattri. Karatteristika waħda hija n-numru ta 'linji angolati, qasmu jew mgħawweġ f'ittra.
L-algoritmu juża kriterji bbażati fuq ċerti proprjetajiet ta 'karattri biex jiskopri karattri uniċi. L-ammont ta 'linji angolati, li jaqsmu, jew liwi f'karattru, pereżempju, huwa karatteristika waħda.
3. Post-preproċessar
Matul l-Ipproċessar ta' wara, l-AI tikkoreġi l-iżbalji fil-fajl finali. Strateġija waħda hija li teduka lill-AI fuq dizzjunarju tat-terminoloġija li se jintuża fid-dokument. Imbagħad, biex tiżgura li l-ebda interpretazzjoni ma tkun lil hinn mill-vokabularju tal-AI, illimita l-output tal-AI għal dawk il-kliem/formati.
Benefiċċji tal-OCR
- Il-benefiċċji ewlenin tat-teknoloġija OCR huma l-iffrankar tal-ħin u t-tnaqqis tal-iżbalji. Jippermetti wkoll li d-dejta tiġi kkompressata f'fajls zip, xi ħaġa li paġna stampata reali ma tistax twettaq.
- Id-dejta tista' tiġi mfittxija bl-użu tar-Rikonoxximent tal-Karattri Ottiċi. Fajls skennjati li jkunu ġew ikkonvertiti f'fajls li jinqraw mill-magni jistgħu jinħażnu fi kwalunkwe format li jista' jitfittex fuq is-server intern ta' organizzazzjoni jew isir disponibbli globalment fuq l-Internet.
- OCR huwa spiss użat flimkien ma 'sistemi oħra ta' intelliġenza artifiċjali. Pereżempju, karozzi li jsuqu waħedhom jiskennjaw u jaqraw il-pjanċi tal-liċenzja u s-sinjali tat-toroq, jirrikonoxxu logos tad-ditta f'postijiet fuq il-midja soċjali, u jirrikonoxxu l-ippakkjar tal-prodott fir-ritratti tar-reklamar. It-teknoloġija tal-intelliġenza artifiċjali bħal din tgħin lid-ditti jieħdu deċiżjonijiet ta’ kummerċjalizzazzjoni u operazzjonali aħjar li jiffrankaw il-flus u jtejbu s-sodisfazzjon tal-klijent.
- Informazzjoni eżistenti u ġdida tista' tiġi kkonvertita f'arkivju tal-għarfien li jista' jitfittex b'mod sħiħ. Jistgħu wkoll jużaw għodod analitiċi tad-dejta biex jipproċessaw awtomatikament id-database tat-test għall-ipproċessar tal-għarfien addizzjonali.
- Ir-Rikonoxximent tal-Karattri Ottiċi (OCR) huwa għodda b'saħħitha li tista 'tirrikonoxxi kwalunkwe kitba tal-lingwa. Din il-kapaċità tal-OCR, meta mqabbla mal-istandard Unicode u softwer tat-traduzzjoni bħal Google Translate, tippermetti li kull dokument skannjat u diġitizzat jiġi tradott fi kwalunkwe lingwa oħra. Benefiċċju li jelimina l-ħtieġa għal tradutturi umani u l-isforzi tagħhom li jieħdu ħafna ħin.
Każijiet ta' Użu ta' OCR
L-aktar użu magħruf tar-rikonoxximent ottiku tal-karattri huwa l-konverżjoni ta’ dokumenti stampati f’dokumenti ta’ test li jinqraw mill-magni (OCR). Wara li tipproċessa bl-OCR dokument tal-karta skennjat, it-test jista’ jiġi editjat bl-użu ta’ word processor bħal Microsoft Word jew Google Docs.
Ħafna sistemi u servizzi magħrufa fil-ħajja tagħna ta’ kuljum jiddependu fuq l-OCR, li tipikament jintuża bħala teknoloġija li ma tidhirx.
L-awtomazzjoni tad-dħul tad-dejta, l-assistenza lill-għomja u l-persuni b’diżabilità viżwali, u l-indiċjar ta’ dokumenti għal magni tat-tiftix, bħal passaporti, pjanċi tal-liċenzja, fatturi, rendikonti bankarji, karti tan-negozju, u rikonoxximent awtomatiku tal-pjanċa tan-numri, huma kollha użi essenzjali iżda inqas magħrufa tat-teknoloġija OCR. .
Billi tittrasforma dokumenti tal-karta u stampa skannjati f'fajls PDF li jistgħu jinqraw mill-magni u li jistgħu jitfittxu, l-OCR jippermetti l-ottimizzazzjoni tal-immudellar tad-dejta kbira. Mingħajr ma tapplika inizjalment l-OCR għal dokumenti li m'għandhomx diġà saffi ta' test, l-ipproċessar u l-estrazzjoni ta' informazzjoni importanti ma jistgħux jiġu awtomatizzati.
Karti skennjati issa jistgħu jiġu inkorporati f'sistema ta 'dejta kbira li tista' taqra d-dejta tal-klijenti minn rendikonti bankarji, kuntratti, u dokumenti stampati essenzjali oħra grazzi għar-rikonoxximent tat-test OCR.
L-organizzazzjonijiet jistgħu jużaw l-OCR biex awtomatizzaw l-istadju tal-input tat-tħaffir tad-dejta, aktar milli jkollhom il-persunal janalizza dokumenti bl-istampi innumerabbli u jdaħħal l-inputs manwalment f'pipeline awtomatizzat tal-ipproċessar tad-dejta kbira.
Is-softwer tal-OCR jista’ jagħraf it-test fl-immaġini, jiġbed it-test mir-ritratti, u jsalva fajls tat-test fil-formati li ġejjin: JPG, JPEG, PNG, BMP, tiff, PDF, u oħrajn.
In-negozju legali, li joħloq l-aktar burokrazija, juża rikonoxximent ottiku tal-karattru f'varjetà ta 'modi. Id-dokumenti stampati kollha – affidavits, sentenzi, fajls, dikjarazzjonijiet, testmenti, eċċ – jistgħu jiġu diġitizzati, maħżuna, u mfittxija bl-użu tal-iskaners OCR l-aktar sempliċi.
Dawn il-metodi jistgħu jiġu utilizzati għal rekords legali f'kitbiet lingwistiċi oħra, bħall-Ġappuniż u l-Ħindi, peress li t-teknoloġija OCR tespandi għal lingwi li ma jużawx il-karattru Ruman. It-teknoloġija OCR tista' tipprovdi aċċess bla xkiel għal bosta eżempji mill-passat għal negozju li jiddependi b'mod sinifikanti fuq il-passat.
Applikazzjonijiet ta' OCR
- Jirrikonoxxu sinjali tat-traffiku.
- Bil-kamera, tista 'tagħraf pjanċi tan-numri.
- Id-dħul, l-estrazzjoni u l-ipproċessar tad-dejta huma kollha awtomatizzati.
- Fl-ajruporti, il-passaporti huma rikonoxxuti u d-data hija estratta.
- Ħolqien ta 'lista ta' kuntatti bl-użu tal-informazzjoni fuq il-karti tan-negozju.
- Karti tad-decifrar għal nies għomja u neqsin mid-dawl biex jinqraw lilhom b'leħen għoli.
- Li tagħmilha possibbli li ssir tfittxija permezz ta' immaġini elettroniċi ta' materjali stampati.
- Ħolqien ta' arkivji ta' materjal storiku li jistgħu jitfittxu bħal ġurnali u gazzetti.
- Dħul tad-dejta għal dokumenti kummerċjali bħal ċekkijiet, passaporti, fatturi, dikjarazzjonijiet bankarji, irċevuti, u fatturi pro forma, fost oħrajn.
konklużjoni
L-OCR (Optical Character Recognition) hija teknika għall-iskannjar u d-diġitizzazzjoni tad-dokumenti tal-karta. Joħloq fajls diġitali li jistgħu jitfittxu kompletament minn ritratti, materjal miktub bl-idejn, u dokumenti stampati.
Hekk kif dawn it-teknoloġiji jsiru aktar ekonomiċi u disponibbli, l-OCR huwa illustrazzjoni perfetta ta’ kif is-soluzzjonijiet tal-AI qed imexxu l-modernizzazzjoni tad-database.
Fil-qosor, l-OCR hija teknoloġija meraviljuża b'potenzjal enormi. Strumenti bħal dawn huma diġà pjuttost sofistikati fid-dinja tal-lum. Ir-Rikonoxximent tal-Karattri Ottiċi, min-naħa l-oħra, se jitjieb fil-futur.
L-intelliġenza artifiċjali (AI) hija lesta li ssir waħda mix-xejriet bl-aktar impatt fis-snin li ġejjin, u tbiddel il-mod kif naħsbu dwar l-informazzjoni.
Ħalli Irrispondi