Panimula sa Optical Character Recognition (OCR)

Talaan ng nilalaman[Tago][Ipakita]

Kaya, ano nga ba ang (OCR) Optical Character Recognition?
Paano ito gumagana?+-
Mga benepisyo ng OCR
Mga Kaso ng Paggamit ng OCR
Mga aplikasyon ng OCR
Konklusyon

Kung gumugol ka na ng mga oras sa pag-iwas sa isang stack ng mga dokumento para sa nilalaman, mga salita, o iba pang impormasyon, ang OCR ay maaaring maging iyong bagong matalik na kaibigan. Ang pagkakaroon ng kakayahang gumamit ng PDF reader o iba pang tool sa pamamahala ng dokumento ay makakapagtipid sa iyo ng maraming oras. Karamihan sa atin sa negosyo ay patuloy na naghahanap ng mga paraan upang mapabuti ang kahusayan at i-streamline ang mga operasyon.

Sa pagsisikap na ito, ang OCR ay maaaring maging isang kapaki-pakinabang na tool. Susuriin natin ang Optical Character Recognition (OCR) sa bahaging ito, kasama kung ano ito, kung paano ito gumagana, at higit pa.

Kaya, ano nga ba ang (OCR) Optical Character Recognition?

Ang pagkilala sa teksto ay isa pang pangalan para sa optical character recognition (OCR).

Kinukuha at nire-repurpose ang data mula sa mga na-scan na papel, larawan ng camera, at image-only na pdf gamit ang isang OCR tool. Kinukuha ng OCR software ang mga titik mula sa mga imahe, kino-convert ang mga ito sa mga salita, at pagkatapos ay nag-assemble ng mga pangungusap, na nagbibigay-daan sa pag-access at pagbabago ng orihinal na teksto.

Tinatanggal din nito ang pangangailangan para sa pagpasok ng data sa pamamagitan ng kamay. Ginagawa ng mga OCR system ang pisikal at naka-print na mga dokumento sa text na nababasa ng makina gamit ang pinaghalong hardware at software. Ang teksto ay kinopya o binabasa ng hardware (gaya ng optical scanner o dedikadong circuit board), at ang karagdagang pagpoproseso ay karaniwang pinangangasiwaan ng software.

artificial intelligence (AI) ay maaaring gamitin sa OCR software upang makamit ang mas kumplikadong mga diskarte ng intelligent character recognition (ICR), tulad ng pagkilala sa mga wika o estilo ng sulat-kamay. Ang OCR ay kadalasang ginagamit upang i-convert ang mga hard copy na legal o historikal na mga dokumento sa mga pdf na dokumento, na maaaring i-edit, i-format, at hanapin na parang isinulat ang mga ito gamit ang isang word processor.

Kapag nag-scan ka ng isang form o isang resibo, halimbawa, iniimbak ito ng iyong computer bilang isang file ng imahe. Hindi mo maaaring baguhin, hanapin, o bilangin ang mga salita sa file ng larawan gamit ang isang text editor. Gayunpaman, maaari mong gamitin ang OCR upang baguhin ang larawan sa isang dokumentong teksto at i-save ang mga nilalaman bilang data ng teksto.

Paano ito gumagana?

Tulad ng naunang sinabi, ang isang OCR system ay binubuo ng parehong hardware at software. Ang layunin ng serbisyo ay suriin ang nilalaman ng isang pisikal na dokumento at baguhin ang mga piraso sa isang script na pagkatapos ay magagamit upang iproseso ang data.

Isaalang-alang ang mga serbisyo sa pag-uuri ng postal at mail, halimbawa. Ang OCR ay mahalaga sa kanilang kakayahang mabilis na maproseso ang pinagmulan at ibalik na mga address upang mas mahusay na maikategorya ang mail. Ang sumusunod na tatlong paraan ay mahalaga sa tagumpay ng programa:

1. Pre-processing ng Imahe

Binabago ng pamamaraan ang aktwal na hugis ng dokumento sa isang imahe, tulad ng isang record na larawan, sa unang hakbang. Ang layunin ng hakbang na ito ay gawing tumpak ang representasyon ng makina hangga't maaari habang inaalis din ang anumang hindi gustong mga paglihis.

Pagkatapos nito, ang konsepto ay na-convert sa itim at puti at tinasa para sa maliwanag kumpara sa madilim na mga lugar (mga character). Gamit ang teknolohiyang OCR, hinati-hati ang larawan sa mga discrete na bahagi, gaya ng mga spreadsheet, text, o inset na graphics.

2. AI Character Recognition

Upang makilala ang mga titik at digit, sinusuri ng AI ang mga madilim na bahagi ng larawan. Upang i-target ang isang salita, parirala, o talata sa isang pagkakataon, karaniwang ginagamit ng AI ang isa sa mga sumusunod na pamamaraan:

Pagkilala sa Pattern: Upang sanayin ang AI system, ang mga teknolohiya ay gumagamit ng iba't ibang wika, mga format ng text, at sulat-kamay. Upang matukoy ang mga tugma, ikinukumpara ng algorithm ang mga titik sa nakitang larawan ng titik sa mga tala na natutunan na nito.
Pagkilala sa Tampok: Upang makilala ang mga bagong character, gumagamit ang system ng mga panuntunan batay sa ilang partikular na katangian ng character. Ang isang katangian ay ang bilang ng mga angled, crossed o curving lines sa isang letra.

Gumagamit ang algorithm ng pamantayan batay sa ilang partikular na katangian ng character para makakita ng mga natatanging character. Ang dami ng angled, crossing, o bending lines sa isang character, halimbawa, ay isang feature.

3. Post-preprocessing

Sa panahon ng Post-Processing, itinatama ng AI ang mga error sa huling file. Ang isang diskarte ay upang turuan ang AI sa isang diksyunaryo ng terminolohiya na gagamitin sa papel. Pagkatapos, para matiyak na walang interpretasyon na lampas sa bokabularyo ng AI, limitahan ang output ng AI sa mga salita/format na iyon.

Mga benepisyo ng OCR

Ang mga pangunahing benepisyo ng teknolohiya ng OCR ay ang pagtitipid sa oras at pagbaba ng mga pagkakamali. Pinapayagan din nito ang data na ma-compress sa mga zip file, isang bagay na hindi magagawa ng isang tunay na naka-print na pahina.
Maaaring hanapin ang data gamit ang Optical Character Recognition. Ang mga na-scan na file na na-convert sa mga file na nababasa ng makina ay maaaring maimbak sa anumang format na maaaring hanapin sa panloob na server ng organisasyon o gawing available sa buong mundo sa Internet.
Ang OCR ay madalas na ginagamit kasabay ng iba pang mga artificial intelligence system. Halimbawa, ang mga self-driving na kotse ay nag-i-scan at nagbabasa ng mga plaka at mga karatula sa kalsada, nakikilala ang mga logo ng brand sa mga pag-post sa social media, at kinikilala ang packaging ng produkto sa mga larawan sa advertising. Ang teknolohiya ng artificial intelligence na tulad nito ay tumutulong sa mga kumpanya sa paggawa ng mas mahusay na mga desisyon sa marketing at pagpapatakbo na nakakatipid ng pera at nagpapahusay sa kasiyahan ng customer.
Ang umiiral at bagong impormasyon ay maaaring ma-convert sa isang ganap na mahahanap na archive ng kaalaman. Maaari rin silang gumamit ng mga tool sa analytics ng data upang awtomatikong iproseso ang database ng teksto para sa karagdagang pagproseso ng kaalaman.
Ang Optical Character Recognition (OCR) ay isang makapangyarihang tool na maaaring makilala ang anumang script ng wika. Ang kakayahang ito ng OCR, kapag ipinares sa pamantayan ng Unicode at software ng pagsasalin tulad ng Google Translate, ay nagbibigay-daan sa bawat na-scan at na-digitize na dokumento na maisalin sa anumang iba pang wika. Isang pakinabang na nag-aalis ng pangangailangan para sa mga taong tagapagsalin at ang kanilang mga pagsisikap sa pag-ubos ng oras.

Mga Kaso ng Paggamit ng OCR

Ang pinakakilalang paggamit ng optical character recognition ay ang pag-convert ng mga naka-print na papel na dokumento sa machine-readable text documents (OCR). Pagkatapos ng OCR-processing ng scanned paper document, ang text ay maaaring i-edit gamit ang word processor tulad ng Microsoft Word o Google Docs.

Maraming kilalang sistema at serbisyo sa ating pang-araw-araw na buhay ang umaasa sa OCR, na karaniwang ginagamit bilang hindi nakikitang teknolohiya.

Ang automation ng pag-input ng data, pagtulong sa mga bulag at may kapansanan sa paningin, at pag-index ng mga dokumento para sa mga search engine, tulad ng mga pasaporte, mga plaka ng lisensya, mga invoice, bank statement, business card, at awtomatikong pagkilala sa numero ng plate, ay lahat ay mahalaga ngunit hindi gaanong kilalang paggamit ng teknolohiya ng OCR .

Sa pamamagitan ng pagbabago ng papel at mga na-scan na dokumento ng larawan sa machine-readable, nahahanap na mga PDF file, pinapayagan ng OCR ang pag-optimize ng big-data modelling. Nang walang unang paglalapat ng OCR sa mga dokumentong wala pang mga layer ng teksto, hindi maaaring awtomatiko ang pagproseso at pagkuha ng mahalagang impormasyon.

Ang mga na-scan na papel ay maaari na ngayong isama sa isang malaking-data system na makakabasa ng data ng customer mula sa mga bank statement, kontrata, at iba pang mahahalagang naka-print na dokumento salamat sa OCR text recognition.

Maaaring gamitin ng mga organisasyon ang OCR upang i-automate ang yugto ng pag-input ng data mining, sa halip na pag-aralan ng mga tauhan ang hindi mabilang na mga dokumento ng larawan at manu-manong i-feed ang mga input sa isang automated na pipeline ng pagpoproseso ng malaking data.

Maaaring makilala ng OCR software ang text sa mga larawan, mag-extract ng text mula sa mga litrato, at mag-save ng mga text file sa mga sumusunod na format: JPG, JPEG, PNG, BMP, tiff, PDF, at iba pa.

Ang legal na negosyo, na lumilikha ng pinakamaraming papeles, ay gumagamit ng optical character recognition sa iba't ibang paraan. Ang lahat ng naka-print na dokumento – affidavit, hatol, file, deklarasyon, testamento, at iba pa – ay maaaring i-digitize, iimbak, at hanapin gamit ang pinakasimpleng OCR scanner.

Ang mga pamamaraang ito ay maaaring gamitin para sa mga legal na talaan sa iba pang mga linguistic na script, gaya ng Japanese at Hindi, dahil ang teknolohiya ng OCR ay lumalawak sa mga wikang hindi gumagamit ng karakter na Romano. Ang teknolohiya ng OCR ay maaaring magbigay ng maayos na pag-access sa maraming mga halimbawa mula sa nakaraan para sa isang negosyo na lubos na umaasa sa nakaraan.

Mga aplikasyon ng OCR

Pagkilala sa mga palatandaan ng trapiko.
Sa pamamagitan ng camera, makikilala mo ang mga plate number.
Ang pagpasok, pagkuha, at pagproseso ng data ay awtomatiko lahat.
Sa mga paliparan, kinikilala ang mga pasaporte at kinukuha ang data.
Paglikha ng isang listahan ng contact gamit ang impormasyon sa mga business card.
Pag-decipher ng mga papel para sa mga bulag at may kapansanan sa paningin upang basahin nang malakas sa kanila.
Ginagawang posible na maghanap sa pamamagitan ng mga elektronikong larawan ng mga naka-print na materyales.
Paglikha ng mga mahahanap na archive ng makasaysayang materyal tulad ng mga journal at pahayagan.
Data entry para sa mga komersyal na dokumento gaya ng mga tseke, pasaporte, invoice, bank statement, resibo, at pro forma invoice, bukod sa iba pa.

Konklusyon

Ang OCR (Optical Character Recognition) ay isang pamamaraan para sa pag-scan at pag-digitize ng mga dokumentong papel. Lumilikha ito ng ganap na mahahanap na mga digital na file mula sa mga larawan, materyal na sulat-kamay, at mga naka-print na dokumento.

Habang nagiging mas matipid at available ang mga teknolohiyang ito, ang OCR ay isang perpektong paglalarawan kung paano hinihimok ng mga solusyon sa AI ang modernisasyon ng database.

Upang ibuod, ang OCR ay isang kamangha-manghang teknolohiya na may napakalaking potensyal. Ang ganitong mga instrumento ay medyo sopistikado na sa mundo ngayon. Ang Optical Character Recognition, sa kabilang banda, ay mapapabuti sa hinaharap.

Ang artificial intelligence (AI) ay nakahanda na maging isa sa mga pinaka-epektibong trend sa mga susunod na taon, na binabago ang paraan ng pag-iisip natin tungkol sa impormasyon.

Panimula sa Optical Character Recognition (OCR)

Kaya, ano nga ba ang (OCR) Optical Character Recognition?