ប្រសិនបើអ្នកធ្លាប់ចំណាយពេលរាប់ម៉ោងដើម្បីរុះរើឯកសារជាច្រើនសម្រាប់មាតិកា ពាក្យ ឬព័ត៌មានផ្សេងទៀត OCR អាចជាមិត្តល្អបំផុតថ្មីរបស់អ្នក។ ការមានលទ្ធភាពប្រើប្រាស់កម្មវិធីអាន PDF ឬឧបករណ៍គ្រប់គ្រងឯកសារផ្សេងទៀតអាចជួយសន្សំសំចៃពេលវេលាច្រើន។ ពួកយើងភាគច្រើននៅក្នុងអាជីវកម្មកំពុងបន្តស្វែងរកវិធីដើម្បីបង្កើនប្រសិទ្ធភាព និងធ្វើឱ្យប្រតិបត្តិការប្រសើរឡើង។
នៅក្នុងកិច្ចខិតខំប្រឹងប្រែងនេះ OCR អាចជាឧបករណ៍មានប្រយោជន៍។ យើងនឹងពិនិត្យមើលឱ្យកាន់តែដិតដល់នូវ Optical Character Recognition (OCR) នៅក្នុងបំណែកនេះ រួមទាំងអ្វីដែលវាគឺជា របៀបដែលវាដំណើរការ និងច្រើនទៀត។
ដូច្នេះតើអ្វីជា (OCR) ការទទួលស្គាល់តួអក្សរអុបទិក?
ការទទួលស្គាល់អត្ថបទគឺជាឈ្មោះមួយផ្សេងទៀតសម្រាប់ការទទួលស្គាល់តួអក្សរអុបទិក (OCR) ។
ទិន្នន័យត្រូវបានដកស្រង់ចេញ និងយកមកប្រើវិញពីក្រដាសស្កេន រូបថតកាមេរ៉ា និងរូបភាពតែជា pdf ដោយប្រើឧបករណ៍ OCR។ កម្មវិធី OCR ស្រង់អក្សរចេញពីរូបភាព បំប្លែងវាទៅជាពាក្យ ហើយបន្ទាប់មកប្រមូលផ្តុំប្រយោគ អនុញ្ញាតឱ្យចូលប្រើ និងកែប្រែអត្ថបទដើម។
វាក៏ដកចេញនូវភាពចាំបាច់សម្រាប់ការបញ្ចូលទិន្នន័យដោយដៃផងដែរ។ ប្រព័ន្ធ OCR ប្រែក្លាយឯកសារដែលបានបោះពុម្ពទៅជាអត្ថបទដែលម៉ាស៊ីនអាចអានបានដោយប្រើផ្នែករឹង និងសូហ្វវែរ។ អត្ថបទត្រូវបានចម្លង ឬអានដោយផ្នែករឹង (ដូចជាម៉ាស៊ីនស្កេនអុបទិក ឬបន្ទះសៀគ្វីដែលឧទ្ទិស) ហើយដំណើរការបន្ថែមជាធម្មតាត្រូវបានគ្រប់គ្រងដោយកម្មវិធី។
ក្លែងបន្លំ (AI) អាចត្រូវបានប្រើនៅក្នុងកម្មវិធី OCR ដើម្បីសម្រេចបាននូវបច្ចេកទេសស្មុគ្រស្មាញបន្ថែមទៀតនៃការសម្គាល់តួអក្សរឆ្លាតវៃ (ICR) ដូចជាការសម្គាល់ភាសា ឬរចនាប័ទ្មសរសេរដោយដៃ។ OCR ត្រូវបានប្រើជាធម្មតាដើម្បីបំប្លែងឯកសារច្បាប់ ឬឯកសារប្រវត្តិសាស្ត្ររឹងទៅជាឯកសារ pdf ដែលបន្ទាប់មកអាចត្រូវបានកែសម្រួល ធ្វើទ្រង់ទ្រាយ និងស្វែងរកដូចជាពួកគេត្រូវបានសរសេរដោយប្រើកម្មវិធីវាយអត្ថបទ។
ឧទាហរណ៍ នៅពេលអ្នកស្កេនទម្រង់ ឬបង្កាន់ដៃ កុំព្យូទ័ររបស់អ្នករក្សាទុកវាជាឯកសាររូបភាព។ អ្នកមិនអាចកែប្រែ ស្វែងរក ឬរាប់ពាក្យនៅក្នុងឯកសាររូបភាពដោយប្រើកម្មវិធីនិពន្ធអត្ថបទបានទេ។ ទោះយ៉ាងណាក៏ដោយ អ្នកអាចប្រើប្រាស់ OCR ដើម្បីបំប្លែងរូបភាពទៅជាឯកសារអត្ថបទ ហើយរក្សាទុកមាតិកាជាទិន្នន័យអត្ថបទ។
តើវាដំណើរការយ៉ាងដូចម្តេច?
ដូចដែលបានបញ្ជាក់រួចមកហើយ ប្រព័ន្ធ OCR មានទាំងផ្នែករឹង និងផ្នែកទន់។ គោលដៅរបស់សេវាកម្មគឺដើម្បីវាយតម្លៃខ្លឹមសារនៃឯកសាររូបវន្ត និងបំប្លែងបំណែកទៅជាស្គ្រីបដែលបន្ទាប់មកអាចត្រូវបានប្រើដើម្បីដំណើរការទិន្នន័យ។
ជាឧទាហរណ៍ សូមពិចារណាអំពីសេវាតម្រៀបប្រៃសណីយ៍ និងសំបុត្រ។ OCR មានសារៈសំខាន់ចំពោះសមត្ថភាពរបស់ពួកគេក្នុងការដំណើរការប្រភព និងអាសយដ្ឋានត្រឡប់មកវិញយ៉ាងឆាប់រហ័ស ដើម្បីចាត់ថ្នាក់សំបុត្រឱ្យកាន់តែមានប្រសិទ្ធភាព។ វិធីសាស្រ្តទាំងបីខាងក្រោមនេះមានសារៈសំខាន់ចំពោះភាពជោគជ័យរបស់កម្មវិធី៖
1. ដំណើរការរូបភាពជាមុន
បច្ចេកទេសផ្លាស់ប្តូររូបរាងពិតនៃឯកសារទៅជារូបភាព ដូចជារូបភាពថតក្នុងជំហានដំបូង។ គោលដៅនៃជំហាននេះគឺដើម្បីធ្វើឱ្យការតំណាងរបស់ម៉ាស៊ីនមានភាពត្រឹមត្រូវតាមដែលអាចធ្វើទៅបាន ខណៈពេលដែលការលុបបំបាត់គម្លាតដែលមិនចង់បានណាមួយផងដែរ។
បន្ទាប់ពីនោះ គោលគំនិតត្រូវបានបំប្លែងទៅជាស និងខ្មៅ ហើយវាយតម្លៃសម្រាប់តំបន់ភ្លឺទល់នឹងងងឹត (តួអក្សរ)។ ដោយប្រើបច្ចេកវិទ្យា OCR បន្ទាប់មករូបភាពត្រូវបានបំបែកទៅជាផ្នែកដាច់ដោយឡែក ដូចជាសៀវភៅបញ្ជី អត្ថបទ ឬក្រាហ្វិកបញ្ចូល។
2. ការទទួលស្គាល់តួអក្សរ AI
ដើម្បីបែងចែកអក្សរ និងលេខ AI ពិនិត្យផ្ទៃងងឹតរបស់រូបភាព។ ដើម្បីកំណត់គោលដៅមួយពាក្យ ឃ្លា ឬកថាខណ្ឌក្នុងពេលតែមួយ AI ជាធម្មតាប្រើវិធីមួយក្នុងចំណោមវិធីខាងក្រោម៖
- ការទទួលស្គាល់លំនាំ៖ ដើម្បីបណ្តុះបណ្តាលប្រព័ន្ធ AI បច្ចេកវិទ្យាប្រើប្រាស់ភាសាផ្សេងៗ ទម្រង់អត្ថបទ និងការសរសេរដោយដៃ។ ដើម្បីកំណត់អត្តសញ្ញាណការផ្គូផ្គង ក្បួនដោះស្រាយប្រៀបធៀបអក្សរនៅលើរូបភាពអក្សរដែលបានរកឃើញទៅនឹងកំណត់ចំណាំដែលវាបានរៀនរួចហើយ។
- ការទទួលស្គាល់លក្ខណៈពិសេស៖ ដើម្បីស្គាល់តួអក្សរថ្មី ប្រព័ន្ធប្រើប្រាស់ច្បាប់ដោយផ្អែកលើលក្ខណៈតួអក្សរជាក់លាក់។ លក្ខណៈមួយគឺចំនួនបន្ទាត់ជ្រុង កាត់ ឬកោងក្នុងអក្សរ។
ក្បួនដោះស្រាយប្រើលក្ខណៈវិនិច្ឆ័យដោយផ្អែកលើលក្ខណៈសម្បត្តិតួអក្សរជាក់លាក់ដើម្បីស្វែងរកតួអក្សរតែមួយគត់។ ជាឧទាហរណ៍ ចំនួននៃបន្ទាត់កាត់កែង កាត់ ឬពត់ក្នុងតួអក្សរ គឺជាលក្ខណៈពិសេសមួយ។
3. ក្រោយពេលដំណើរការមុន។
កំឡុងពេលក្រោយដំណើរការ AI កែកំហុសនៅក្នុងឯកសារចុងក្រោយ។ យុទ្ធសាស្ត្រមួយគឺការអប់រំ AI នៅលើវចនានុក្រមនៃពាក្យដែលនឹងត្រូវប្រើក្នុងក្រដាស។ បន្ទាប់មក ដើម្បីធានាថាគ្មានការបកស្រាយលើសពីវាក្យសព្ទរបស់ AI កំណត់លទ្ធផលរបស់ AI ចំពោះពាក្យ/ទម្រង់ទាំងនោះ។
អត្ថប្រយោជន៍នៃ OCR
- អត្ថប្រយោជន៍ចម្បងនៃបច្ចេកវិទ្យា OCR គឺការសន្សំពេលវេលា និងកាត់បន្ថយកំហុស។ វាក៏អនុញ្ញាតឱ្យទិន្នន័យត្រូវបានបង្ហាប់ទៅក្នុងឯកសារ zip ដែលជាអ្វីដែលទំព័របោះពុម្ពពិតប្រាកដមិនអាចសម្រេចបាន។
- ទិន្នន័យអាចត្រូវបានស្វែងរកដោយប្រើការទទួលស្គាល់តួអក្សរអុបទិក។ ឯកសារដែលបានស្កែនដែលត្រូវបានបំប្លែងទៅជាឯកសារដែលអាចអានដោយម៉ាស៊ីនអាចត្រូវបានរក្សាទុកក្នុងទម្រង់ណាមួយដែលអាចស្វែងរកបាននៅលើម៉ាស៊ីនមេខាងក្នុងរបស់ស្ថាប័ន ឬធ្វើឱ្យមានជាសកលនៅលើអ៊ីនធឺណិត។
- OCR ត្រូវបានគេប្រើជាញឹកញាប់នៅក្នុងការភ្ជាប់ជាមួយប្រព័ន្ធបញ្ញាសិប្បនិម្មិតផ្សេងទៀត។ ជាឧទាហរណ៍ រថយន្តដែលបើកបរដោយខ្លួនឯង ស្កេន និងអានស្លាកលេខ និងផ្លាកសញ្ញាផ្លូវ ស្គាល់ស្លាកសញ្ញាម៉ាកនៅក្នុងការបង្ហោះប្រព័ន្ធផ្សព្វផ្សាយសង្គម និងទទួលស្គាល់ការវេចខ្ចប់ផលិតផលនៅក្នុងរូបថតផ្សាយពាណិជ្ជកម្ម។ បច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិតបែបនេះជួយក្រុមហ៊ុនក្នុងការធ្វើទីផ្សារ និងការសម្រេចចិត្តប្រតិបត្តិការកាន់តែប្រសើរ ដែលសន្សំប្រាក់ និងបង្កើនការពេញចិត្តរបស់អតិថិជន។
- ព័ត៌មានដែលមានស្រាប់ និងថ្មីអាចត្រូវបានបំប្លែងទៅជាបណ្ណសារចំណេះដឹងដែលអាចស្វែងរកបានពេញលេញ។ ពួកគេក៏អាចប្រើឧបករណ៍វិភាគទិន្នន័យដើម្បីដំណើរការមូលដ្ឋានទិន្នន័យអត្ថបទដោយស្វ័យប្រវត្តិសម្រាប់ដំណើរការចំណេះដឹងបន្ថែម។
- Optical Character Recognition (OCR) គឺជាឧបករណ៍ដ៏មានអានុភាពដែលអាចស្គាល់អក្សរភាសាណាមួយ។ សមត្ថភាពរបស់ OCR នេះ នៅពេលភ្ជាប់ជាមួយស្តង់ដារយូនីកូដ និងកម្មវិធីបកប្រែដូចជា Google Translate អនុញ្ញាតឱ្យរាល់ឯកសារដែលបានស្កេន និងឌីជីថលត្រូវបានបកប្រែទៅជាភាសាផ្សេងទៀត។ អត្ថប្រយោជន៍ដែលលុបបំបាត់តម្រូវការសម្រាប់អ្នកបកប្រែរបស់មនុស្ស និងការខិតខំប្រឹងប្រែងដែលចំណាយពេលវេលារបស់ពួកគេ។
ប្រើករណី OCR
ការប្រើប្រាស់ការទទួលស្គាល់តួអក្សរអុបទិកដែលល្បីល្បាញបំផុតគឺការបំប្លែងឯកសារក្រដាសដែលបានបោះពុម្ពទៅជាឯកសារអត្ថបទដែលអាចអានដោយម៉ាស៊ីន (OCR)។ បន្ទាប់ពីដំណើរការ OCR ឯកសារក្រដាសស្កេន អត្ថបទអាចត្រូវបានកែសម្រួលដោយប្រើកម្មវិធីវាយអត្ថបទដូចជា Microsoft Word ឬ Google Docs ។
ប្រព័ន្ធ និងសេវាកម្មល្បីៗជាច្រើននៅក្នុងជីវិតប្រចាំថ្ងៃរបស់យើងពឹងផ្អែកលើ OCR ដែលជាធម្មតាត្រូវបានប្រើប្រាស់ជាបច្ចេកវិទ្យាដែលមើលមិនឃើញ។
ស្វ័យប្រវត្តិកម្មនៃការបញ្ចូលទិន្នន័យ ជំនួយដល់ជនពិការភ្នែក និងពិការភ្នែក និងការចងក្រងឯកសារសម្រាប់ម៉ាស៊ីនស្វែងរក ដូចជាលិខិតឆ្លងដែន ស្លាកលេខ វិក្កយបត្រ របាយការណ៍ធនាគារ នាមប័ណ្ណ និងការទទួលស្គាល់ផ្លាកលេខដោយស្វ័យប្រវត្តិ សុទ្ធតែមានសារៈសំខាន់ ប៉ុន្តែមិនសូវស្គាល់ការប្រើប្រាស់បច្ចេកវិទ្យា OCR .
តាមរយៈការបំប្លែងក្រដាស និងឯកសាររូបភាពដែលបានស្កេនទៅជាឯកសារ PDF ដែលអាចអានបានដោយម៉ាស៊ីន OCR អនុញ្ញាតឱ្យមានការបង្កើនប្រសិទ្ធភាពនៃគំរូទិន្នន័យធំ។ ដោយមិនចាំបាច់អនុវត្ត OCR ជាដំបូងចំពោះឯកសារដែលមិនទាន់មានស្រទាប់អត្ថបទទេ ដំណើរការ និងស្រង់ព័ត៌មានសំខាន់ៗមិនអាចដំណើរការដោយស្វ័យប្រវត្តិបានទេ។
ឥឡូវនេះ ឯកសារដែលបានស្កែនអាចត្រូវបានដាក់បញ្ចូលទៅក្នុងប្រព័ន្ធទិន្នន័យធំ ដែលអាចអានទិន្នន័យអតិថិជនពីរបាយការណ៍ធនាគារ កិច្ចសន្យា និងឯកសារបោះពុម្ពសំខាន់ៗផ្សេងទៀត ដោយសារការទទួលស្គាល់អត្ថបទ OCR ។
អង្គការអាចប្រើ OCR ដើម្បីធ្វើស្វ័យប្រវត្តិកម្មដំណាក់កាលនៃការបញ្ចូលទិន្នន័យ ការជីកយករ៉ែជាជាងឱ្យបុគ្គលិកវិភាគឯកសាររូបភាពរាប់មិនអស់ និងបញ្ចូលធាតុបញ្ចូលដោយដៃទៅក្នុងបំពង់ដំណើរការទិន្នន័យធំដោយស្វ័យប្រវត្តិ។
កម្មវិធី OCR អាចស្គាល់អត្ថបទក្នុងរូបភាព ស្រង់អត្ថបទចេញពីរូបថត និងរក្សាទុកឯកសារអត្ថបទក្នុងទម្រង់ខាងក្រោម៖ JPG, JPEG, PNG, BMP, tiff, PDF និងផ្សេងទៀត។
អាជីវកម្មស្របច្បាប់ដែលបង្កើតឯកសារច្រើនជាងគេប្រើការទទួលស្គាល់តួអក្សរអុបទិកតាមវិធីផ្សេងៗគ្នា។ ឯកសារដែលបានបោះពុម្ពទាំងអស់ - លិខិតបញ្ជាក់ ការវិនិច្ឆ័យ ឯកសារ សេចក្តីប្រកាស ឆន្ទៈ និងអ្វីៗផ្សេងទៀត - អាចត្រូវបានឌីជីថល រក្សាទុក និងស្វែងរកដោយប្រើម៉ាស៊ីនស្កេន OCR សាមញ្ញបំផុត។
វិធីសាស្រ្តទាំងនេះអាចត្រូវបានប្រើប្រាស់សម្រាប់កំណត់ត្រាផ្លូវច្បាប់នៅក្នុងអក្សរសាស្ត្រភាសាផ្សេងទៀត ដូចជាភាសាជប៉ុន និងហិណ្ឌូ ដោយសារបច្ចេកវិទ្យា OCR ពង្រីកទៅជាភាសាដែលមិនប្រើតួអក្សររ៉ូម៉ាំង។ បច្ចេកវិទ្យា OCR អាចផ្តល់នូវភាពងាយស្រួលដល់ឧទាហរណ៍ជាច្រើនពីអតីតកាលសម្រាប់អាជីវកម្មដែលពឹងផ្អែកខ្លាំងលើអតីតកាល។
ការអនុវត្ត OCR
- ការទទួលស្គាល់ស្លាកសញ្ញាចរាចរណ៍។
- ជាមួយនឹងកាមេរ៉ា អ្នកអាចសម្គាល់ស្លាកលេខបាន។
- ការបញ្ចូល ការស្រង់ចេញ និងដំណើរការទិន្នន័យគឺដោយស្វ័យប្រវត្តិ។
- នៅព្រលានយន្តហោះ លិខិតឆ្លងដែនត្រូវបានទទួលស្គាល់ ហើយទិន្នន័យត្រូវបានស្រង់ចេញ។
- ការបង្កើតបញ្ជីទំនាក់ទំនងដោយប្រើព័ត៌មាននៅលើនាមប័ណ្ណ។
- ឌិគ្រីបក្រដាសសម្រាប់មនុស្សពិការភ្នែក និងពិការភ្នែក ដើម្បីអានឱ្យពួកគេឮៗ។
- ធ្វើឱ្យវាអាចស្វែងរកតាមរយៈរូបភាពអេឡិចត្រូនិចនៃសម្ភារៈបោះពុម្ព។
- ការបង្កើតបណ្ណសារដែលអាចស្វែងរកបាននៃសម្ភារៈប្រវត្តិសាស្ត្រដូចជា ទិនានុប្បវត្តិ និងកាសែត។
- ការបញ្ចូលទិន្នន័យសម្រាប់ឯកសារពាណិជ្ជកម្ម ដូចជាមូលប្បទានប័ត្រ លិខិតឆ្លងដែន វិក្កយបត្រ របាយការណ៍ធនាគារ បង្កាន់ដៃ និងវិក្កយបត្រ proforma ជាដើម។
សន្និដ្ឋាន
OCR (Optical Character Recognition) គឺជាបច្ចេកទេសមួយសម្រាប់ការស្កែន និងធ្វើឌីជីថលឯកសារក្រដាស។ វាបង្កើតឯកសារឌីជីថលដែលអាចស្វែងរកបានទាំងស្រុងពីរូបថត សម្ភារៈសរសេរដោយដៃ និងឯកសារបោះពុម្ព។
នៅពេលដែលបច្ចេកវិទ្យាទាំងនេះកាន់តែសន្សំសំចៃ និងអាចប្រើបាន OCR គឺជាការបង្ហាញដ៏ល្អឥតខ្ចោះអំពីរបៀបដែលដំណោះស្រាយ AI កំពុងជំរុញការធ្វើទំនើបកម្មមូលដ្ឋានទិន្នន័យ។
ដើម្បីសង្ខេប OCR គឺជាបច្ចេកវិទ្យាដ៏អស្ចារ្យមួយដែលមានសក្តានុពលដ៏ធំសម្បើម។ ឧបករណ៍បែបនេះមានភាពទំនើបគួរសមហើយនៅក្នុងពិភពលោកបច្ចុប្បន្ន។ ម្យ៉ាងវិញទៀត ការទទួលស្គាល់តួអក្សរអុបទិកនឹងប្រសើរឡើងនាពេលអនាគត។
Artificial Intelligence (AI) ត្រៀមខ្លួនជាស្រេចដើម្បីក្លាយជានិន្នាការដ៏មានឥទ្ធិពលបំផុតមួយនៅឆ្នាំក្រោយ ដោយផ្លាស់ប្តូរវិធីដែលយើងគិតអំពីព័ត៌មាន។
សូមផ្ដល់យោបល់