אויב איר האָט אלץ פארבראכט שעה צו סיפטינג אַ אָנלייגן פון דאָקומענטן פֿאַר אינהאַלט, ווערטער אָדער אנדערע אינפֿאָרמאַציע, OCR קענען זיין דיין נייַע בעסטער פרייַנד. די פיייקייט צו נוצן אַ פּדף לייענער אָדער אנדערע דאָקומענט פאַרוואַלטונג געצייַג קענען שפּאָרן איר אַ פּלאַץ פון צייט. רובֿ פון אונדז אין געשעפט זענען קעסיידער זוכן פֿאַר וועגן צו פֿאַרבעסערן עפעקטיווקייַט און סטרימליין אַפּעריישאַנז.
אין דעם אָנשטרענגונג, OCR קענען זיין אַ נוציק געצייַג. מיר וועלן נעמען אַ נעענטער קוק אין אָפּטיש טשאַראַקטער דערקענונג (OCR) אין דעם שטיק, אַרייַנגערעכנט וואָס עס איז, ווי עס אַרבעט, און מער.
אַזוי, וואָס פּונקט איז (OCR) אָפּטיש כאַראַקטער דערקענונג?
טעקסט דערקענונג איז אן אנדער נאָמען פֿאַר אָפּטיש כאַראַקטער דערקענונג (OCR).
דאַטן זענען יקסטראַקטיד און ריפּורפּאָסעד פון סקאַנד צייטונגען, אַפּאַראַט פאָטאָס און בילד-בלויז פּדף מיט אַן OCR געצייַג. OCR ווייכווארג עקסטראַקץ אותיות פון בילדער, קאַנווערץ זיי צו ווערטער און אַסעמבאַלז די זאצן, אַלאַוינג אַקסעס צו און ענדערן דער אָריגינעל טעקסט.
עס אויך רימוווז די נויט פֿאַר דאַטן אַרייַן דורך האַנט. OCR סיסטעמען ווענדן גשמיות, געדרוקט דאָקומענטן אין מאַשין ליינעוודיק טעקסט ניצן אַ מישן פון ייַזנוואַרג און ווייכווארג. טעקסט איז קאַפּיד אָדער לייענען דורך ייַזנוואַרג (אַזאַ ווי אַן אָפּטיש סקאַנער אָדער דעדאַקייטאַד קרייַז ברעט), און נאָך פּראַסעסינג איז יוזשאַוואַלי כאַנדאַלד דורך ווייכווארג.
קינסטלעך סייכל (AI) קענען ווערן גענוצט אין OCR ווייכווארג צו דערגרייכן מער קאָמפּליצירט טעקניקס פון ינטעליגענט כאַראַקטער דערקענונג (ICR), אַזאַ ווי דיסטינגגווישינג שפּראַכן אָדער כאַנדרייטינג סטיילז. OCR איז רובֿ טיפּיקלי געניצט צו גער שווער קאָפּיע לעגאַל אָדער היסטארישע דאָקומענטן אין פּדף דאָקומענטן, וואָס קענען זיין עדיטיד, פאָרמאַטטעד און געזוכט ווי אויב זיי זענען געשריבן מיט אַ וואָרט פּראַסעסער.
ווען איר יבערקוקן אַ פאָרעם אָדער אַ קאַבאָלע, למשל, דיין קאָמפּיוטער סטאָרז עס ווי אַ בילד טעקע. איר קענט נישט מאָדיפיצירן, זוכן אָדער ציילן די ווערטער אין די בילד טעקע מיט אַ טעקסט רעדאַקטאָר. איר קענט אָבער נוצן OCR צו יבערמאַכן די בילד אין אַ טעקסט דאָקומענט און ראַטעווען די אינהאַלט ווי טעקסט דאַטן.
ווי גייט עס אַרבעט?
ווי פריער סטייטיד, אַן OCR סיסטעם באשטייט פון ביידע ייַזנוואַרג און ווייכווארג. דער ציל פון די סערוויס איז צו אָפּשאַצן די אינהאַלט פון אַ גשמיות דאָקומענט און יבערמאַכן די שטיק אין אַ שריפט וואָס קענען זיין געוויינט צו פּראַסעסינג דאַטן.
באַטראַכטן פּאָסט און פּאָסט סאָרטינג באַדינונגס, פֿאַר בייַשפּיל. OCR איז יקערדיק פֿאַר זייער פיייקייט צו געשווינד פּראָצעס מקור און צוריקקומען אַדרעסעס אין סדר צו קאַטאַגערייז פּאָסט מער יפישאַנטלי. די פאלגענדע דריי אַפּראָוטשיז זענען קריטיש פֿאַר די הצלחה פון די פּראָגראַם:
1. בילד פאַר-פּראַסעסינג
די טעכניק ענדערונגען די פאַקטיש פאָרעם פון דעם דאָקומענט אין אַ בילד, אַזאַ ווי אַ רעקאָרד בילד, אין דער ערשטער שריט. דער ציל פון דעם שריט איז צו מאַכן די פאַרטרעטונג פון די מאַשין ווי פּינטלעך ווי מעגלעך און אויך עלימינירן קיין אַנוואָנטיד דיווייישאַנז.
נאָך דעם, דער באַגריף איז קאָנווערטעד צו שוואַרץ און ווייַס און אָפּשאַצן פֿאַר העל קעגן טונקל געביטן (כאַראַקטערז). מיט OCR טעכנאָלאָגיע, די בילד איז צעטיילט אין דיסקרעטע טיילן, אַזאַ ווי ספּרעדשיץ, טעקסט אָדער ינסעט גראַפיקס.
2. אַי טשאַראַקטער רעקאָגניטיאָן
צו ויסטיילן אותיות און דידזשאַץ, אַי יגזאַמאַנז די טונקל געביטן פון די בילד. צו ציל איין וואָרט, פראַזע אָדער פּאַראַגראַף אין אַ צייט, AI טיפּיקלי ניצט איינער פון די פאלגענדע מעטהאָדס:
- מוסטער דערקענונג: צו באַן די אַי סיסטעם, טעקנאַלאַדזשיז נוצן אַ פאַרשיידנקייַט פון שפּראַכן, טעקסט פֿאָרמאַטירונגען און כאַנדרייטינג. צו ידענטיפיצירן שוועבעלעך, די אַלגערידאַם קאַמפּערז די אותיות אויף די דיטעקטאַד בריוו בילד צו די הערות עס האט שוין געלערנט.
- שטריך דערקענונג: צו דערקענען נייַע אותיות, די סיסטעם ניצט כּללים באזירט אויף זיכער כאַראַקטער אַטריביוץ. איין טרייט איז די נומער פון אַנגגאַלד, קראָסט אָדער קערווינג שורות אין אַ בריוו.
דער אַלגערידאַם ניצט קרייטיריאַ באזירט אויף זיכער כאַראַקטער פּראָפּערטיעס צו דעטעקט יינציק אותיות. די סומע פון אַנגגאַלד, אַריבער, אָדער בענדינג שורות אין אַ כאַראַקטער, פֿאַר בייַשפּיל, איז איין שטריך.
3. פּאָסטן-פּרעפּראָסעססינג
בעשאַס פּאָסט-פּראַסעסינג, אַי קערעקץ ערראָרס אין די לעצט טעקע. איין סטראַטעגיע איז צו דערציען די אַי אויף אַ ווערטערבוך פון טערמינאָלאָגיע וואָס וועט זיין געוויינט אין דער צייטונג. דערנאָך, צו ענשור אַז קיין ינטערפּריטיישאַנז זענען ווייַטער פון די וואָקאַבולאַרי פון אַי, באַגרענעצן די פּראָדוקציע פון AI צו די ווערטער / פֿאָרמאַטירונגען.
די בענעפיץ פון OCR
- די הויפּט בענעפיץ פון OCR טעכנאָלאָגיע זענען צייט סייווינגז און דיקריסט מיסטייקס. עס אויך אַלאַוז דאַטן צו זיין קאַמפּרעסט אין פאַרשלעסלען טעקעס, עפּעס אַ פאַקטיש געדרוקט בלאַט קען נישט ויספירן.
- דאַטן קענען זיין געזוכט מיט אָפּטיש טשאַראַקטער רעקאָגניטיאָן. סקאַנד טעקעס וואָס האָבן שוין קאָנווערטעד צו מאַשין-ליינעוודיק טעקעס קענען זיין סטאָרד אין קיין פֿאָרמאַט וואָס קענען זיין געזוכט אויף אַן אָרגאַניזאַציע ס ינערלעך סערווער אָדער געמאכט בנימצא גלאָובאַלי אויף דער אינטערנעץ.
- OCR איז אָפט געניצט אין קאַנדזשאַנגקשאַן מיט אנדערע קינסטלעך סייכל סיסטעמען. פֿאַר בייַשפּיל, זיך-דרייווינג קאַרס יבערקוקן און לייענען דערלויבעניש פּלאַטעס און וועג וואונדער, דערקענען סאָרט לאָגאָס אין געזעלשאַפטלעך מידיאַ פּאָוסטינגז און דערקענען פּראָדוקט פּאַקקאַגינג אין גאַנצע פאָטאָס. קינסטלעך סייכל טעכנאָלאָגיע ווי דאָס אַידז פירמס צו מאַכן בעסער פֿאַרקויף און אַפּעריישאַנאַל דיסיזשאַנז וואָס שפּאָרן געלט און פֿאַרבעסערן קונה צופֿרידנקייט.
- יגזיסטינג און נייַ אינפֿאָרמאַציע קענען זיין קאָנווערטעד אין אַ גאָר סעאַרטשאַבלע וויסן אַרקייוו. זיי קענען אויך נוצן דאַטן אַנאַליטיקס מכשירים צו אויטאָמאַטיש פּראָצעס די טעקסט דאַטאַבייס פֿאַר נאָך וויסן פּראַסעסינג.
- Optical Character Recognition (OCR) איז אַ שטאַרק געצייַג וואָס קענען דערקענען קיין שפּראַך שריפט. די פיייקייט פון OCR, ווען פּערד מיט די אוניקאָד נאָרמאַל און איבערזעצונג ווייכווארג אַזאַ ווי Google Translate, אַלאַוז יעדער סקאַנד און דידזשאַטייזד דאָקומענט צו זיין איבערגעזעצט אין קיין אנדערע שפּראַך. א נוץ וואָס ילימאַנייץ די נויט פֿאַר מענטשלעך טראַנסלייטערז און זייער צייט-קאַנסומינג השתדלות.
ניצן קאַסעס פון OCR
די מערסט באַוווסט נוצן פון אָפּטיש כאַראַקטער דערקענונג איז קאַנווערטינג געדרוקט פּאַפּיר דאָקומענטן אין מאַשין ליינעוודיק טעקסט דאָקומענטן (OCR). נאָך OCR-פּראַסעסינג אַ סקאַנד פּאַפּיר דאָקומענט, דער טעקסט קענען זיין עדיטיד מיט אַ וואָרט פּראַסעסער ווי Microsoft Word אָדער Google Docs.
פילע באַוווסט סיסטעמען און באַדינונגס אין אונדזער וואָכעדיק לעבן פאַרלאָזנ זיך OCR, וואָס איז טיפּיקלי געניצט ווי אַ ומבאַמערקט טעכנאָלאָגיע.
דאַטאַ אַרייַנשרייַב אָטאַמיישאַן, אַסיסטינג די בלינד און וויזשוואַלי כאַנדיקאַפּט, און ינדעקסינג דאָקומענטן פֿאַר זוכן ענדזשאַנז, אַזאַ ווי פּאַספּאָרץ, דערלויבעניש פּלאַטעס, ינווויסיז, באַנק סטייטמאַנץ, געשעפט קאַרדס און אָטאַמאַטיק נומער טעלער דערקענונג, זענען אַלע יקערדיק אָבער ווייניקער באַוווסט נוצן פון OCR טעכנאָלאָגיע .
דורך יבערמאַכן פּאַפּיר און סקאַנד בילד דאָקומענטן אין מאַשין-ליינעוודיק, סעאַרטשאַבלע פּדף טעקעס, OCR אַלאַוז די אַפּטאַמאַזיישאַן פון גרויס דאַטן מאָדעלינג. אָן טכילעס אַפּלייינג OCR צו דאָקומענטן וואָס טאָן ניט האָבן טעקסט לייַערס, פּראַסעסינג און יקסטראַקטינג וויכטיק אינפֿאָרמאַציע קענען ניט זיין אָטאַמייטיד.
סקאַנד צייטונגען קענען איצט זיין ינקאָרפּערייטיד אין אַ גרויס-דאַטן סיסטעם וואָס קענען לייענען קונה דאַטן פון באַנק סטייטמאַנץ, קאַנטראַקץ און אנדערע יקערדיק געדרוקט דאָקומענטן דאַנק צו OCR טעקסט דערקענונג.
אָרגאַנאַזיישאַנז קענען נוצן OCR צו אָטאַמייט די דאַטן מיינינג אַרייַנשרייַב בינע, אלא ווי צו האָבן פּערסאַנעל אַנאַלייז ינומעראַבאַל בילד דאָקומענטן און מאַניואַלי קאָרמען ינפּוץ אין אַ אָטאַמייטיד גרויס-דאַטן פּראַסעסינג רערנ - ליניע.
OCR ווייכווארג קענען דערקענען טעקסט אין בילדער, עקסטראַקט טעקסט פון פאָוטאַגראַפס און ראַטעווען טעקסט טעקעס אין די פאלגענדע פֿאָרמאַטירונגען: JPG, JPEG, PNG, BMP, Tiff, PDF און אנדערע.
דער לעגאַל געשעפט, וואָס קריייץ די מערסט פּייפּערווערק, ניצט אָפּטיש כאַראַקטער דערקענונג אין אַ פאַרשיידנקייַט פון וועגן. אַלע געדרוקט דאָקומענטן - אַפידאַוויץ, משפט, טעקעס, דעקלעריישאַנז, וויל, און אַזוי אויף - קענען זיין דיגיטאַליזעד, סטאָרד און געזוכט מיט די סימפּלאַסט OCR סקאַנערז.
די מעטהאָדס קענען זיין יוטאַלייזד פֿאַר לעגאַל רעקאָרדס אין אנדערע לינגגוויסטיק סקריפּס, אַזאַ ווי יאַפּאַניש און הינדיש, ווי OCR טעכנאָלאָגיע יקספּאַנדז צו שפּראַכן וואָס טאָן ניט נוצן די רוימישע כאַראַקטער. OCR טעכנאָלאָגיע קענען צושטעלן גלאַט אַקסעס צו פילע ביישפילן פון דער פאַרגאַנגענהייט פֿאַר אַ געשעפט וואָס רילייז באטייטיק אויף דער פאַרגאַנגענהייט.
אַפּפּליקאַטיאָנס פון OCR
- דערקענען פאַרקער וואונדער.
- מיט אַ אַפּאַראַט, איר קענען דערקענען נומער פּלאַטעס.
- פּאָזיציע, יקסטראַקשאַן און פּראַסעסינג פון דאַטן זענען אַלע אָטאַמייטיד.
- אין ערפּאָרץ, פּאַספּאָרץ זענען אנערקענט און דאַטן זענען יקסטראַקטיד.
- שאַפֿן אַ קאָנטאַקט רשימה ניצן די אינפֿאָרמאַציע אויף געשעפט קאַרדס.
- דעסיפערינג צייטונגען פֿאַר בלינד און וויזשוואַלי ימפּערד מענטשן צו זיין לייענען הויך צו זיי.
- מאכן עס מעגלעך צו זוכן דורך עלעקטראָניש בילדער פון געדרוקט מאַטעריאַלס.
- שאפן זוכן ארכיוון פון היסטארישן מאטעריאל ווי זשורנאלן און צייטונגען.
- דאַטן פּאָזיציע פֿאַר געשעפט דאָקומענטן אַזאַ ווי טשעקס, פּאַספּאָרץ, ינווויסיז, באַנק סטייטמאַנץ, ריסיץ און פּראָ פאָרמאַ ינווויסיז, צווישן אנדערע.
סאָף
OCR (Optical Character Recognition) איז אַ טעכניק פֿאַר סקאַנינג און דיגיטאַליזירן פּאַפּיר דאָקומענטן. עס קריייץ גאָר סעאַרטשאַבלע דיגיטאַל טעקעס פֿון פאָטאָס, כאַנדריטאַן מאַטעריאַל און געדרוקט דאָקומענטן.
ווי די טעקנאַלאַדזשיז ווערן מער שפּאָרעוודיק און בנימצא, OCR איז אַ שליימעסדיק געמעל פון ווי אַי סאַלושאַנז פירן דאַטאַבייס מאַדערנאַזיישאַן.
צו סאַמערייז, OCR איז אַ פאַנטאַסטיש טעכנאָלאָגיע מיט ריזיק פּאָטענציעל. אזעלכע אינסטרומענטן זענען שוין שיין סאפיסטיקירט אין דער היינטיקער וועלט. אָפּטיש כאַראַקטער דערקענונג, אויף די אנדערע האַנט, וועט פֿאַרבעסערן אין דער צוקונפֿט.
קינסטלעך סייכל (AI) איז גרייט צו ווערן איינער פון די מערסט ימפּרעסיוו טרענדס אין די ווייַטער יאָרן, ענדערן די וועג מיר טראַכטן וועגן אינפֿאָרמאַציע.
לאָזן אַ ענטפֿערן