טיש פון קאָנטענץ[באַהאַלטן][ווייַזן]
מיר האָבן די געבוירן פיייקייט צו דערקענען און קלאַסיפיצירן ווערטער אין יחידים, ערטער, לאָוקיישאַנז, וואַלועס און מער ווען מיר הערן אָדער לייענען זיי. מענטשן זענען ביכולת צו קאַטאַגערייז, ידענטיפיצירן און באַגרייַפן ווערטער געשווינד.
פֿאַר בייַשפּיל, איר קענען קאַטאַגערייז אַ כייפעץ און געשווינד קומען אַרויף מיט בייַ מינדסטער XNUMX-XNUMX קוואַלאַטיז ווען איר הערן דעם נאָמען "סטיווע דזשאָבס,"
- מענטש: "סטייב דזשאָבס"
- אָרגאַניזאַציע: "עפּל"
- אָרט: "קאַליפאָרניאַ"
זינט קאָמפּיוטערס פעלן דעם ינייט בקיעס, מיר מוזן אַרוישעלפן זיי אין דערקענען ווערטער אָדער טעקסט און קלאַסאַפייינג עס. געהייסן ענטיטי דערקענונג (NER) איז געניצט אין דעם סיטואַציע.
אין דעם אַרטיקל, מיר וועלן ונטערזוכן NER (נאַמעד ענטיטי דערקענונג) אין דעטאַל, אַרייַנגערעכנט זייַן וויכטיקייט, בענעפיץ, שפּיץ NER APIs און פיל מער.
וואָס איז NER (נייד ענטיטי דערקענונג)?
א נאַטירלעך שפּראַך פּראַסעסינג (NLP) צוגאַנג באקאנט ווי געהייסן ענטיטי דערקענונג (NER), מאל באקאנט ווי ענטיטי לעגיטימאַציע אָדער ענטיטי יקסטראַקשאַן, אויטאָמאַטיש אנערקענט געהייסן ענטיטיז אין אַ טעקסט און גרופּעס זיי אין פּרידיטערמינד קאַטעגאָריעס.
ענטיטיז אַרייַננעמען נעמען פון מענטשן, גרופּעס, ערטער, דאַטעס, אַמאַונץ, דאָללאַרס אַמאַונץ, פּערסענטידזשיז, און מער. מיט דערקענונג פון אַ נאָמען, איר קענען נוצן עס צו זאַמלען באַטייַטיק דאַטן פֿאַר אַ דאַטאַבייס אָדער צו עקסטראַקט וויכטיק אינפֿאָרמאַציע צו פֿאַרשטיין וואָס אַ דאָקומענט איז וועגן.
NER איז דער קאָרנערסטאָון אויף וואָס אַן אַי סיסטעם דעפּענדס אין סדר צו אַנאַלייז טעקסט פֿאַר קאָרעוו סעמאַנטיקס און סענטימענט, אפילו אויב NLP רעפּראַזענץ אַ באַטייטיק העכערונג אין טעקסט אַנאַליטיקס פּראָצעס.
וואָס איז די באַטייַט פון NER?
דער יסוד פון אַ טעקסט אַנאַליטיקס צוגאַנג איז NER. א ML מאָדעל מוזן טכילעס זיין געגעבן מיליאַנז פון סאַמפּאַלז מיט פאַר-דיפיינד קאַטעגאָריעס איידער עס קענען פֿאַרשטיין ענגליש.
די אַפּי ימפּרוווז מיט צייט צו דערקענען די קאַמפּאָונאַנץ אין טעקסטן וואָס עס איז לייענען פֿאַר די ערשטער מאָל. די מאַכט פון די טעקסט אַנאַליטיקס מאָטאָר ינקריסיז מיט די קאַמפּאַטינס און שטאַרקייט פון די NER פיייקייט.
ווי געזען דאָ, עטלעכע ML אַפּעריישאַנז זענען טריגערד דורך NER.
סעמאַנטיק זוכן
סעמאַנטיק זוכן איז איצט בנימצא אויף Google. איר קענט אַרייַן אַ קשיא, און עס וועט זיין בעסטער צו ענטפֿערן מיט אַן ענטפער. אין סדר צו געפֿינען די אינפֿאָרמאַציע, אַ באַניצער איז קוקן פֿאַר, דיגיטאַל אַסיסטאַנץ ווי Alexa, Siri, טשאַטבאָץ און אנדערע נוצן אַ טיפּ פון סעמאַנטיק זוכן.
די פונקציע קענען זיין שלאָגן אָדער פאַרפירן, אָבער עס זענען אַ גראָוינג נומער פון ניצט פֿאַר עס, און זייער יפעקטיוונאַס איז רייזינג ראַפּאַדלי.
Data Analytics
דאָס איז אַ גענעראַל פראַזע פֿאַר ניצן אַלגערידאַמז צו שאַפֿן אַנאַליסיס פון אַנסטראַקטשערד דאַטן. עס ינטאַגרייץ מעטהאָדס פֿאַר ווייַזנדיק די דאַטן מיט דעם פּראָצעס פון דערגייונג און קאַלעקטינג פּערטינאַנט דאַטן.
דאָס קען נעמען די פאָרעם פון אַ סטרייטפאָרווערד סטאַטיסטיש דערקלערונג פון די רעזולטאַטן אָדער אַ וויזשאַוואַל פאַרטרעטונג פון די דאַטן. אַנאַליסיס פון אינטערעס אין און באַשטעלונג מיט אַ זיכער טעמע קענען זיין דורכגעקאָכט מיט אינפֿאָרמאַציע פֿון יאָוטובע קוקן, אַרייַנגערעכנט ווען וויוערז קליקינג אַוועק אַ ספּעציפיש ווידעא.
די שטערן רייטינגז פון אַ פּראָדוקט קענען זיין אַנאַלייזד מיט דאַטן סקרייפּינג פון E- האַנדל זייטלעך צו צושטעלן אַ קוילעלדיק כעזשבן פון ווי געזונט די פּראָדוקט איז טאן.
סענטימענט אַנאַליסיס
ווייַטער ויספאָרשן NER, סענטימענט אַנאַליסיס קענען ויסטיילן צווישן גוט און שלעכט באריכטן אפילו אין דער אַוועק פון אינפֿאָרמאַציע פון שטערן רייטינגז.
עס איז אַווער אַז טערמינען ווי "אָווועררייטיד," "פאַדלי," און "נאַריש" האָבן נעגאַטיוו קאַנאַטיישאַנז, כאָטש טערמינען ווי "נוציק," "שנעל," און "גרינג" טאָן. די וואָרט "גרינג" קען זיין ינטערפּראַטאַד נעגאַטיוולי אין אַ קאָמפּיוטער שפּיל.
סאַפיסטאַקייטיד אַלגערידאַמז קענען אויך דערקענען די שייכות צווישן זאכן.
טעקסט אַנאַליטיקס
ענלעך צו דאַטן אַנאַליטיקס, טעקסט אַנאַליסיס עקסטראַקט אינפֿאָרמאַציע פון אַנסטראַקטשערד טעקסט סטרינגס און ניצט NER צו נול אין די וויכטיק דאַטן.
עס קענען זיין גענוצט צו צונויפנעמען דאַטן וועגן דער דערמאָנען פון אַ פּראָדוקט, דורכשניטלעך פּרייַז אָדער די טערמינען וואָס קאַסטאַמערז רובֿ אָפט נוצן צו באַשרייַבן אַ זיכער סאָרט.
ווידעא אינהאַלט אַנאַליסיס
די מערסט קאָמפּליצירט סיסטעמען זענען די וואָס עקסטראַקט דאַטן פון ווידעא אינפֿאָרמאַציע מיט פיישאַל דערקענונג, אַודיאָ אַנאַליסיס און בילד דערקענונג.
ניצן ווידעא אינהאַלט אַנאַליסיס, איר קענען געפֿינען יאָוטובע "ונבאָקסינג" ווידיאס, Twitch שפּיל דעמאַנסטריישאַנז, ליפּ סינקס פון דיין אַודיאָ מאַטעריאַל אויף רילז, און מער.
אין סדר צו ויסמיידן פעלנדיק וויכטיק אינפֿאָרמאַציע וועגן ווי מענטשן פאַרבינדן צו דיין פּראָדוקט אָדער דינסט ווי די באַנד פון אָנליין ווידעא מאַטעריאַל וואַקסן, פאַסטער און מער ינווענטיוו טעקניקס פֿאַר NER-באזירט ווידעא אינהאַלט אַנאַליסיס זענען יקערדיק.
פאַקטיש-וועלט אַפּלאַקיישאַן פון NER
דערקענונג פון ענטיטי (NER) יידענאַפייד יקערדיק אַספּעקץ אין אַ טעקסט אַזאַ ווי נעמען פון מענטשן, לאָוקיישאַנז, בראַנדז, געלטיק וואַלועס, און מער.
עקסטראַקטינג די הויפּט ענטיטיז אין אַ טעקסט אַידז אין סאָרטינג אַנסטראַקטשערד דאַטן און דיטעקטינג באַטייַטיק אינפֿאָרמאַציע, וואָס איז קריטיש ווען האַנדלינג מיט גרויס דאַטאַסעץ.
דאָ זענען עטלעכע פאַסאַנייטינג פאַקטיש-וועלט ביישפילן פון געהייסן ענטיטי דערקענונג:
אַנאַלייזינג קונה באַמערקונגען
אָנליין באריכטן זענען אַ פאַנטאַסטיש מקור פון קאַנסומער באַמערקונגען ווייַל זיי קענען צושטעלן איר מיט דיטיילד אינפֿאָרמאַציע וועגן וואָס קאַסטאַמערז ווי און האַס וועגן דיין סכוירע און וואָס געביטן פון דיין פירמע דאַרפֿן צו זיין ימפּרוווד.
אַלע דעם קליענט אַרייַנשרייַב קענען זיין אָרגאַניזירט מיט NER סיסטעמען, וואָס קענען אויך ידענטיפיצירן ריאַקערינג ישוז.
פֿאַר בייַשפּיל, דורך ניצן NER צו ידענטיפיצירן ערטער וואָס זענען אָפט סייטאַד אין אַנפייוועראַבאַל קונה באריכטן, איר קענען באַשליסן צו קאַנסאַנטרייט אויף אַ זיכער אָפיס צווייַג.
רעקאָמענדאַציע פֿאַר אינהאַלט
א רשימה פון אַרטיקלען וואָס זענען קאָננעקטעד צו דעם וואָס איר לייענען קענען זיין געפֿונען אויף וועבסיטעס ווי BBC און CNN ווען איר לייענען אַן נומער דאָרט.
די וועבסיטעס מאַכן רעקאַמאַנדיישאַנז פֿאַר נאָך וועבסיטעס וואָס פאָרשלאָגן אינפֿאָרמאַציע וועגן די ענטיטיז וואָס זיי האָבן יקסטראַקטיד פון די אינהאַלט איר לייענען מיט NER.
אָרגאַניזירן טיקקעץ אין קונה סופּפּאָרט
איר קענט נוצן אַלגערידאַמז פֿאַר דערקענונג פון ענטיטיז צו ריספּאַנד צו קליענט ריקוועס מער געשווינד אויב איר פירן אַ פאַרגרעסערן אין די נומער פון שטיצן טיקאַץ פון קאַסטאַמערז.
אָטאַמייט צייט-קאַנסומינג קונה זאָרגן טשאָרז, אַזאַ ווי קלאַסאַפייינג קלייאַנץ און ינקוועריז פון קאַסטאַמערז, צו שפּאָרן זיך געלט, פאַרגרעסערן קונה גליק און פאַרגרעסערן האַכלאָטע ראַטעס.
ענטיטי יקסטראַקשאַן קענען אויך זיין גענוצט צו עקסטראַקט פּערטינאַנט דאַטן, אַזאַ ווי פּראָדוקט נעמען אָדער סיריאַל נומערן, צו מאַכן עס סימפּלער צו מאַרשרוט טיקיץ צו די רעכט אַגענט אָדער מאַנשאַפֿט פֿאַר סאַלווינג דעם אַרויסגעבן.
דער זוכן אַלגערידאַם
האָבן איר אלץ געפרעגט ווי וועבסיטעס מיט מיליאַנז פון אינפֿאָרמאַציע קענען פּראָדוצירן רעזולטאַטן וואָס זענען פּערטינאַנט צו דיין זוכן? באטראכט די וועבזייטל וויקיפעדיע.
וויקיפעדיע דיספּלייז אַ בלאַט מיט פּרעדעפינעד ענטיטיז וואָס די זוכן טערמין קענען פאַרבינדן צו ווען איר זוכן פֿאַר "דזשאָבס," אַנשטאָט פון צוריקקומען אַלע אַרטיקלען מיט די וואָרט "דזשאָבס" אין זיי.
אזוי, וויקיפעדיע אָפפערס אַ לינק צו דעם אַרטיקל וואָס דיפיינז "פאַך," אַ אָפּטיילונג פֿאַר מענטשן מיט די נאָמען דזשאָבס, און אן אנדער געגנט פֿאַר מעדיע אַזאַ ווי קינאָ, ווידעא גאַמעס, און אנדערע פארמען פון פאַרווייַלונג ווו דער טערמין "דזשאָבס" איז ארויס.
איר וואָלט אויך זען אן אנדער אָפּשניט פֿאַר לאָוקיישאַנז מיט די זוכן וואָרט.
נעמען קעיר פון רעזאַמייז
אין זוכן פון די ידעאַל אַפּליקאַנט, ריקרוטערז פאַרברענגען אַ באַטייטיק טייל פון זייער טאָג ריוויוינג רעזאַמייז. יעדער רעסומע האט די זעלבע אינפֿאָרמאַציע, אָבער זיי זענען אַלע דערלאנגט און אָרגאַניזירט דיפערענטלי, וואָס איז אַ טיפּיש בייַשפּיל פון אַנסטראַקטשערד דאַטן.
די מערסט פּערטינאַנט אינפֿאָרמאַציע וועגן קאַנדאַדייץ קענען זיין געשווינד יקסטראַקטיד דורך ריקרוטינג טימז ניצן ענטיטי עקסטראַקטאָרס, אַרייַנגערעכנט פערזענלעכע דאַטן (אַזאַ ווי נאָמען, אַדרעס, טעלעפאָן נומער, געבורט טאָג און בליצפּאָסט) און אינפֿאָרמאַציע וועגן זייער בילדונג און דערפאַרונג (אַזאַ ווי סערטאַפאַקיישאַנז, גראַד) , פירמע נעמען, סקילז, עטק).
E-האַנדל
וועגן זייער פּראָדוקט זוכן אַלגערידאַם, אָנליין רעטאַילערס מיט הונדערטער אָדער טויזנטער פון סכוירע וואָלט נוץ פון NER.
אָן NER, אַ זוכן פֿאַר "שוואַרץ לעדער שיך" וואָלט געבן רעזולטאַטן וואָס אַרייַנגערעכנט ביידע לעדער און שוכוואַרג וואָס זענען נישט שוואַרץ. אויב אַזוי, E- האַנדל וועבסיטעס ריזיקירן צו פאַרלירן קלייאַנץ.
Iאין אונדזער פאַל, NER וואָלט קאַטאַגערייז די זוכן וואָרט ווי אַ פּראָדוקט טיפּ פֿאַר לעדער שיך און שוואַרץ ווי די קאָליר.
בעסטער ענטיטי עקסטראַקטיאָן אַפּיס
Google Cloud NLP
פֿאַר שוין טריינד מכשירים, Google Cloud NLP גיט זייַן נאַטירלעך שפּראַך אַפּי. אָדער, די AutoML Natural Language API איז אַדאַפּטאַבאַל פֿאַר פילע מינים פון טעקסט יקסטראַקשאַן און אַנאַליסיס אויב איר ווילן צו דערציען דיין מכשירים אויף די טערמינאָלאָגיע פון דיין ינדאַסטרי.
די אַפּיס ינטעראַקט לייכט מיט Gmail, Google שיץ און אנדערע Google אַפּפּס, אָבער ניצן זיי מיט דריט-פּאַרטיי מגילה קענען דאַרפֿן מער קאָמפּליצירט קאָד.
די ידעאַל געשעפט אָפּציע איז צו פאַרבינדן Google אַפּלאַקיישאַנז און קלאָוד סטאָרידזש ווי געראטן באַדינונגס און אַפּיס.
יבם וואַצאָן
IBM Watson איז אַ מאַלטי-וואָלקן פּלאַטפאָרמע וואָס פּערפאָרמז ינקרעדאַבלי געשווינד און גיט פאַר-געבויט קייפּאַבילאַטיז, אַזאַ ווי רייד-צו-טעקסט, וואָס איז אַמייזינג ווייכווארג וואָס קענען אויטאָמאַטיש אַנאַלייז רעקאָרדעד אַודיאָ און טעלעפאָן קאַללס.
מיט די נוצן פון CSV דאַטן, די טיף לערנען אַי פון וואַצאָן נאַטוראַל שפּראַך פארשטאנד קענען שאַפֿן יקסטראַקשאַן מאָדעלס צו עקסטראַקט ענטיטיז אָדער טערמינען.
און מיט פיר, איר קענען מאַכן מאָדעלס וואָס זענען פיל מער סאַפיסטאַקייטיד. אַלע פון זייַן פאַנגקשאַנאַליטי זענען צוטריטלעך דורך אַפּיס, כאָטש ברייט קאָודינג וויסן איז דארף.
עס אַרבעט גוט פֿאַר גרויס געשעפטן וואָס דאַרפן צו ונטערזוכן ריזיק דאַטאַסעץ און האָבן ינערלעך טעכניש רעסורסן.
Cortical.io
מיט סעמאַנטיק פאָלדינג, אַ געדאַנק פון נוראַלאַדזשי, Cortical.io גיט טעקסט יקסטראַקשאַן און NLU סאַלושאַנז.
דאָס איז געטאן צו דזשענערייט "סעמאַנטיק פינגגערפּרינץ," וואָס אָנווייַזן ביידע די טייַטש פון אַ טעקסט אין זיין גאַנץ און ספּעציפיש טערמינען. אין סדר צו באַווייַזן די באַציונגען צווישן וואָרט קלאַסטערז, סעמאַנטיק פינגגערפּרינץ ויסמאָלן טעקסט דאַטן.
Cortical.io ס ינטעראַקטיוו אַפּי דאַקיומענטיישאַן קאָווערס די פאַנגקשאַנאַליטי פון יעדער פון די טעקסט אַנאַליסיס סאַלושאַנז, און עס איז פּשוט צו אַקסעס מיט די Java, Python און Javascript APIs.
די קאָנטראַקט ינטעלליגענסע געצייַג פון Cortical.io איז באשאפן ספּאַסיפיקלי פֿאַר לעגאַל אַנאַליסיס צו טאָן סעמאַנטיק אָנפֿרעגן, יבערמאַכן סקאַנד דאָקומענטן און העלפֿן און פאַרבעסערן מיט אַנאַטיישאַן.
עס איז ידעאַל פֿאַר געשעפטן וואָס זוכן פֿאַר פּשוט-צו-נוצן אַפּיס וואָס טאָן ניט דאַרפֿן אַי וויסן, ספּעציעל אין די לעגאַל סעקטאָר.
שפּיל מאַלפּע לערן
אַלע די הויפּט קאָמפּיוטער שפראַכן זענען געשטיצט דורך MonkeyLearn ס אַפּיס און שטעלן זיך בלויז אַ ביסל שורות פון קאָד צו פּראָדוצירן אַ JSON טעקע מיט דיין יקסטראַקטיד ענטיטיז. פֿאַר עקסטראַקטאָרס און טעקסט אַנאַליס מיט פריערדיק טריינינג, די צובינד איז באַניצער-פרייַנדלעך.
אָדער, אין בלויז אַ ביסל פּשוט סטעפּס, איר קענען מאַכן אַ יינציק עקסטראַקטאָר. צו רעדוצירן צייט און פֿאַרבעסערן אַקיעראַסי, אַוואַנסירטע נאַטירלעך שפּראַך פּראַסעסינג (NLP) מיט טיף מאַשין וויסן ינייבאַלז איר צו אָפּשאַצן טעקסט ווי אַ מענטש וואָלט.
אַדדיטיאָנאַללי, סאַאַס אַפּיס ינשור אַז באַשטעטיקן קאַנעקשאַנז מיט מכשירים ווי Google שיץ, עקססעל, זאַפּיער, זענדעסק און אנדערע טוט נישט דאַרפן יאָרן פון קאָמפּיוטער וויסנשאַפֿט וויסן.
דערווייַל בנימצא אין דיין בלעטערער זענען די נאָמען עקסטראַקטאָר, פירמע עקסטראַקטאָר און אָרט עקסטראַקטאָר. פֿאַר אינפֿאָרמאַציע אויף ווי צו בויען דיין אייגענע, זען דעם בלאָג אַרטיקל פֿאַר דערקענונג פון ענטיטיז.
עס איז ידעאַל פֿאַר געשעפטן פון אַלע סיזעס ינוואַלווד אין טעכנאָלאָגיע, לאַכאָדימ און E- האַנדל וואָס דאַרפֿן פּשוט-צו-ינסטרומענט אַפּיס פֿאַר פאַרשידן טייפּס פון טעקסט יקסטראַקשאַן און טעקסט אַנאַליסיס.
Amazon Comprehend
אין סדר צו מאַכן עס פּשוט צו צאַפּן אין און נוצן די פאַר-געבויט מכשירים פון Amazon Comprehend רעכט, זיי זענען טריינד אין הונדערטער פון פאַרשידענע פעלדער.
קיין אין-הויז סערווערס זענען פארלאנגט ווייַל דאָס איז אַ מאָניטאָרעד דינסט. דער הויפּט אויב איר איצט נוצן די וואָלקן פון אַמאַזאָן צו עטלעכע מדרגה, זייער אַפּיס ויסשטימען לייכט מיט ביז אַהער-יגזיסטינג אַפּפּס. און מיט בלויז אַ ביסל מער טריינינג, יקסטראַקשאַן אַקיעראַסי קענען זיין אויפשטיין.
איינער פון די מערסט פאַרלאָזלעך טעקסט אַנאַליסיס טעקניקס צו באַקומען דאַטן פון מעדיציניש רעקאָרדס און קליניש טריאַלס איז Comprehend's Medical Named Entity and Relationship Extraction (NERe), וואָס קענען עקסטראַקט דעטאַילס וועגן מעדאַקיישאַנז, טנאָים, פּרובירן רעזולטאַטן און פּראָוסידזשערז.
ווען קאַמפּערינג פּאַציענט דאַטן צו אַססעסס און פיין-ניגן דיאַגנאָסיס, עס קען זיין גאַנץ וווילטויק. דער בעסטער אָפּציע פֿאַר געשעפטן וואָס זוכן אַ געראטן דינסט מיט פאַר-טריינד מכשירים.
Aylien
אין סדר צו צושטעלן גרינג אַקסעס צו שטאַרק מאַשין לערנען טעקסט אַנאַליסיס, AYLIEN אָפפערס דריי API פּלוגינס אין זיבן פאָלקס פּראָגראַממינג שפּראַכן.
זייער נייַעס אַפּי גיט פאַקטיש-צייט זוכן און ענטיטי יקסטראַקשאַן פון טענס פון טויזנטער פון נייַעס קוואלן פון איבער דער וועלט.
ענטיטי יקסטראַקשאַן און עטלעכע אנדערע טעקסט אַנאַליסיס טאַסקס קענען זיין דורכגעקאָכט מיט די טעקסט אַנאַליסיס אַפּי אויף דאָקומענטן, געזעלשאַפטלעך מעדיע פּלאַטפאָרמס, קאַנסומער סערווייז און מער.
צום סוף, ניצן די טעקסט אַנאַליסיס פּלאַטפאָרמע, איר קענען מאַכן דיין אייגענע עקסטראַקטאָרס און מער גלייך אין דיין בלעטערער (טאַפּ). עס אַרבעט גוט פֿאַר קאָמפּאַניעס וואָס דאַרפֿן צו ויסשטימען בפֿרט פאַרפעסטיקט אַפּיס געשווינד.
ספּאַסי
ספּאַסי איז אַ פּיטהאָן נאַטוראַל שפּראַך פּראַסעסינג (NLP) פּעקל וואָס איז אָפֿן-מקור, פריי און האט אַ פּלאַץ פון געבויט-אין פֿעיִקייטן.
עס ווערט מער און מער געוויינטלעך פֿאַר NLP דאַטן פּראַסעסינג און אַנאַליסיס. אַנסטראַקטשערד טעקסטשאַוואַל דאַטן זענען באשאפן אויף אַ ריזיק וואָג, אַזוי עס איז קריטיש צו פונאַנדערקלייַבן עס און עקסטראַקט ינסייץ פון עס.
צו טאָן דאָס, איר מוזן ווייַזן די פאקטן אויף אַ וועג אַז קאָמפּיוטערס קענען פֿאַרשטיין. איר קענען טאָן דאָס דורך NLP. עס איז גאָר שנעל, מיט אַ אָפּשטיי צייט פון בלויז 30ms, אָבער קריטיש, עס איז נישט בדעה פֿאַר נוצן מיט HTTPS בלעטער.
דאָס איז אַ גוטע אָפּציע פֿאַר סקאַנינג דיין אייגענע סערווערס אָדער ינטראַנעט ווייַל עס אַפּערייץ לאָוקאַלי, אָבער עס איז נישט אַ געצייַג פֿאַר לערנען די גאנצע אינטערנעט.
סאָף
געהייסן ענטיטי דערקענונג (NER) איז אַ סיסטעם וואָס געשעפטן קענען נוצן צו שטעלן פּערטינאַנט אינפֿאָרמאַציע אין קונה שטיצן ריקוועס, געפֿינען ענטיטיז רעפערענסעד אין קונה באַמערקונגען און געשווינד עקסטראַקט קריטיש דאַטן ווי קאָנטאַקט דעטאַילס, לאָוקיישאַנז און דאַטעס, צווישן אנדערע זאכן.
די מערסט פּראָסט צוגאַנג צו זיין געהייסן ענטיטי דערקענונג איז דורך ניצן ענטיטי יקסטראַקשאַן אַפּיס (צי זיי זענען צוגעשטעלט דורך אָפֿן-מקור לייברעריז אָדער סאַאַס פּראָדוקטן).
אָבער, טשוזינג דער בעסטער אָלטערנאַטיוו וועט פאַרלאָזנ אויף דיין צייט, פיינאַנסיז און סקילז. פֿאַר קיין סאָרט פון געשעפט, ענטיטי יקסטראַקשאַן און מער סאַפיסטאַקייטיד טעקסט אַנאַליסיס טעקנאַלאַדזשיז קענען קלאר זיין אַדוואַנטיידזשאַס.
ווען מאַשין לערנען מכשירים זענען ריכטיק געלערנט, זיי זענען פּינטלעך און טאָן ניט פאַרזען קיין דאַטן, און איר שפּאָרן צייט און געלט. איר קענען קאַנפיגיער די סאַלושאַנז צו לויפן קאַנטיניואַסלי און אויטאָמאַטיש דורך ינטאַגרייטינג אַפּיס.
פשוט קלייַבן די לויף פון קאַמף וואָס איז בעסטער פֿאַר דיין פירמע.
לאָזן אַ ענטפֿערן