Kaundan[Itago][Ipakita]
Kita adunay kinaiyanhong abilidad sa pag-ila ug pagklasipikar sa mga pulong ngadto sa mga indibidwal, mga dapit, mga lokasyon, mga mithi, ug uban pa sa matag higayon nga kita makadungog o makabasa niini. Ang mga tawo makahimo sa pagkategorya, pag-ila, ug pagsabut sa mga pulong nga paspas.
Pananglitan, mahimo nimong i-categorize ang usa ka butang ug dali nga makakuha og labing menos tulo hangtod upat nga mga kalidad kung makadungog ka sa ngalan nga "Steve Jobs,"
- Tawo: "Steve Jobs"
- Organisasyon: "Apple"
- Lokasyon: “California”
Tungod kay ang mga kompyuter kulang niining kinaiyanhong kahanas, kinahanglan natong tabangan sila sa pag-ila sa mga pulong o teksto ug pagklasipikar niini. Ang Ngalan nga Entity Recognition (NER) gigamit niini nga sitwasyon.
Niini nga artikulo, atong susihon ang NER (Named Entity Recognition) sa detalye, lakip ang importansya niini, mga benepisyo, nanguna nga NER API, ug daghan pa.
Unsa ang NER (Named Entity Recognition)?
Usa ka natural nga pamaagi sa pagproseso sa pinulongan (NLP) nga nailhan nga ginganlan nga entity recognition (NER), usahay nailhan nga entity identification o entity extraction, awtomatik nga makaila sa ginganlan nga mga entidad sa usa ka teksto ug maggrupo kanila ngadto sa gitakda nang daan nga mga kategoriya.
Ang mga entidad naglakip sa mga ngalan sa mga indibidwal, grupo, lugar, petsa, kantidad, kantidad sa dolyar, porsyento, ug uban pa. Uban sa gihinganlan nga entity recognition, mahimo nimo kining gamiton sa pagtigom og mahinungdanong datos alang sa usa ka database o sa pagkuha sa mahinungdanong impormasyon aron masabtan kung unsa ang usa ka dokumento.
Ang NER mao ang batong pamag-ang diin ang usa ka sistema sa AI nagsalig aron pag-analisar sa teksto alang sa mga paryente nga semantiko ug sentimento, bisan kung ang NLP nagrepresentar sa usa ka hinungdanon nga pag-uswag sa proseso sa pag-analisar sa teksto.
Unsa ang kamahinungdanon sa NER?
Ang pundasyon sa usa ka pamaagi sa pag-analisar sa teksto mao ang NER. Ang usa ka modelo sa ML kinahanglan una nga hatagan og milyon-milyon nga mga sample nga adunay pre-defined nga mga kategorya sa dili pa kini makasabut sa English.
Ang API nag-uswag sa panahon sa pag-ila niini nga mga sangkap sa mga teksto nga gibasa niini sa unang higayon. Ang gahum sa text analytics engine nagdugang uban ang katakus ug kusog sa kapabilidad sa NER.
Sama sa makita dinhi, daghang mga operasyon sa ML ang gi-trigger sa NER.
Pagpangita sa Semantiko
Ang pagpangita sa semantiko anaa na karon sa Google. Mahimo kang magsulod ug pangutana, ug kini maningkamot kutob sa mahimo sa pagtubag uban ang tubag. Aron makit-an ang kasayuran, gipangita sa usa ka tiggamit, ang mga digital nga katabang sama ni Alexa, Siri, chatbots, ug uban pa naggamit usa ka klase sa pagpangita sa semantiko.
Kini nga function mahimong maigo o masipyat, apan adunay nagkadaghan nga mga gamit niini, ug ang pagka-epektibo niini kusog nga pagtaas.
Data Analytics
Kini usa ka kinatibuk-ang hugpong sa mga pulong alang sa paggamit sa mga algorithm sa paghimo og pagtuki gikan sa wala matukod nga datos. Gihiusa niini ang mga pamaagi sa pagpakita sa kini nga datos sa proseso sa pagpangita ug pagkolekta sa angay nga datos.
Mahimo kini nga porma sa usa ka prangka nga estadistika nga pagpatin-aw sa mga resulta o usa ka biswal nga representasyon sa datos. Ang pag-analisar sa interes ug pakiglambigit sa usa ka hilisgutan mahimong mahimo gamit ang impormasyon gikan sa mga pagtan-aw sa YouTube, lakip na kung ang mga tumatan-aw nag-klik sa usa ka piho nga video.
Ang mga star rating sa usa ka produkto mahimong analisahon gamit ang data scraping gikan sa e-commerce nga mga site aron makahatag og kinatibuk-ang marka kon unsa ka maayo ang produkto.
Pagtuki sa sentimento
Dugang nga pagsuhid sa NER, pagtuki sa sentimento mahimong makaila tali sa maayo ug dili maayo nga mga pagsusi bisan kung wala’y kasayuran gikan sa mga rating sa bituon.
Nahibal-an niini nga ang mga termino sama sa "sobra nga gi-rate," "fiddly," ug "stupid" adunay negatibo nga mga konotasyon, samtang ang mga termino sama sa "mapuslanon," "dali," ug "sayon". Ang pulong nga "sayon" mahimong hubaron nga negatibo sa usa ka dula sa kompyuter.
Ang sopistikado nga mga algorithm makaila usab sa relasyon tali sa mga butang.
Pag-analisar sa Teksto
Sama sa data analytics, ang text analysis nagkuha sa impormasyon gikan sa unstructured text strings ug naggamit sa NER sa zero sa importanteng data.
Mahimo kini gamiton sa pagtipon sa datos sa mga paghisgot sa usa ka produkto, kasagaran nga presyo, o mga termino nga kasagarang gigamit sa mga kustomer sa paghulagway sa usa ka brand.
Pagtuki sa sulud sa Video
Ang labing komplikado nga mga sistema mao kadtong nagkuha sa datos gikan sa impormasyon sa video gamit ang pag-ila sa nawong, pagtuki sa audio, ug pag-ila sa hulagway.
Gamit ang pag-analisar sa sulud sa video, makit-an nimo ang mga "unboxing" nga mga video sa YouTube, mga demonstrasyon sa Twitch nga dula, pag-sync sa mga ngabil sa imong audio nga materyal sa Reels, ug uban pa.
Aron malikayan ang pagkawala sa importanteng impormasyon bahin sa kon sa unsang paagi ang mga tawo magkonektar sa imong produkto o serbisyo samtang ang gidaghanon sa online nga materyal sa video motubo, ang mas paspas ug mas mamugnaon nga mga teknik alang sa NER-based nga video content analysis gikinahanglan.
Tinuod nga kalibutan nga aplikasyon sa NER
Ang gihinganlan nga entity recognition (NER) nagpaila sa mga importanteng aspeto sa usa ka teksto sama sa mga ngalan sa mga tawo, mga lokasyon, mga tatak, mga kantidad sa kwarta, ug uban pa.
Ang pagkuha sa mga dagkong entidad sa usa ka teksto makatabang sa paghan-ay sa wala matukod nga datos ug pag-ila sa hinungdanon nga kasayuran, nga hinungdanon kung mag-atubang sa dagkong mga dataset.
Ania ang pipila ka makaiikag nga tinuod nga kalibutan nga mga pananglitan sa ginganlan nga pag-ila sa entidad:
Pag-analisar sa Feedback sa Customer
Ang mga review sa online usa ka talagsaon nga tinubdan sa feedback sa mga konsumidor tungod kay makahatag kini kanimo og detalyado nga impormasyon mahitungod sa gusto ug pagdumot sa mga kustomer sa imong mga butang ingon man kung unsa nga mga bahin sa imong kompanya ang kinahanglan nga pauswagon.
Ang tanan niini nga input sa kliyente mahimong organisado gamit ang mga sistema sa NER, nga mahimo usab nga mailhan ang mga nagbalikbalik nga isyu.
Pananglitan, pinaagi sa paggamit sa NER aron mahibal-an ang mga lugar nga kanunay nga gikutlo sa dili maayo nga mga pagsusi sa kostumer, mahimo kang magdesisyon nga magkonsentrar sa usa ka sanga sa opisina.
Rekomendasyon alang sa sulod
Ang usa ka lista sa mga artikulo nga konektado sa usa nga imong gibasa makita sa mga website sama sa BBC ug CNN kung nagbasa ka usa ka butang didto.
Kini nga mga website naghimo og mga rekomendasyon alang sa dugang nga mga website nga nagtanyag og impormasyon mahitungod sa mga entidad nga ilang gikuha gikan sa sulod nga imong gibasa gamit ang NER.
Pag-organisar sa mga Tiket sa Suporta sa Kustomer
Mahimo nimong gamiton ang mga algorithm sa pag-ila sa mga entidad aron mas dali nga matubag ang mga hangyo sa kliyente kung nagdumala ka usa ka pagtaas sa gidaghanon sa mga tiket sa suporta gikan sa mga kustomer.
I-automate ang mga buluhaton sa pag-atiman sa kustomer nga makagugol sa panahon, sama sa pagklasipikar sa mga reklamo ug pangutana sa mga kustomer, aron makadaginot sa imong kaugalingon nga kuwarta, madugangan ang kalipay sa kustomer, ug madugangan ang mga rate sa resolusyon.
Ang pagkuha sa entidad mahimo usab nga gamiton sa pagkuha sa mga importanteng datos, sama sa mga ngalan sa produkto o serial number, aron mas sayon ang pagruta sa mga tiket ngadto sa hustong ahente o team para sa pagsulbad sa maong isyu.
Ang algorithm sa pagpangita
Nakapangutana ka na ba kung giunsa ang mga website nga adunay milyon-milyon nga mga piraso sa kasayuran makahimo mga resulta nga may kalabotan sa imong pagpangita? Tagda ang website nga Wikipedia.
Gipakita sa Wikipedia ang usa ka panid nga adunay gitakda nang daan nga mga entidad nga ang termino sa pagpangita mahimong adunay kalabotan kung nangita ka alang sa "mga trabaho," imbes nga ibalik ang tanan nga mga artikulo nga adunay pulong nga "mga trabaho" diha kanila.
Busa, ang Wikipedia nagtanyag og link sa artikulo nga naghubit sa "trabaho," usa ka seksyon para sa mga tawo nga ginganlag Trabaho, ug laing lugar para sa media sama sa mga salida, mga dula sa video, ug uban pang matang sa kalingawan diin makita ang terminong “mga trabaho”.
Makita usab nimo ang lain nga bahin alang sa mga lokasyon nga adunay sulud sa pagpangita nga pulong.
Pag-atiman sa mga resume
Sa pagpangita sa sulundon nga aplikante, ang mga recruiter mogugol ug dakong bahin sa ilang adlaw sa pagrepaso sa mga resume. Ang matag résumé adunay parehas nga kasayuran, apan silang tanan gipresentar ug giorganisar nga lahi, nga usa ka kasagaran nga pananglitan sa wala’y istruktura nga datos.
Ang labing hinungdanon nga impormasyon bahin sa mga kandidato dali nga makuha pinaagi sa pag-recruit sa mga team nga naggamit sa entity extractors, lakip ang personal nga datos (sama sa ngalan, adres, numero sa telepono, petsa sa pagkatawo, ug email) ug impormasyon bahin sa ilang edukasyon ug kasinatian (sama sa mga sertipikasyon, degree. , mga ngalan sa kompanya, kahanas, ug uban pa).
E-komersiyo
Mahitungod sa ilang algorithm sa pagpangita sa produkto, ang mga online retailer nga adunay gatusan o liboan nga mga butang makabenepisyo gikan sa NER.
Kung wala ang NER, ang pagpangita sa "itom nga panit nga botas" magbalik mga resulta nga naglakip sa panit ug sapin nga dili itom. Kung mao, ang mga website sa e-commerce peligro nga mawad-an sa mga kliyente.
ISa among kaso, ang NER mag-categorize sa search word isip usa ka tipo sa produkto alang sa panit nga botas ug itom isip kolor.
Labing maayo nga Entity Extraction API
Google Cloud NLP
Para sa nabansay na nga mga himan, ang Google Cloud NLP naghatag sa Natural Language API niini. O, ang AutoML Natural Language API mapasibo alang sa daghang mga klase sa pagkuha ug pagtuki sa teksto kung gusto nimo itudlo ang imong mga himan sa terminolohiya sa imong industriya.
Ang mga API dali nga nakig-interact sa Gmail, Google Sheets, ug uban pang Google apps, apan ang paggamit niini sa mga third-party nga programa mahimong magkinahanglan ug mas komplikado nga code.
Ang sulundon nga kapilian sa negosyo mao ang pagkonektar sa mga aplikasyon sa Google ug Pagtipig sa Cloud ingon gidumala nga mga serbisyo ug mga API.
IBM Watson
Ang IBM Watson usa ka multi-cloud nga plataporma nga paspas kaayo ug naghatag ug pre-built nga kapabilidad, sama sa speech-to-text, nga talagsaon nga software nga awtomatik nga maka-analisar sa narekord nga audio ug mga tawag sa telepono.
Sa paggamit sa datos sa CSV, ang lawom nga pagkat-on sa AI sa Watson Natural Language Understanding makahimo og mga modelo sa pagkuha aron makuha ang mga entidad o keyword.
Ug uban sa pagpraktis, makahimo ka og mga modelo nga mas sopistikado. Ang tanan nga mga gamit niini ma-access pinaagi sa mga API, bisan kung gikinahanglan ang daghang kahibalo sa coding.
Maayo kini alang sa dagkong mga negosyo nga kinahanglan nga susihon ang daghang mga dataset ug adunay internal nga teknikal nga kapanguhaan.
Cortical.io
Gamit ang Semantic Folding, usa ka ideya gikan sa neurolohiya, ang Cortical.io naghatag sa pagkuha sa teksto ug mga solusyon sa NLU.
Gihimo kini aron makamugna og "semantic fingerprints," nga nagpaila sa kahulogan sa usa ka teksto sa tibuok ug espesipikong mga termino niini. Aron ipakita ang mga relasyon tali sa mga hugpong sa pulong, ang mga semantiko nga fingerprint naghulagway sa datos sa teksto.
Ang interactive nga dokumentasyon sa API sa Cortical.io naglangkob sa pagpaandar sa matag usa sa mga solusyon sa pagtuki sa teksto, ug kini yano nga ma-access gamit ang Java, Python, ug Javascript API.
Ang tool sa Contract Intelligence gikan sa Cortical.io gimugna ilabi na alang sa legal nga pagtuki aron sa paghimo sa semantic nga mga pagpangita, pagbag-o sa mga scan nga dokumento, ug pagtabang ug pagpalambo sa anotasyon.
Maayo kini alang sa mga negosyo nga nangita alang sa yano nga gamiton nga mga API nga wala kinahanglana ang kahibalo sa AI, labi na sa ligal nga sektor.
Unggoy Pagkat-on
Ang tanan nga mga mayor nga lengguwahe sa kompyuter gisuportahan sa mga API sa MonkeyLearn ug nag-set up lang sa pipila ka linya sa code aron makahimo usa ka file nga JSON nga adunay sulud sa imong gikuha nga mga entidad. Para sa mga extractor ug text analyst nga adunay naunang pagbansay, ang interface kay user-friendly.
O, sa pipila lang ka yano nga mga lakang, makahimo ka usa ka talagsaon nga extractor. Aron makunhuran ang oras ug mapaayo ang katukma, advanced natural nga pagproseso sa sinultian (NLP) nga adunay lawom pagkat-on sa makina makapahimo kanimo sa pagtimbang-timbang sa teksto sama sa usa ka tawo.
Dugang pa, gisiguro sa mga SaaS API nga ang pag-set up sa mga koneksyon sa mga himan sama sa Google Sheets, Excel, Zapier, Zendesk, ug uban pa wala magkinahanglan mga tuig sa kahibalo sa computer science.
Sa pagkakaron anaa sa imong browser mao ang name extractor, company extractor, ug location extractor. Alang sa impormasyon kon unsaon paghimo sa imong kaugalingon, tan-awa ang ginganlan nga entity recognition blog nga artikulo.
Maayo kini alang sa mga negosyo sa tanan nga gidak-on nga nalambigit sa teknolohiya, tingi, ug e-commerce nga nanginahanglan yano nga pagpatuman sa mga API alang sa lainlaing mga lahi sa pagkuha sa teksto ug pagtuki sa teksto.
Nasabtan ang Amazon
Aron mahimo nga yano ang pag-plug in ug paggamit sa mga nauna na nga gamit sa Amazon Comprehend diha-diha dayon, gibansay sila sa gatusan ka lainlaing mga natad.
Wala’y kinahanglan nga mga in-house server tungod kay kini usa ka gibantayan nga serbisyo. Ilabi na kung gigamit nimo karon ang panganod sa Amazon sa pila ka lebel, ang ilang mga API dali nga na-integrate sa mga nauna nga apps. Ug sa gamay pa nga pagbansay, ang katukma sa pagkuha mahimong mapataas.
Usa sa labing kasaligan nga mga teknik sa pag-analisa sa teksto alang sa pagkuha sa datos gikan sa mga medikal nga rekord ug mga pagsulay sa klinika mao ang Comprehend's Medical Named Entity and Relationship Extraction (NERe), nga makakuha mga detalye sa mga tambal, kondisyon, resulta sa pagsulay, ug mga pamaagi.
Kung itandi ang datos sa pasyente aron masusi ug maayo ang pagdayagnos, mahimong mapuslanon kaayo. Ang labing kaayo nga kapilian alang sa mga negosyo nga nangita usa ka pagdumala nga serbisyo nga adunay nabansay nga mga himan.
Aylien
Aron mahatagan og sayon nga pag-access sa lig-on nga machine learning text analysis, ang AYLIEN nagtanyag og tulo ka API plug-in sa pito ka sikat nga programming language.
Ang ilang News API naghatag og real-time nga pagpangita ug entity extraction gikan sa libu-libo nga mga tinubdan sa balita gikan sa tibuok kalibutan.
Ang pagkuha sa entidad ug daghang uban pang mga buluhaton sa pag-analisar sa teksto mahimong himuon gamit ang Text Analysis API sa mga dokumento, social media mga plataporma, mga survey sa konsumidor, ug uban pa.
Sa katapusan, gamit ang Text Analysis Platform, makahimo ka sa imong kaugalingon nga mga extractor ug mas diretso sa imong browser (TAP). Maayo kini alang sa mga kompanya nga kinahanglan nga mag-integrate sa panguna nga naayos nga mga API nga dali.
SpaCy
Ang SpaCy usa ka Python Natural Language Processing (NLP) package nga open-source, libre, ug adunay usa ka tonelada nga built-in nga mga feature.
Kini nagkaanam ug mas komon alang sa NLP data pagproseso ug pagtuki. Ang unstructured textual data gihimo sa dako kaayong sukod, busa importante ang pag-analisa niini ug pagkuha og mga insight gikan niini.
Aron mahimo kana, kinahanglan nimo nga ipakita ang mga kamatuoran sa paagi nga masabtan sa mga kompyuter. Mahimo nimo kini pinaagi sa NLP. Kini paspas kaayo, nga adunay lag nga oras nga 30ms lamang, apan kritikal, wala kini gituyo alang sa paggamit sa mga panid sa HTTPS.
Kini usa ka nindot nga kapilian sa pag-scan sa imong kaugalingon nga mga server o intranet tungod kay kini naglihok sa lokal, apan dili kini usa ka himan alang sa pagtuon sa tibuuk nga internet.
Panapos
Ang gihinganlan nga entity recognition (NER) usa ka sistema nga magamit sa mga negosyo sa pag-label sa may kalabotan nga impormasyon sa mga hangyo sa suporta sa kostumer, pagpangita sa mga entidad nga gi-refer sa feedback sa kustomer, ug dali nga pagkuha sa hinungdanon nga datos sama sa mga detalye sa pagkontak, lokasyon, ug petsa, ug uban pang mga butang.
Ang labing kasagaran nga pamaagi sa pagngalan sa entity recognition mao ang paggamit sa entity extraction APIs (bisan kini gihatag sa open-source nga mga librarya o mga produkto sa SaaS).
Bisan pa, ang pagpili sa labing kaayo nga alternatibo magsalig sa imong oras, panalapi, ug set sa kahanas. Alang sa bisan unsang matang sa negosyo, ang pagkuha sa entidad ug mas sopistikado nga mga teknolohiya sa pag-analisar sa teksto klaro nga mahimong mapuslanon.
Kung ang mga himan sa pagkat-on sa makina husto nga gitudlo, kini tukma ug dili makalimtan ang bisan unsang datos, makatipig kanimo oras ug salapi. Mahimo nimong i-configure kini nga mga solusyon aron magpadayon ug awtomatiko pinaagi sa pag-integrate sa mga API.
Pilia lang ang kurso sa aksyon nga labing kaayo alang sa imong kompanya.
Leave sa usa ka Reply