Enhavtabelo[Kaŝi][Montri]
Ni havas la denaskan kapablon rekoni kaj klasifiki vortojn en individuojn, lokojn, lokojn, valorojn kaj pli kiam ajn ni aŭdas aŭ legas ilin. Homoj kapablas rapide kategoriigi, identigi kaj kompreni vortojn.
Ekzemple, vi povas kategoriigi objekton kaj rapide elpensi almenaŭ tri ĝis kvar kvalitojn kiam vi aŭdas la nomon "Steve Jobs".
- Persono: "Steve Jobs"
- Organizo: "Apple"
- Loko: "Kalifornio"
Ĉar al komputiloj mankas ĉi tiu denaska kapablo, ni devas helpi ilin rekoni vortojn aŭ tekston kaj klasifiki ĝin. Named Entity Recognition (NER) estas uzata en ĉi tiu situacio.
En ĉi tiu artikolo, ni ekzamenos NER (Named Entity Recognition) detale, inkluzive de ĝia graveco, avantaĝoj, ĉefaj NER-API-oj kaj multe pli.
Kio estas NER (Rekono de Nomita Ento)?
Naturlingva prilaborado (NLP) aliro konata kiel nomita unuo-rekono (NER), foje konata kiel unuoidentigo aŭ unuo-ekstraktado, aŭtomate rekonas nomitajn unuojn en teksto kaj grupigas ilin en antaŭdestinitajn kategoriojn.
Entoj inkluzivas nomojn de individuoj, grupoj, lokoj, datoj, kvantoj, dolarkvantoj, procentoj kaj pli. Kun nomo-rekono, vi povas aŭ uzi ĝin por kolekti signifajn datumojn por datumbazo aŭ ĉerpi esencajn informojn por kompreni pri kio temas dokumento.
NER estas la bazŝtono de kiu AI-sistemo dependas por analizi tekston por relativa semantiko kaj sento, eĉ se NLP reprezentas signifan akcelon en la tekstanalitika procezo.
Kio estas la signifo de NER?
La fundamento de tekstanalitika aliro estas NER. ML-modelo devas komence ricevi milionojn da specimenoj kun antaŭdifinitaj kategorioj antaŭ ol ĝi povas kompreni la anglan.
La API pliboniĝas kun la tempo rekonante ĉi tiujn komponantojn en tekstoj, kiujn ĝi legas por la unua fojo. La potenco de la tekstoanalitika motoro pliiĝas kun la kompetenteco kaj forto de la NER-kapablo.
Kiel vidite ĉi tie, pluraj ML-operacioj estas ekigitaj de NER.
Semantika Serĉo
Semantika serĉo nun haveblas ĉe Guglo. Vi povas enigi demandon, kaj ĝi klopodos respondi per respondo. Por trovi la informojn, kiun uzanto serĉas, ciferecaj asistantoj kiel Alexa, Siri, babilrotoj kaj aliaj uzas specon de semantika serĉo.
Ĉi tiu funkcio povas esti trafita aŭ maltrafita, sed estas kreskanta nombro da uzoj por ĝi, kaj ilia efikeco rapide altiĝas.
Datuma Analitiko
Ĉi tio estas ĝenerala frazo por uzi algoritmojn por krei analizon el nestrukturitaj datumoj. Ĝi integras metodojn por montri ĉi tiujn datumojn kun la procezo de trovado kaj kolektado de trafaj datumoj.
Ĉi tio povus preni la formon de simpla statistika klarigo de la rezultoj aŭ vida reprezentado de la datenoj. Analizo de intereso kaj engaĝiĝo kun certa temo povas esti farita uzante informojn de YouTube-vidoj, inkluzive kiam spektantoj alklakas specifan videon.
La steltaksoj de produkto povas esti analizitaj uzante datumoj skrapadon de retkomercaj retejoj por provizi ĝeneralan poentaron pri kiom bone la produkto fartas.
Analizo de sentoj
Plue esplorante NER, sento-analizo povas distingi inter bonaj kaj malbonaj recenzoj eĉ en foresto de informoj de stelrangigoj.
Ĝi konscias, ke terminoj kiel "trotaksa", "fidly" kaj "stulta" havas negativajn implicojn, dum terminoj kiel "utila", "rapida" kaj "facila" faras. La vorto "facila" povus esti interpretita negative en komputila ludo.
Sofistikaj algoritmoj ankaŭ povas rekoni la rilaton inter aferoj.
Teksto-Analitiko
Simile al datuma analizo, teksta analizo ĉerpas informojn el nestrukturitaj tekstaj ĉenoj kaj uzas NER por nuligi la gravajn datumojn.
Ĝi povas esti uzata por kompili datumojn pri mencioj de produkto, averaĝa prezo aŭ la terminoj, kiujn klientoj plej ofte uzas por priskribi certan markon.
Analizo de Video Enhavo
La plej komplikaj sistemoj estas tiuj, kiuj ĉerpas datumojn el video-informoj per vizaĝrekono, sonanalizo kaj bildrekono.
Uzante videoenhavan analizon, vi povas trovi jutubajn videojn pri "malboksado", Twitch-ludaj pruvoj, lipaj sinkronigadoj de via sonmaterialo sur Reels, kaj pli.
Por eviti maltrafi gravajn informojn pri kiel homoj konektas al via produkto aŭ servo dum la volumeno de interreta videomaterialo kreskas, pli rapidaj kaj pli inventemaj teknikoj por NER-bazita videoenhava analizo estas esencaj.
Real-monda apliko de NER
Nomita ento-rekono (NER) identigas esencajn aspektojn en teksto kiel nomoj de homoj, lokoj, markoj, monaj valoroj, kaj pli.
Eltiri la ĉefajn entojn en teksto helpas ordigi nestrukturitajn datumojn kaj detekti signifajn informojn, kio estas kritika kiam oni traktas grandajn datumajn arojn.
Jen kelkaj fascinaj realmondaj ekzemploj de rekono de nomita ento:
Analizante Klienta Reago
Interretaj recenzoj estas bonega fonto de konsumantoj, ĉar ili povas provizi al vi detalajn informojn pri tio, kion klientoj ŝatas kaj malamas pri viaj varoj, kaj ankaŭ kiajn areojn de via kompanio devas esti plibonigitaj.
Ĉio ĉi tiu klienta enigo povas esti organizita per NER-sistemoj, kiuj ankaŭ povas identigi ripetiĝantajn problemojn.
Ekzemple, uzante NER por identigi lokojn, kiuj ofte estas cititaj en malfavoraj klientaj recenzoj, vi povas decidi koncentriĝi pri certa oficejo.
Rekomendo por enhavo
Listo de artikoloj ligitaj al tiu, kiun vi legas, troviĝas en retejoj kiel BBC kaj CNN kiam vi legas eron tie.
Ĉi tiuj retejoj faras rekomendojn por pliaj retejoj, kiuj ofertas informojn pri la estaĵoj, kiujn ili ĉerpis el la enhavo, kiun vi legas uzante NER.
Organizi Biletojn en Klienta Subteno
Vi povas uzi algoritmojn de rekono de nomita ento por respondi al klientpetoj pli rapide se vi administras pliigon de la nombro da subtenaj biletoj de klientoj.
Aŭtomatigi temporabajn klientprizorgajn taskojn, kiel klasifiki plendojn kaj demandojn de klientoj, por ŝpari al vi monon, pliigi klientan feliĉon kaj pliigi rezoluciajn indicojn.
Ent-ekstraktado ankaŭ povas esti uzata por ĉerpi trafajn datumojn, kiel produktnomojn aŭ seriajn numerojn, por plifaciligi sendi biletojn al la ĝusta agento aŭ teamo por solvi tiun problemon.
La serĉalgoritmo
Ĉu vi iam pridubis kiel retejoj kun milionoj da informoj povas produkti rezultojn taŭgajn por via serĉo? Konsideru la retejon Vikipedio.
Vikipedio montras paĝon enhavantan antaŭdifinitajn entojn al kiuj la serĉtermino povas rilati kiam vi serĉas "laborpostenojn", anstataŭ redoni ĉiujn artikolojn kun la vorto "laborpostenoj" en ili.
Tiel, Vikipedio ofertas ligilon al la artikolo kiu difinas "okupon", sekcion por homoj nomitaj Laborpostenoj, kaj alian areon por amaskomunikilaro kiel filmoj, Videoludoj, kaj aliaj formoj de distro kie la esprimo "laborpostenoj" aperas.
Vi ankaŭ vidus alian segmenton por lokoj enhavantaj la serĉvorton.
Prizorgante resumojn
Serĉante la idealan kandidaton, rekrutistoj pasigas gravan parton de sia tago reviziante vivresumojn. Ĉiu resumo havas la samajn informojn, sed ili ĉiuj estas prezentitaj kaj organizitaj malsame, kio estas tipa ekzemplo de nestrukturitaj datumoj.
La plej trafaj informoj pri kandidatoj povas esti rapide ĉerpitaj rekrutante teamojn uzantajn entajn eltirilojn, inkluzive de personaj datumoj (kiel nomo, adreso, telefonnumero, naskiĝdato kaj retpoŝto) kaj informoj pri ilia edukado kaj sperto (kiel atestadoj, grado. , kompaniaj nomoj, kapabloj, ktp).
E-komerco
Koncerne sian produktan serĉalgoritmon, interretaj podetalistoj kun centoj aŭ miloj da varoj profitus de NER.
Sen NER, serĉo pri "nigraj ledaj botoj" donus rezultojn, kiuj inkluzivis ambaŭ ledojn kaj piedvestojn, kiuj ne estis nigraj. Se jes, retkomercaj retejoj riskas perdi klientojn.
IEn nia kazo, NER klasifikus la serĉvorton kiel produktotipo por ledaj botoj kaj nigra kiel la koloro.
Plej bonaj Entity Extraction API-oj
Google Cloud NLP
Por jam trejnitaj iloj, Google Cloud NLP disponigas sian Natural Language API. Aŭ, la AutoML Natural Language API estas adaptebla por multaj specoj de teksto-ekstraktado kaj analizo se vi volas eduki viajn ilojn pri la terminologio de via industrio.
La API-oj interagas facile kun Gmail, Google Sheets kaj aliaj Google-aplikoj, sed uzi ilin kun triapartaj programoj povas bezoni pli kompleksan kodon.
La ideala komerca opcio estas konekti Google-aplikojn kaj Cloud Storage kiel administritajn servojn kaj API-ojn.
IBM-Vatsono
IBM Watson estas plurnuba platformo, kiu funkcias nekredeble rapide kaj disponigas antaŭkonstruitajn kapablojn, kiel parolado al teksto, kiu estas mirinda programaro, kiu povas aŭtomate analizi registritajn sonajn kaj telefonvokojn.
Kun la uzo de CSV-datumoj, la profunda lernado de AI de Watson Natural Language Understanding povas krei eltirajn modelojn por ĉerpi entojn aŭ ŝlosilvortojn.
Kaj kun praktiko, vi povas krei modelojn multe pli kompleksajn. Ĉiuj ĝiaj funkcioj estas alireblaj per APIoj, kvankam ampleksa kodiga scio estas necesa.
Ĝi funkcias bone por grandaj entreprenoj, kiuj postulas ekzameni enormajn datumajn arojn kaj havas internajn teknikajn rimedojn.
Kortikalo.io
Uzante Semantic Folding, nocion de neŭrologio, Cortical.io provizas teksto-eltiron kaj NLU-solvojn.
Ĉi tio estas farita por generi "semantikajn fingrospurojn", kiuj indikas kaj la signifon de teksto en ĝiaj tutaj kaj specifaj terminoj. Por montri la rilatojn inter vortgrupoj, semantikaj fingrospuroj prezentas tekstodatenojn.
La interaga API-dokumentado de Cortical.io kovras la funkciecon de ĉiu el la tekstaj analizsolvoj, kaj estas simple aliri uzante la APIojn de Java, Python kaj Javascript.
La Kontrakta Inteligenta ilo de Cortical.io estis kreita specife por jura analizo por fari semantikajn serĉojn, transformi skanitajn dokumentojn kaj helpi kaj plibonigi per komentario.
Ĝi estas ideala por entreprenoj serĉantaj simplajn uzeblajn API-ojn, kiuj ne bezonas sciojn pri AI, precipe en la jura sektoro.
Simio Lernu
Ĉiuj ĉefaj komputillingvoj estas subtenataj de la API-oj de MonkeyLearn kaj starigas nur kelkajn liniojn de kodo por produkti JSON-dosieron enhavantan viajn ĉerpitajn entojn. Por ekstraktiloj kaj tekstaj analizistoj kun antaŭa trejnado, la interfaco estas afabla.
Aŭ, en nur kelkaj simplaj paŝoj, vi povas krei unikan ĉerpilon. Por redukti tempon kaj plibonigi precizecon, altnivela naturlingva prilaborado (NLP) kun profunda maŝinlernado ebligas al vi taksi tekston kiel homo farus.
Krome, SaaS-API-oj certigas, ke agordo de konektoj kun iloj kiel Google Sheets, Excel, Zapier, Zendesk kaj aliaj ne postulas jarojn da komputika scio.
Nuntempe disponeblaj en via retumilo estas la eltilo de nomoj, eltilo de kompanio kaj eltirilo de loko. Por informoj pri kiel konstrui vian propran, vidu la blogartikolon pri nomita rekono de ento.
Ĝi estas ideala por entreprenoj de ĉiuj grandecoj implikitaj en teknologio, podetala komerco kaj elektronika komerco, kiuj bezonas simplajn efektivigeblajn API-ojn por diversaj specoj de teksto-eltiro kaj teksta analizo.
Amazon Comprehend
Por simpligi enŝalti kaj uzi la antaŭkonstruitajn ilojn de Amazon Comprehend tuj, ili estas trejnitaj en centoj da malsamaj kampoj.
Neniuj endomaj serviloj estas bezonataj ĉar ĉi tio estas monitorita servo. Precipe se vi nuntempe uzas la nubon de Amazon ĝis iu nivelo, iliaj API-oj facile integriĝas kun antaŭe ekzistantaj programoj. Kaj kun nur iom pli da trejnado, eltira precizeco povas esti pliigita.
Unu el la plej fidindaj tekstaj analizteknikoj por akiri datumojn de medicinaj registroj kaj klinikaj provoj estas Comprehend's Medical Named Entity and Relationship Extraction (NERe), kiu povas ĉerpi detalojn pri medikamentoj, kondiĉoj, testrezultoj kaj proceduroj.
Komparante pacientajn datumojn por taksi kaj agordi diagnozon, povas esti sufiĉe utila. La plej bona elekto por entreprenoj serĉantaj administritan servon kun antaŭtrejnitaj iloj.
Aylien
Por provizi facilan aliron al fortika maŝinlernada teksto-analizo, AYLIEN ofertas tri API-aldonaĵojn en sep popularaj programlingvoj.
Ilia Novaĵoj-API provizas realtempan serĉon kaj eltiron de entoj el dekoj de miloj da novaĵfontoj el la tuta mondo.
Enta eltiro kaj pluraj aliaj tekstaj analiztaskoj povas esti faritaj per la Teksta Analiza API en dokumentoj, sociaj rimedoj platformoj, enketoj pri konsumantoj kaj pli.
Fine, uzante la Tekstan Analizan Platformon, vi povas krei viajn proprajn eltirilojn kaj pli rekte en via retumilo (TAP). Ĝi funkcias bone por kompanioj, kiuj bezonas rapide integri ĉefe fiksitajn API-ojn.
SpaCy
SpaCy estas Python Natural Language Processing (NLP) pakaĵo kiu estas malfermfonta, senpaga, kaj havas multon da enkonstruitaj funkcioj.
Ĝi iĝas pli kaj pli ofta por NLP-datumoj prilaborado kaj analizo. Senstrukturaj tekstaj datumoj estas kreitaj en grandega skalo, tial estas grave analizi ĝin kaj eltiri komprenojn de ĝi.
Por plenumi tion, vi devas portreti la faktojn en maniero kiel komputiloj povas kompreni. Vi povas fari ĝin per NLP. Ĝi estas ekstreme rapida, kun malfruo de nur 30ms, sed kritike, ĝi ne estas destinita por uzado kun HTTPS-paĝoj.
Ĉi tio estas bela opcio por skani viajn proprajn servilojn aŭ intrareton ĉar ĝi funkcias loke, sed ĝi ne estas ilo por studi la tutan interreton.
konkludo
Nomita ento-rekono (NER) estas sistemo, kiun entreprenoj povas uzi por etikedi trafajn informojn en klientsubtenpetoj, trovi entojn referencitajn en klientreagoj kaj rapide ĉerpi decidajn datumojn kiel kontaktaj detaloj, lokoj kaj datoj, inter aliaj aferoj.
La plej ofta aliro al esti nomita enta rekono estas per uzado de entaj eltiraj APIoj (ĉu ili estas provizitaj de malfermfontaj bibliotekoj aŭ SaaS-produktoj).
Tamen, elekti la plej bonan alternativon dependos de via tempo, financo kaj lerteco. Por ajna speco de komerco, enta eltiro kaj pli altnivelaj tekstaj analizteknologioj povas klare esti avantaĝaj.
Kiam maŝinlernado iloj estas ĝuste instruitaj, ili estas precizaj kaj ne preteratentas ajnajn datumojn, ŝparante al vi tempon kaj monon. Vi povas agordi ĉi tiujn solvojn por funkcii senĉese kaj aŭtomate integrante APIojn.
Simple elektu la agadon, kiu plej taŭgas por via kompanio.
Lasi Respondon