Werrej[Aħbi][Uri]
Għandna l-abbiltà intrinsika li nagħrfu u nikklassifikaw il-kliem f’individwi, postijiet, postijiet, valuri, u aktar kull meta nisimgħuhom jew naqrawhom. Il-bnedmin huma kapaċi jikkategorizzaw, jidentifikaw, u jifhmu l-kliem malajr.
Pereżempju, tista’ tikkategorizza oġġett u malajr toħroġ b’mill-inqas tlieta sa erba’ kwalitajiet meta tisma’ l-isem “Steve Jobs,”
- Persuna: “Steve Jobs”
- Organizzazzjoni: "Apple"
- Post: "Kalifornja"
Peress li l- kompjuters m'għandhomx din il- ħila intrinsika, irridu ngħinuhom jagħrfu kliem jew test u jikklassifikawh. F'din is-sitwazzjoni tintuża r-Rikonoxximent tal-Entità msemmija (NER).
F'dan l-artikolu, se neżaminaw NER (Named Entity Recognition) fid-dettall, inklużi l-importanza tiegħu, il-benefiċċji, l-aqwa API NER, u ħafna aktar.
X'inhu NER (Named Entity Recognition)?
Approċċ tal-ipproċessar tal-lingwa naturali (NLP) magħruf bħala rikonoxximent tal-entità msemmija (NER), kultant magħruf bħala identifikazzjoni tal-entità jew estrazzjoni tal-entità, jirrikonoxxi awtomatikament entitajiet imsemmija f'test u jiġborhom f'kategoriji predeterminati.
L-entitajiet jinkludu ismijiet ta 'individwi, gruppi, postijiet, dati, ammonti, ammonti ta' dollari, persentaġġi, u aktar. B'rikonoxximent ta' entità msemmija, tista' jew tutilizzaha biex tiġbor dejta sinifikanti għal database jew biex tiġbed informazzjoni vitali biex tifhem x'inhu dokument.
NER hija l-pedament li fuqha tiddependi sistema AI sabiex tanalizza t-test għal semantika u sentiment relattiv, anke jekk NLP jirrappreżenta avvanz sinifikanti fil-proċess tal-analiżi tat-test.
X'inhu s-sinifikat tan-NER?
Il-pedament ta' approċċ analitiku tat-test huwa NER. Mudell ML għandu inizjalment jingħata miljuni ta' kampjuni b'kategoriji definiti minn qabel qabel ma jkun jista' jifhem l-Ingliż.
L-API titjieb maż-żmien meta tagħraf dawn il-komponenti fit-testi li qed taqra għall-ewwel darba. Il-qawwa tal-magna tal-analiżi tat-test tiżdied mal-kompetenza u s-saħħa tal-kapaċità NER.
Kif jidher hawn, diversi operazzjonijiet ML huma attivati minn NER.
Tiftix Semantiku
It-tfittxija semantika issa hija disponibbli fuq Google. Tista' ddaħħal mistoqsija, u tagħmel l-almu tagħha biex twieġeb bi tweġiba. Sabiex issib l-informazzjoni, utent qed ifittex, assistenti diġitali bħal Alexa, Siri, chatbots, u oħrajn jimpjegaw tip ta 'tfittxija semantika.
Din il-funzjoni tista 'tintlaqat jew tintilef, iżda hemm numru dejjem jikber ta' użi għaliha, u l-effettività tagħhom qed tiżdied b'rata mgħaġġla.
Analitika tad-Dejta
Din hija frażi ġenerali għall-użu ta 'algoritmi biex tinħoloq analiżi minn data mhux strutturata. Tintegra metodi għall-wiri ta' din id-dejta mal-proċess tas-sejba u l-ġbir tad-dejta pertinenti.
Dan jista' jieħu l-forma ta' spjegazzjoni statistika sempliċi tar-riżultati jew rappreżentazzjoni viżwali tad-dejta. Analiżi tal-interess u l-impenn ma' ċertu suġġett tista' ssir bl-użu ta' informazzjoni minn fehmiet ta' YouTube, inkluż meta t-telespettaturi jikklikkjaw vidjo speċifiku.
Il-klassifikazzjonijiet tal-istilla ta 'prodott jistgħu jiġu analizzati bl-użu ta' scraping tad-dejta minn siti tal-kummerċ elettroniku biex jipprovdi punteġġ ġenerali ta 'kemm il-prodott sejjer tajjeb.
Analiżi tas-Sentimenti
Tesplora aktar in-NER, analiżi ta 'sentiment jista 'jiddistingwi bejn reviżjonijiet tajbin u ħżiena anke fin-nuqqas ta' informazzjoni mill-klassifikazzjonijiet tal-istilel.
Huwa konxju li termini bħal "iżżejjed," "fiddly," u "stupid" għandhom konnotazzjonijiet negattivi, filwaqt li termini bħal "utli", "malajr" u "faċli" għandhom. Il-kelma "faċli" tista' tiġi interpretata b'mod negattiv f'logħba tal-kompjuter.
Algoritmi sofistikati jistgħu wkoll jirrikonoxxu r-relazzjoni bejn l-affarijiet.
Analitiċi tat-Test
Simili għall-analitika tad-dejta, l-analiżi tat-test estratti informazzjoni minn kordi tat-test mhux strutturati u tuża NER biex tikser id-dejta importanti.
Jista 'jintuża biex tiġbor data dwar issemmi prodott, prezz medju, jew it-termini li l-klijenti jużaw l-aktar spiss biex jiddeskrivu ċertu marka.
Analiżi tal-Kontenut tal-Vidjo
Is-sistemi l-aktar ikkumplikati huma dawk li jiġbdu d-dejta minn informazzjoni tal-vidjo billi jużaw ir-rikonoxximent tal-wiċċ, l-analiżi tal-awdjo u r-rikonoxximent tal-istampi.
Bl-użu tal-analiżi tal-kontenut tal-vidjo, tista’ ssib vidjows ta’ “unboxing” ta’ YouTube, wirjiet tal-logħob Twitch, sinkronizzazzjoni tax-xufftejn tal-materjal awdjo tiegħek fuq ir-Rukkelli, u aktar.
Sabiex tevita li titlef informazzjoni importanti dwar kif in-nies jikkonnettjaw mal-prodott jew is-servizz tiegħek hekk kif il-volum tal-materjal tal-vidjow onlajn jikber, tekniki aktar mgħaġġla u aktar inventivi għall-analiżi tal-kontenut tal-vidjow ibbażat fuq NER huma essenzjali.
Applikazzjoni tad-dinja reali tan-NER
Ir-rikonoxximent tal-entità msemmija (NER) jidentifika aspetti essenzjali f'test bħal ismijiet ta' nies, postijiet, marki, valuri monetarji, u aktar.
L-estrazzjoni tal-entitajiet ewlenin f'test tgħin fl-issortjar tad-dejta mhux strutturata u l-iskoperta ta 'informazzjoni sinifikanti, li hija kritika meta jiġu ttrattati settijiet ta' dejta kbar.
Hawn huma xi eżempji affaxxinanti fid-dinja reali ta’ rikonoxximent ta’ entità msemmija:
L-analiżi tal-Feedback tal-Klijent
Ir-reviżjonijiet onlajn huma sors meraviljuż ta’ feedback tal-konsumatur peress li jistgħu jagħtuk informazzjoni dettaljata dwar dak li jħobbu u li jobogħdu l-klijenti dwar l-oġġetti tiegħek kif ukoll liema oqsma tal-kumpanija tiegħek jeħtieġ li jittejbu.
Dan l-input kollu tal-klijent jista 'jiġi organizzat bl-użu ta' sistemi NER, li jistgħu wkoll jidentifikaw kwistjonijiet li jerġgħu jseħħu.
Pereżempju, billi tuża NER biex tidentifika postijiet li spiss jiġu kkwotati f'reviżjonijiet mhux favorevoli tal-klijenti, tista 'tiddeċiedi li tikkonċentra fuq ċertu fergħa tal-uffiċċju.
Rakkomandazzjoni għall-kontenut
Lista ta 'artikli li huma konnessi ma' dak li qed taqra tista 'tinstab fuq websajts bħal BBC u CNN meta taqra oġġett hemmhekk.
Dawn il-websajts jagħmlu rakkomandazzjonijiet għal websajts addizzjonali li joffru informazzjoni dwar l-entitajiet li jkunu estratt mill-kontenut li qed taqra bl-użu tan-NER.
Organizza Biljetti fl-Appoġġ għall-Klijent
Tista' tuża algoritmi ta' rikonoxximent ta' entità msemmija biex twieġeb għat-talbiet tal-klijenti aktar malajr jekk tkun qed timmaniġġja żieda fin-numru ta' biljetti ta' appoġġ mill-klijenti.
Awtomatizza l-ħidmiet tal-kura tal-klijenti li jieħdu ħafna ħin, bħall-klassifikazzjoni tal-ilmenti u l-mistoqsijiet tal-klijenti, biex tiffranka l-flus lilek innifsek, iżżid il-kuntentizza tal-klijenti u żżid ir-rati ta 'riżoluzzjoni.
L-estrazzjoni tal-entità tista 'tintuża wkoll biex tiġi estratta dejta pertinenti, bħal ismijiet ta' prodotti jew numri tas-serje, biex tagħmilha aktar sempliċi li jintbagħtu biljetti lill-aġent jew tim it-tajjeb biex issolvi dik il-kwistjoni.
L-algoritmu tat-tfittxija
Qatt staqsejt kif websajts b'miljuni ta' biċċiet ta' informazzjoni jistgħu jipproduċu riżultati li huma pertinenti għat-tfittxija tiegħek? Ikkunsidra l-websajt Wikipedija.
Il-Wikipedija turi paġna li fiha entitajiet predefiniti li t-terminu tat-tfittxija jista’ jirrelata magħhom meta tfittex “impjiegi,” minflok ma tirritorna l-artikoli kollha bil-kelma “impjiegi” fihom.
Għalhekk, il-Wikipedija toffri link għall-artiklu li jiddefinixxi “okkupazzjoni,” taqsima għan-nies bl-isem ta’ Impjiegi, u qasam ieħor għall-midja bħall-films, video games, u forom oħra ta’ divertiment fejn jidher it-terminu “impjiegi”.
Int tara wkoll segment ieħor għal postijiet li fihom il-kelma tat-tfittxija.
Jieħdu ħsieb jerġa 'jibda
Fit-tfittxija tal-applikant ideali, ir-reklutaturi jqattgħu porzjon sinifikanti tal-ġurnata tagħhom jirrevedu l-bidu. Kull curriculum għandu l-istess informazzjoni, iżda kollha huma ppreżentati u organizzati b'mod differenti, li huwa eżempju tipiku ta' data mhux strutturata.
L-aktar informazzjoni pertinenti dwar il-kandidati tista’ tiġi estratta malajr billi tirrekluta timijiet li jużaw estratturi ta’ entitajiet, inkluża data personali (bħal isem, indirizz, numru tat-telefon, data tat-twelid, u email) u informazzjoni dwar l-edukazzjoni u l-esperjenza tagħhom (bħal ċertifikazzjonijiet, grad , ismijiet tal-kumpaniji, ħiliet, eċċ).
E-commerce
Rigward l-algoritmu ta’ tfittxija tal-prodott tagħhom, il-bejjiegħa bl-imnut onlajn b’mijiet jew eluf ta’ oġġetti jibbenefikaw minn NER.
Mingħajr NER, tfittxija għal "stivali tal-ġilda sewda" tirritorna riżultati li kienu jinkludu kemm ġilda kif ukoll xedd tas-saqajn li ma kinux iswed. Jekk iva, il-websajts tal-kummerċ elettroniku jirriskjaw li jitilfu l-klijenti.
Ifil-każ tagħna, NER jikkategorizza l-kelma ta 'tfittxija bħala tip ta' prodott għall-istivali tal-ġilda u iswed bħala l-kulur.
L-Aħjar APIs ta' Estrazzjoni ta' Entitajiet
Google Cloud NLP
Għal għodod diġà mħarrġa, Google Cloud NLP jipprovdi l-API tal-Lingwa Naturali tiegħu. Jew, l-API tal-Lingwa Naturali AutoML hija adattabbli għal ħafna tipi ta 'estrazzjoni u analiżi tat-test jekk trid teduka l-għodod tiegħek dwar it-terminoloġija tal-industrija tiegħek.
L-APIs jinteraġixxu faċilment ma' Gmail, Google Sheets, u apps oħra ta' Google, iżda l-użu tagħhom ma' programmi ta' partijiet terzi jista' jeħtieġ kodiċi aktar kumpless.
L-għażla tan-negozju ideali hija li tgħaqqad l-applikazzjonijiet tal-Google u Cloud Storage bħala servizzi ġestiti u APIs.
IBM Watson
IBM Watson hija pjattaforma multi-cloud li taħdem b'mod oerhört malajr u tipprovdi kapaċitajiet mibnija minn qabel, bħal diskors għal test, li huwa softwer tal-għaġeb li jista' janalizza awtomatikament awdjo u telefonati rreġistrati.
Bl-użu ta 'dejta CSV, l-AI ta' tagħlim profond ta 'Watson Natural Language Understanding tista' toħloq mudelli ta 'estrazzjoni biex jiġu estratti entitajiet jew kliem ewlieni.
U bil-prattika, tista 'toħloq mudelli li huma ferm aktar sofistikati. Il-funzjonalitajiet kollha tagħha huma aċċessibbli permezz tal-APIs, għalkemm huwa meħtieġ għarfien estensiv tal-kodifikazzjoni.
Taħdem tajjeb għal negozji kbar li jeħtieġu li jeżaminaw settijiet ta 'dejta enormi u għandhom riżorsi tekniċi interni.
Cortical.io
Bl-użu Semantic Folding, kunċett min-newroloġija, Cortical.io jipprovdi estrazzjoni tat-test u soluzzjonijiet NLU.
Dan isir biex jiġġeneraw "marki tas-swaba' semantiċi," li jindikaw kemm it-tifsira ta 'test fit-termini kollha tiegħu kif ukoll speċifiċi. Sabiex jintwerew ir-relazzjonijiet bejn il-clusters tal-kliem, il-marki tas-swaba' semantiċi juru data tat-test.
Id-dokumentazzjoni interattiva tal-API ta 'Cortical.io tkopri l-funzjonalità ta' kull waħda mis-soluzzjonijiet tal-analiżi tat-test, u huwa sempliċi biex taċċessaha billi tuża l-APIs Java, Python u Javascript.
L-għodda tal-Intelliġenza tal-Kuntratti minn Cortical.io inħolqot speċifikament għall-analiżi legali biex tagħmel tfittxijiet semantiċi, tittrasforma dokumenti skennjati, u tgħin u ttejjeb bl-annotazzjoni.
Hija ideali għan-negozji li qed ifittxu APIs sempliċi biex jintużaw li m'għandhomx bżonn għarfien tal-AI, partikolarment fis-settur legali.
Monkey Tgħallem
Il-lingwi ewlenin kollha tal-kompjuter huma appoġġjati mill-APIs ta 'MonkeyLearn u jistabbilixxu sempliċement ftit linji ta' kodiċi biss biex jipproduċu fajl JSON li jkun fih l-entitajiet estratti tiegħek. Għal estratturi u analisti tat-test b'taħriġ minn qabel, l-interface huwa faċli għall-utent.
Jew, fi ftit passi sempliċi, tista 'toħloq estrattur uniku. Biex tnaqqas il-ħin u ttejjeb l-eżattezza, ipproċessar avvanzat tal-lingwa naturali (NLP) bil-fond tagħlim magna jippermettilek tevalwa t-test kif tagħmel persuna.
Barra minn hekk, l-APIs SaaS jiżguraw li t-twaqqif ta’ konnessjonijiet ma’ għodod bħal Google Sheets, Excel, Zapier, Zendesk, u oħrajn ma jeħtieġx snin ta’ għarfien tax-xjenza tal-kompjuter.
Bħalissa disponibbli fil-browser tiegħek huma l-estrattur tal-isem, l-estrattur tal-kumpanija, u l-estrattur tal-post. Għal informazzjoni dwar kif tibni tiegħek, ara l-artiklu tal-blog dwar ir-rikonoxximent tal-entità msemmija.
Huwa ideali għal negozji ta 'kull daqs involuti fit-teknoloġija, il-bejgħ bl-imnut u l-kummerċ elettroniku li jeħtieġu APIs sempliċi biex jiġu implimentati għal diversi tipi ta' estrazzjoni ta 'test u analiżi tat-test.
Amazon Comprehend
Sabiex tagħmilha sempliċi biex timla u tuża l-għodod mibnija minn qabel ta 'Amazon Comprehend immedjatament, huma mħarrġa f'mijiet ta' oqsma differenti.
L-ebda servers interni huma meħtieġa minħabba li dan huwa servizz sorveljat. Partikolarment jekk bħalissa tagħmel użu mill-cloud ta 'Amazon sa ċertu livell, l-APIs tagħhom jintegraw faċilment ma' apps li kienu jeżistu qabel. U bi ftit aktar taħriġ, l-eżattezza tal-estrazzjoni tista 'titqajjem.
Waħda mit-tekniki ta' analiżi tat-test l-aktar affidabbli biex tinkiseb data minn rekords mediċi u provi kliniċi hija l-Entità Medika Isimha u l-Estrazzjoni ta' Relazzjoni (NERe) ta' Comprehend, li tista' tiġbed dettalji dwar mediċini, kundizzjonijiet, riżultati tat-testijiet u proċeduri.
Meta tqabbel id-dejta tal-pazjent biex tiġi vvalutata u rfinata d-dijanjosi, jista 'jkun pjuttost ta' benefiċċju. L-aħjar għażla għan-negozji li qed ifittxu servizz ġestit b'għodod imħarrġa minn qabel.
Aylien
Sabiex jipprovdi aċċess faċli għal analiżi robusta tat-test tat-tagħlim tal-magni, AYLIEN joffri tliet plug-ins tal-API f'seba' lingwi ta' programmar popolari.
L-API tal-Aħbarijiet tagħhom tipprovdi tfittxija f'ħin reali u estrazzjoni ta' entitajiet minn għexieren ta' eluf ta' sorsi ta' aħbarijiet minn madwar id-dinja.
L-estrazzjoni tal-entità u bosta kompiti oħra tal-analiżi tat-test jistgħu jitwettqu bl-użu tal-API tal-Analiżi tat-Test fuq id-dokumenti, midja soċjali pjattaformi, stħarriġ tal-konsumaturi, u aktar.
Fl-aħħarnett, billi tuża l-Pjattaforma tal-Analiżi tat-Test, tista 'toħloq l-estratturi tiegħek stess u aktar dritta fil-browser tiegħek (TAP). Taħdem tajjeb għall-kumpaniji li għandhom bżonn jintegraw APIs primarjament fissi malajr.
SpaCy
SpaCy huwa pakkett ta 'Python Natural Language Processing (NLP) li huwa open-source, b'xejn, u għandu ton ta' karatteristiċi integrati.
Qed isir aktar u aktar komuni għal Dejta NLP ipproċessar u analiżi. Data testwali mhux strutturata tinħoloq fuq skala enormi, għalhekk huwa kruċjali li tiġi analizzata u estratta għarfien minnha.
Biex twettaq dan, trid turi l-fatti b'mod li l-kompjuters jistgħu jifhmu. Tista 'tagħmel dan permezz tal-NLP. Huwa estremament rapidu, b'dewmien ta '30ms biss, iżda b'mod kritiku, mhuwiex maħsub għall-użu ma' paġni HTTPS.
Din hija għażla sabiħa biex tiskennja s-servers jew l-intranet tiegħek stess għaliex topera lokalment, iżda mhix għodda biex tistudja l-internet kollu.
konklużjoni
Ir-rikonoxximent tal-entità msemmija (NER) hija sistema li n-negozji jistgħu jużaw biex jittikkettaw informazzjoni pertinenti fit-talbiet għall-appoġġ tal-klijenti, isibu entitajiet referenzjati fir-rispons tal-klijenti, u malajr estratt dejta kruċjali bħal dettalji ta’ kuntatt, postijiet, u dati, fost affarijiet oħra.
L-aktar approċċ komuni biex tissemma rikonoxximent tal-entità huwa permezz tal-użu tal-APIs tal-estrazzjoni tal-entità (kemm jekk huma pprovduti minn libreriji open-source jew prodotti SaaS).
Madankollu, l-għażla tal-aħjar alternattiva ser tiddependi fuq il-ħin, il-finanzi u s-sett ta 'ħiliet tiegħek. Għal kull tip ta 'negozju, estrazzjoni ta' entità u teknoloġiji ta 'analiżi tat-test aktar sofistikati jistgħu b'mod ċar ikunu ta' vantaġġ.
Meta l-għodod tat-tagħlim tal-magni jiġu mgħallma b'mod korrett, huma preċiżi u ma jinjoraw l-ebda dejta, u b'hekk jiffrankaw il-ħin u l-flus. Tista' tikkonfigura dawn is-soluzzjonijiet biex jaħdmu kontinwament u awtomatikament billi tintegra l-APIs.
Sempliċement agħżel il-kors ta' azzjoni li huwa l-aħjar għall-kumpanija tiegħek.
Ħalli Irrispondi