Naskirina Entity Named (NER) - Têgeh, Serlêdan & API

Kengî em wan dibihîzin an dixwînin, şiyana me ya xwezayî heye ku em peyvan li kesan, cîh, cih, nirx û hêj bêtir nas bikin û dabeş bikin. Mirov dikare peyvan zû kategorîze bike, nas bike û têbigihîje.

Mînakî, dema ku hûn navê "Steve Jobs" dibihîzin, hûn dikarin tiştekê kategorîze bikin û zû bi kêmanî sê-çar taybetmendiyan derxînin holê.

Kes: "Steve Jobs"

Rêxistin: "Apple"

Cih: "California"

Ji ber ku komputer ji vê jêhatiya xwezayê kêm in, divê em di naskirina peyvan an nivîsê û dabeşkirina wan de alîkariya wan bikin. Di vê rewşê de Naskirina Entity Named (NER) tê bikar anîn.

Di vê gotarê de, em ê NER (Naskirina Entity Named) bi hûrgulî lêkolîn bikin, di nav de girîngiya wê, feyde, NER API-yên top, û hêj bêtir.

NER (Naskirina Entîteya Navdar) çi ye?

Nêzîkatiyek pêvajoyek zimanî ya xwezayî (NLP) ku wekî nasîna sazûmanek binavkirî (NER) tê zanîn, carinan wekî nasnameya sazûman an derxistina yekîtiyê tê zanîn, bixweber saziyên navkirî di nivîsekê de nas dike û wan di kategoriyên pêşwext de kom dike.

Saziyan navên kesan, koman, cihan, tarîx, mîqdar, mîqdarên dolar, sedî, û hêj bêtir vedigirin. Bi naskirina saziyek binavkirî, hûn dikarin wê bikar bînin da ku daneyên girîng ji bo databasek berhev bikin an jî agahdariya girîng derxînin da ku hûn fam bikin ka belgeyek li ser çi ye.

NER kevirê bingehîn e ku pergalek AI-ê pê ve girêdayî ye da ku nivîsê ji bo semantîk û hestê têkildar analîz bike, tewra ku NLP di pêvajoya analîza nivîsê de pêşkeftinek girîng temsîl dike.

Girîngiya NER çi ye?

Bingeha nêzîkatiya analîtîka nivîsê NER e. Pêdivî ye ku modelek ML-ê di destpêkê de bi mîlyonan nimûneyên bi kategoriyên pêşwextkirî ve were dayîn berî ku ew Englishngilîzî fam bike.

API bi demê re di naskirina van hêmanan de di metnên ku ew yekem car dixwîne de çêtir dibe. Hêza motora analîtîka nivîsê bi jêhatîbûn û hêza kapasîteya NER re zêde dibe.

Wekî ku li vir tê dîtin, gelek operasyonên ML-ê ji hêla NER ve têne rêve kirin.

Lêgerîna Semantîk

Lêgerîna semantîk niha li Google heye. Hûn dikarin pirsek têkevin, û ew ê herî baş hewl bide ku bi bersivek bersiv bide. Ji bo ku agahiyê bibîne, bikarhênerek lê digere, arîkarên dîjîtal ên mîna Alexa, Siri, chatbots, û yên din celebek lêgerîna semantîk bikar tînin.

Ev fonksiyon dikare were lêdan an jî winda bibe, lê hejmarek zêde karanîna wê hene, û bandora wan bi lez zêde dibe.

Agahiyên Agahdariyê

Ev hevokek gelemperî ye ji bo karanîna algorîtmayan ji bo afirandina analîzê ji daneyên nesazkirî. Ew rêbazên ji bo nîşandana van daneyan bi pêvajoya dîtin û berhevkirina daneyên têkildar re yek dike.

Ev dibe ku forma ravekek statîstîkî ya rasterast a encaman an nûneriyek dîtbar a daneyan bigire. Analîzkirina berjewendiyê û tevlêbûna bi mijarek diyarkirî re dikare bi karanîna agahdariya ji dîtinên YouTube-ê were kirin, tevî dema ku temaşevan vîdyoyek taybetî bikirtînin.

Nirxên stêrkek hilberek dikare bi karanîna daneya ji malperên e-bazirganiyê ve were analîz kirin da ku encamek giştî peyda bike ka hilber çiqas baş dike.

Analysis Sentiment

Zêdetir lêkolîna NER, analîzê dikare di nebûna agahdariya ji rêzikên stêrkan de jî nirxandinên baş û xirab ji hev cuda bike.

Tê zanîn ku têgînên wekî "zêde nirxandin", "bêhiş" û "bêaqil" xwedî wateyên neyînî ne, lê têgînên wekî "bikêr", "zû" û "hêsan" hene. Peyva "hêsan" dikare di lîstikek komputerê de neyînî were şîrove kirin.

Algorîtmayên sofîstîke jî dikarin têkiliya di navbera tiştan de nas bikin.

Analytics Nivîsar

Mîna analîtîka daneyê, analîza nivîsê agahdariya ji rêzikên nivîsê yên nesazkirî derdixe û NER bikar tîne da ku daneyên girîng sifir bike.

Ew dikare ji bo berhevkirina daneyan li ser behsên hilberek, bihayê navîn, an şertên ku xerîdar bi gelemperî ji bo danasîna marqeyek diyar bikar tînin bikar bînin.

Analîza Naveroka Vîdyoyê

Pergalên herî tevlihev ew in ku daneyan ji agahdariya vîdyoyê bi karanîna nasîna rû, analîza deng, û naskirina wêneyê derdixin.

Bi karanîna analîza naveroka vîdyoyê, hûn dikarin vîdyoyên "nequtkirin" yên YouTube, xwenîşandanên lîstika Twitch, senkronîzekirina lêvên materyalê xweya dengî li ser Reels û hêj bêtir bibînin.

Ji bo ku hûn agahdariya girîng winda nekin ka meriv çawa bi hilber an karûbarê we ve girêdayî ye her ku hêjmara vîdyoya serhêl mezin dibe, teknîkên zûtir û dahênertir ji bo analîza naveroka vîdyoyê ya NER-ê pêdivî ye.

Serlêdana cîhana rastîn a NER

Naskirina saziya binavkirî (NER) di metnekê de aliyên bingehîn ên wekî navên mirovan, cîh, marqe, nirxên diravî, û hêj bêtir nas dike.

Derxistina pêkhateyên sereke di nivîsekê de di veqetandina daneyên nesazkirî û tespîtkirina agahdariya girîng de dibe alîkar, ku dema ku bi danehevên mezin re mijûl dibe pir girîng e.

Li vir çend mînakên balkêş ên cîhana rastîn ên naskirina sazûmana binavkirî hene:

Analîzkirina Bersivên Xerîdar

Nirxên serhêl çavkaniyek fantastîk a bertekên xerîdar in ji ber ku ew dikarin agahdariya hûrgulî li ser tiştên ku xerîdar ji tiştên we hez dikin û nefret dikin û her weha kîjan deverên pargîdaniya we hewce ne ku werin başkirin ji we re peyda bikin.

Hemî vê têketina xerîdar dikare bi karanîna pergalên NER-ê were organîze kirin, ku di heman demê de dikare pirsgirêkên dubare nas bike.

Mînakî, bi karanîna NER-ê ji bo destnîşankirina cihên ku bi gelemperî di nirxandinên xerîdar ên nebaş de têne destnîşan kirin, hûn dikarin biryar bidin ku hûn li ser şaxek nivîsgehê hûr bibin.

Pêşniyar ji bo naverokê

Lîsteya gotarên ku bi ya ku hûn dixwînin ve girêdayî ne, dikarin li ser malperên mîna BBC û CNN-ê werin dîtin dema ku hûn li wir babetekê bixwînin.

Van malper ji bo malperên din ên ku agahdariya li ser saziyên ku wan ji naveroka ku hûn bi karanîna NER-ê dixwînin derxistine, pêşniyar dikin.

Di Piştgiriya Xerîdar de Bilêtan organîze bikin

Heke hûn zêdebûna hejmara bilêtên piştgiriyê ji xerîdaran re rêve dibin, hûn dikarin algorîtmayên nasîna sazûmanên binavkirî bikar bînin da ku zûtir bersivê bidin daxwazên xerîdar.

Karên lênihêrîna xerîdar ên dem-dixwe, wek dabeşkirina gilî û lêpirsînên xerîdar, otomat bikin, da ku drav bidin xwe, dilxweşiya xerîdar zêde bikin, û rêjeyên çareseriyê zêde bikin.

Di heman demê de derxistina sazûman dikare were bikar anîn da ku daneyên têkildar, wek navên hilber an hejmarên serial derxîne, da ku ji bo çareserkirina wê pirsgirêkê rêgirtina bilêtan ji nûner an tîmê rast re hêsantir bike.

Algorîtmaya lêgerînê

Ma we qet pirs kiriye ka malperên bi mîlyonan agahdarî çawa dikarin encamên ku ji lêgerîna we re têkildar in çêbikin? Malpera Wîkîpediyayê bifikirin.

Wîkîpediya di şûna ku hemû gotarên ku peyva "kar" di wan de ye vegerîne, rûpelek ku tê de hebûnên pêşwextkirî hene ku peyva lêgerînê dikare pê re têkildar be dema ku hûn li "kar" digerin nîşan dide.

Ji ber vê yekê, Wikipedia lînka gotara ku "dagirkerî" pênase dike, beşek ji bo kesên bi navê Jobs, û deverek din ji bo medyayê wekî fîlim pêşkêşî dike. video games, û awayên din ên şahiyê ku têgeha "kar" tê de xuya dike.

Her weha hûn ê ji bo cîhên ku peyva lêgerînê tê de beşek din bibînin.

Lênêrîna resumes

Di lêgerîna serlêderê îdeal de, peywirdar beşek girîng a roja xwe li ser vekolînên xwe derbas dikin. Her résumé xwedî heman agahdarî ye, lê ew hemî bi rengek cûda têne pêşkêş kirin û organîze kirin, ku ev mînakek tîpîk a daneyên nesazkirî ye.

Agahiyên herî guncav ên di derbarê berendaman de dikarin bi lez û bez ji hêla jimartina tîmên ku ji derhênerên saziyê bikar tînin ve werin derxistin, tevî daneyên kesane (wekî nav, navnîşan, jimareya têlefonê, roja jidayikbûnê, û e-name) û agahdariya di derbarê perwerdehî û ezmûna wan de (wek sertîfîka, destûr , navên pargîdanî, jêhatîbûn, hwd.).

E-commerce

Di derbarê algorîtmaya lêgerîna hilbera xwe de, firotgehên serhêl ên bi sedan an hezaran tiştan dê ji NER sûd werbigirin.

Bêyî NER, lêgerîna li "bootên çermê reş" dê encamên ku hem çerm û hem jî pêlavên ku ne reş bûn vedigire. Ger wusa be, malperên e-bazirganî rîska windakirina xerîdaran dikin.

IDi doza me de, NER dê peyva lêgerînê wekî celebek hilberek ji bo pêlavên çerm û reş wekî rengê kategorîze bike.

API-yên derxistina Entity çêtirîn

Google Cloud NLP

Ji bo amûrên ku berê hatine perwerde kirin, Google Cloud NLP API-ya xweya Zimanê xwezayî peyda dike. An jî, heke hûn dixwazin amûrên xwe li ser termînolojiya pîşesaziya xwe perwerde bikin, API-ya Zimanê Xwezayî ya AutoML ji bo gelek celeb derxistin û analîzkirina nivîsê ve adapte ye.

Google Cloud NLP

API bi Gmail, Google Sheets, û serîlêdanên din ên Google re bi hêsanî têkilî daynin, lê karanîna wan bi bernameyên sêyemîn re dikare hewceyê kodek tevlihevtir be.

Vebijarka karsaziya îdeal ev e ku meriv serîlêdanên Google û Cloud Storage wekî karûbar û API-yên rêvekirî ve girêbide.

IBM Watson

IBM Watson platformek pir-ewra ye ku pir zû performans dike û kapasîteyên pêş-avakirî peyda dike, wek axaftin-nivîs-text, ku nermalava ecêb e ku dikare bixweber bangên deng û têlefonê yên tomarkirî analîz bike.

Bi karanîna daneyên CSV, AI-ya fêrbûna kûr a Watson Natural Language Understanding dikare modelên derxistinê biafirîne da ku sazî an peyvan derxîne.

IBM Watson

Û bi pratîkê, hûn dikarin modelên ku pir sofîstîke ne biafirînin. Hemî fonksiyonên wê bi navgîniya API-yê têne gihîştin, her çend zanîna kodkirina berfireh hewce ye.

Ew ji bo karsaziyên mezin ên ku hewce ne ku daneyên pir mezin lêkolîn bikin û xwedan çavkaniyên teknîkî yên hundurîn baş dixebite.

Cortical.io

Bi karanîna Folding Semantic, têgehek ji neurolojiyê, Cortical.io derxistina nivîsê û çareseriyên NLU peyda dike.

Ev tê kirin ku "şopên tiliyên semantîk" çêbike, ku hem wateya nivîsê bi tevahî hem jî bi şertên taybetî destnîşan dike. Ji bo ku têkiliyên di navbera komikên peyvan de nîşan bidin, şopên tiliyên semantîk daneyên nivîsê diyar dikin.

Belgekirina API-ya înteraktîf a Cortical.io fonksiyona her yek ji çareseriyên analîzkirina nivîsê vedigire, û bi karanîna API-ên Java, Python û Javascript hêsan e ku meriv bigihîje.

Cortical.io

Amûra Agahdariya Peymana ji Cortical.io bi taybetî ji bo analîzên dadrêsî hate afirandin ku lêgerînên semantîk bike, belgeyên şehkirî veguherîne, û bi şîrovekirinê re bibe alîkar û zêde bike.

Ew îdeal e ji bo karsaziyên ku li API-yên hêsan-a-kar-kar digerin ku hewceyê zanîna AI-yê ne, nemaze di sektora dadrêsî de.

Monkey Learn

Hemî zimanên sereke yên kompîturê ji hêla API-yên MonkeyLearn ve têne piştgirî kirin û tenê çend rêzikên kodê saz dikin da ku pelek JSON-ê ku tê de hebûnên weyên derxistine çêbike. Ji bo derxistin û analîstên nivîsê yên bi perwerdehiya berê re, navbeynkar-dostane ye.

An jî, tenê di çend gavên hêsan de, hûn dikarin derxistinek bêhempa biafirînin. Ji bo kêmkirina dem û baştirkirina rastbûnê, pêvajoyek zimanê xwezayî ya pêşkeftî (NLP) bi kûr fêrbûna makîneyê dihêle hûn nivîsê wekî kesek binirxînin.

Monkey Learn

Wekî din, API-yên SaaS piştrast dikin ku sazkirina pêwendiyan bi amûrên mîna Google Sheets, Excel, Zapier, Zendesk, û yên din re bi salan zanîna zanistiya komputerê hewce nake.

Naha di geroka we de berdest in, jêderkerê nav, derxistina pargîdanî, û derxistina cîhê. Ji bo agahdariya li ser ka meriv çawa xweya xwe ava dike, li gotara blogê ya nasîna sazûmaniya binavkirî binêre.

Ew ji bo karsaziyên her mezinahiyê yên ku di teknolojiyê, firotgeh û e-bazirganiya elektronîkî de têkildar in ku ji bo cûrbecûr derxistina nivîsê û analîzkirina nivîsê hewceyê API-yên hêsan-pêkandar in îdeal e.

Amazon Comprehend

Ji bo ku meriv pêvekirin û karanîna amûrên pêş-avakirî yên Amazon Comprehend tavilê hêsan bike, ew di bi sedan warên cihêreng de têne perwerde kirin.

No serverên hundurîn hewce ne ji ber ku ev karûbarek çavdêrîkirî ye. Bi taybetî jî heke hûn niha ewrê Amazon-ê heya astekê bikar tînin, API-yên wan bi hêsanî bi sepanên berê-heyî re yek dibin. Û bi tenê perwerdehiyek piçûktir, rastbûna derxistinê dikare were bilind kirin.

Amazon Comprehend

Yek ji teknîkên analîzkirina nivîsê ya herî pêbawer ji bo bidestxistina daneyan ji tomarên bijîjkî û ceribandinên klînîkî Comprehend's Medical Named Entity and Relationship Extraction (NERe) ye, ku dikare hûrguliyên li ser derman, şert, encamên testê û proseduran derxe.

Dema ku daneyên nexweşan ji bo nirxandin û rastkirina teşhîs berhev dikin, dikare pir bikêr be. Vebijarka çêtirîn ji bo karsaziyên ku bi amûrên pêş-perwerdekirî karûbarek rêvebirinê digerin.

Aylien

Ji bo ku bi hêsanî bigihîje analîza nivîsê ya fêrbûna makîneyê ya bihêz, AYLIEN sê pêvekên API-ê di heft zimanên bernamesaziya populer de pêşkêşî dike.

Nûçeya API-ya wan ji deh hezaran çavkaniyên nûçeyan ji çaraliyê cîhanê lêgerîna rast û derxistina saziyê peyda dike.

Aylien

Derxistina sazûman û çend karên din ên analîzkirina nivîsê dikare bi karanîna API-ya Analîziya Nivîsarê li ser belgeyan were kirin, medyaya civakî platform, anketên xerîdar, û hêj bêtir.

Di dawiyê de, bi karanîna Platforma Analîzkirina Nivîsarê, hûn dikarin di geroka xwe de (TAP) derhênerên xwe û rasterast biafirînin. Ew ji bo pargîdaniyên ku hewce ne ku di serî de API-yên rastkirî zû yek bikin baş dixebite.

SpaCy

SpaCy pakêtek Pêvajoya Zimanê Xwezayî ya Python (NLP) ye ku çavkaniyek vekirî ye, belaş e, û xwedan ton taybetmendiyên hundurîn e.

Ji bo wê her ku diçe gelemperî dibe Daneyên NLP pêvajo û analîzkirin. Daneyên nivîsê yên nesazkirî li ser pîvanek mezin têne afirandin, ji ber vê yekê pir girîng e ku meriv wê analîz bike û jêhatî jê derxîne.

SpaCy

Ji bo ku hûn wiya pêk bînin, divê hûn rastiyan bi rengek ku komputer dikarin fêm bikin nîşan bidin. Hûn dikarin wê bi riya NLP-ê bikin. Ew zehf zû ye, bi demek dereng tenê 30ms, lê bi rexneyî, ew ji bo karanîna bi rûpelên HTTPS-ê re ne armanc e.

Ev vebijarkek xweş e ji bo şopandina serverên xwe an intranetê ji ber ku ew li herêmê dixebite, lê ew ne amûrek ji bo xwendina tevahiya înternetê ye.

Xelasî

Naskirina saziya binavkirî (NER) pergalek e ku karsazî dikarin bikar bînin da ku agahdariya têkildar di daxwazên piştevaniya xerîdar de binav bikin, saziyên ku di bertekên xerîdar de têne referans kirin bibînin, û zû daneyên girîng ên mîna hûrguliyên têkiliyê, cih û tarîx, di nav tiştên din de derxînin.

Nêzîkatiya herî gelemperî ya ji bo naskirina sazûmanê bi nav kirin bi karanîna API-yên derxistina sazûmanê ye (çi ew ji hêla pirtûkxaneyên çavkaniya vekirî an hilberên SaaS ve têne peyda kirin).

Lêbelê, hilbijartina alternatîfa çêtirîn dê li ser dem, darayî û pisporiya we ve girêdayî be. Ji bo her cûre karsaziyê, derxistina sazûman û teknolojiyên analîzkirina nivîsê ya sofîstîke bi zelalî dikare sûdmend be.

Dema ku amûrên fêrbûna makîneyê rast têne fêr kirin, ew rast in û ji tu daneyan ji bîr nakin, dem û dravê we xilas dikin. Hûn dikarin van çareseriyan mîheng bikin ku bi entegrekirina API-yan bi domdarî û bixweber bixebitin.

Tenê qursa çalakiyê ya ku ji bo pargîdaniya we çêtirîn e hilbijêrin.

Naskirina Entity Named (NER) - Têgeh, Serlêdan & API

NER (Naskirina Entîteya Navdar) çi ye?