Table of Contents[Qari][muuji]
Waxaan leenahay awood aan ku garan karno oo aan u kala saarno kelmadaha shaqsiyaad, goobo, goobo, qiyam, iyo in ka badan mar kasta oo aan maqalno ama akhrino. Aadamuhu waxa ay awoodaan in ay si degdeg ah u kala saaraan, gartaan, una fahmaan erayada.
Tusaale ahaan, waxaad u kala saari kartaa shay oo aad si dhakhso ah ula iman kartaa ugu yaraan saddex ilaa afar sifo markaad maqasho magaca "Steve Jobs,"
- Qofka: "Steve Jobs"
- Ururka: "Apple"
- Goobta: "California"
Mar haddii kombuyuutarku ay ka maqan yihiin xirfaddan dhalanteed, waa inaan ka caawinnaa inay aqoonsadaan erayada ama qoraalka oo ay u kala saaraan. Aqoonsiga Hay'adda Magaceedu yahay (NER) ayaa loo isticmaalaa xaaladdan.
Maqaalkan, waxaan si faahfaahsan u baari doonaa NER (Aqoonsiga Hay'adda Magaceedu yahay) oo ay ku jiraan muhiimadiisa, faa'iidooyinka, NER API-yada sare, iyo wax ka badan.
Waa maxay NER (Aqoonsiga Hay'adda Magaceedu yahay)?
Habka habaynta luqadda dabiiciga ah (NLP) ee loo yaqaan magaca aqoonsiga cidda (NER), mararka qaarkood loo yaqaan aqoonsiga cidda ama soo saarista cidda, ayaa si toos ah u aqoonsata hay'adaha la magacaabay qoraal oo u kala qaybiya qaybo hore loo go'aamiyay.
Hay'adaha waxaa ka mid ah magacyada shakhsiyaadka, kooxaha, meelaha, taariikhaha, qaddarka, qaddarka dollarka, boqolleyda, iyo in ka badan. Aqoonsiga cidda magaceedu yahay, waxaad ka faa'iidaysan kartaa inaad u ururiso xog muhiim ah kaydka ama inaad soo saarto macluumaadka muhiimka ah si aad u fahanto waxa dukumeentigu ku saabsan yahay.
NER waa rukunka uu nidaamka AI ku tiirsan yahay si loo falanqeeyo qoraalka ee semantics iyo dareenka qaraabada ah, xitaa haddii NLP ay u taagan tahay horumar la taaban karo ee habka falanqaynta qoraalka.
Waa maxay muhiimada NER?
Aasaaska habka falanqaynta qoraalka waa NER. Nooca ML waa in marka hore la siiyaa malaayiin muunado ah oo leh qaybo horay loo sii qeexay ka hor inta uusan fahmin Ingiriisiga.
API-gu wuu wanaajiyaa marka la aqoonsanayo qaybahan qoraallada uu akhrinayo markii ugu horreysay. Awoodda mishiinka falanqaynta qoraalka waxay kordhisaa awoodda NER-ga ee kartida iyo xoogga.
Sida halkan lagu arkay, dhawr hawlgal oo ML ah waxaa kiciyay NER.
Raadinta Semantic
Semantic search hadda waa laga heli karaa Google. Waxaad geli kartaa su'aal, oo waxay isku dayi doontaa sida ugu fiican inay uga jawaabto jawaab. Si loo helo macluumaadka, isticmaaluhu wuxuu raadinayaa, kaaliyeyaasha dhijitaalka ah sida Alexa, Siri, chatbots, iyo kuwa kale waxay shaqaaleeyaan nooc raadinta semantic.
Shaqadan waa la garaaci karaa ama waa la seegi karaa, laakiin waxaa jira tiro sii kordheysa oo loo isticmaalo, waxtarkooduna si degdeg ah ayuu kor ugu kacayaa.
Analytics Xogta
Tani waa weedh guud oo loogu talagalay isticmaalka algorithms si loo abuuro falanqaynta xogta aan habaysan. Waxay isku daraysaa hababka lagu soo bandhigo xogtan iyo habka loo helo iyo ururinta xogta muhiimka ah.
Tani waxay qaadan kartaa qaab sharraxaad xisaabeed toos ah oo ku saabsan natiijooyinka ama muuqaal muuqaal ah oo xogta ah. Falanqaynta xiisaha iyo ka-qaybgalka mawduuc gaar ah ayaa la samayn karaa iyada oo la adeegsanayo macluumaadka laga helay aragtida YouTube, oo ay ku jirto marka daawadayaashu dhagaystaan fiidyow gaar ah.
Qiimaynta xidigaha alaabta waxa lagu lafaguri karaa iyada oo la isticmaalayo xogta laga soo xaaqayo goobaha e-commerce si loo bixiyo buundada guud ee sida wanaagsan ee badeecadu u shaqaynayso.
Falanqaynta Dareenka
Sahaminta dheeraadka ah ee NER, falanqaynta dareenka waxay kala saari karaan dib u eegista wanaagsan iyo kuwa xun xitaa haddii ay maqan tahay macluumaadka qiimeynta xiddigaha.
Way la socotaa in ereyada ay ka midka yihiin "la xad-dhaafay," "fidly," iyo "doqon" ay leeyihiin macnayaal taban, halka erayada sida "faa'iido leh," "degdeg ah," iyo "fudud" ay sameeyaan. Erayga "fudud" waxaa si xun loogu tarjumi karaa ciyaarta kombiyuutarka.
Algorithms-yada casriga ah ayaa sidoo kale aqoonsan kara xiriirka ka dhexeeya waxyaabaha.
Falanqaynta qoraalka
Si la mid ah falanqaynta xogta, falanqaynta qoraalku waxay ka soo saartaa macluumaadka xargaha qoraalka ee aan qaabaysan waxayna isticmaashaa NER si ay eber uga gasho xogta muhiimka ah.
Waxa loo isticmaali karaa in lagu ururiyo xogta alaabta la sheegay, celceliska qiimaha, ama shuruudaha ay macaamiishu inta badan isticmaalaan si ay u qeexaan calaamad gaar ah.
Falanqaynta Nuxurka Muuqaalka
Nidaamyada ugu adag waa kuwa ka soo saara xogta macluumaadka fiidyowga iyagoo isticmaalaya aqoonsiga wajiga, falanqaynta maqalka, iyo aqoonsiga sawirka.
Isticmaalka falanqaynta nuxurka muuqaalka, waxaad ka heli kartaa fiidiyowyada "unboxing" YouTube, bandhigyada ciyaarta Twitch, isku dhejinta bushimaha alaabtaada maqalka ee Reels, iyo in ka badan.
Si looga fogaado in la waayo macluumaadka muhiimka ah ee ku saabsan sida dadku ugu xidhmaan alaabtaada ama adeeggaaga inta mugga alaabta fiidiyooga ee internetka sii kordheyso, farsamooyin degdeg ah oo badan oo hindise ah oo loogu talagalay falanqaynta nuxurka fiidyowga ku salaysan ee NER waa lama huraan.
Codsiga dhabta ah ee NER
Aqoonsiga cidda la magac baxay (NER) waxa ay tilmaamaysaa dhinacyada muhiimka ah ee qoraalka sida magacyada dadka, goobaha, summada, qiyamka lacageed, iyo in ka badan.
Soo saarista qaybaha muhiimka ah ee qoraalka waxa ay caawisaa kala soocida xogta aan habaysanayn iyo ogaanshaha macluumaadka muhiimka ah, taas oo muhiim u ah marka laga hadlayo xog-ururinta waaweyn.
Waa kuwan tusaalayaal soo jiidasho leh oo dunida dhabta ah ee aqoonsiga magaceed:
Falanqaynta Jawaab celinta Macmiilka
Dib u eegista khadka tooska ah ayaa ah ilo fantastik ah oo macaamiisha ah maadaama ay ku siin karaan macluumaad faahfaahsan oo ku saabsan waxa ay macaamiishu jecel yihiin oo ay neceb yihiin alaabtaada iyo sidoo kale meelaha shirkadaadu u baahan tahay in la horumariyo.
Dhammaan talooyinka macmiilka waxaa lagu habayn karaa iyadoo la adeegsanayo nidaamyada NER, kaas oo sidoo kale aqoonsan kara arrimaha soo noqnoqda.
Tusaale ahaan, adoo isticmaalaya NER si aad u aqoonsato meelaha inta badan lagu sheego faallooyinka macaamiisha ee aan fiicnayn, waxaad go'aansan kartaa inaad xoogga saarto laan xafiis gaar ah.
Talo bixinta nuxurka
Liiska maqaallada ku xidhan midka aad akhrinayso waxa laga heli karaa mareegaha sida BBC iyo CNN marka aad shay halkaa ka akhrido.
Websaydhyadani waxay soo jeedinayaan talooyinka mareegaha dheeraadka ah ee bixiya macluumaadka ku saabsan hay'adaha ay ka soo saareen nuxurka aad akhrinayso adigoo isticmaalaya NER.
Abaabul Tigidhada Taageerada Macmiilka
Waxaad isticmaali kartaa algorithms aqoonsiga magaca magaca qofka si aad si dhakhso leh uga jawaabto codsiyada macmiilka haddii aad maamusho korodhka tirada tigidhada taageerada macaamiisha.
Si otomaatig ah u samee hawlaha daryeelka macmiilka ee wakhtiga qaata, sida kala saarista cabashooyinka macaamiisha iyo waydiimaha, si aad lacagta naftaada u badbaadiso, u kordhiso farxada macmiilka, una kordhiso heerka xalinta.
Soo saarista hay'adda waxaa sidoo kale loo isticmaali karaa in lagu soo saaro xogta muhiimka ah, sida magacyada alaabta ama nambarada taxanaha ah, si loo fududeeyo in tigidhada loo maro wakiilka saxda ah ama kooxda xallinta arrintan.
Algorithm raadinta
Weligaa ma isweydiisay sida mareegaha leh malaayiin xog ah ay u soo saari karaan natiijooyin khuseeya raadintaada? Tixgeli bogga Wikipedia.
Wikipedia wuxuu soo bandhigayaa bog ka kooban hay'ado horay loo sii qeexay oo ereyga raadintu la xiriiri karo marka aad raadineyso "shaqo", halkii aad ku soo celin lahayd dhammaan maqaallada ereyga "shaqooyinka" iyaga ku jira.
Haddaba, Wikipedia waxa uu bixiyaa xiriirinta maqaalka qeexaya "shaqo," qayb loogu talagalay dadka lagu magacaabo Shaqooyinka, iyo meel kale oo loogu talagalay warbaahinta sida filimada, kulan video, iyo noocyada kale ee madadaalada halkaas oo kelmad "shaqo" ay ka muuqato.
Waxa kale oo aad arki doontaa qayb kale oo loogu talagalay goobaha ay ku jiraan ereyga raadinta.
Daryeelida resumeygaaga
Raadinta codsadaha ku habboon, shaqaaleeyayaashu waxay ku qaataan qayb muhiim ah maalintooda dib u eegista shaqada. Qoraal kastaa wuxuu leeyahay macluumaad isku mid ah, laakiin dhammaantood si kala duwan ayaa loo soo bandhigay oo loo habeeyey, taas oo tusaale u ah xogta aan habaysanayn.
Macluumaadka ugu muhiimsan ee ku saabsan musharixiinta waxaa si degdeg ah loo soo saari karaa iyadoo la qorayo kooxo isticmaalaya soosaarayaasha cidda, oo ay ku jiraan xogta shakhsi ahaaneed (sida magaca, cinwaanka, lambarka telefoonka, taariikhda dhalashada, iyo iimaylka) iyo macluumaadka ku saabsan waxbarashadooda iyo waayo-aragnimadooda (sida shahaadooyinka, shahaadada , magacyada shirkadda, xirfadaha, iwm).
E-commerce
Marka la eego algorithm raadinta badeecadooda, tafaariiqlayaasha khadka tooska ah ee leh boqolaal ama kumanaan alaab ayaa ka faa'iidaysan doona NER.
NER la'aanteed, raadinta "kabaha maqaarka madow" waxay soo celinaysaa natiijooyin ay ku jiraan maqaar iyo kabo aan madow ahayn. Hadday sidaas tahay, shabakadaha e-commerce waxay halis ugu jiraan inay lumiyaan macaamiisha.
IKiiskeena, NER waxay u kala saari doontaa ereyga raadinta sida nooca badeecada ee kabaha maqaarka iyo madow sida midabka.
APIs Soo saarista Hay'adda ugu Fiican
Google Cloud NLP
Qalabka mar horeba loo tababaray, Google Cloud NLP waxa ay siisaa Luuqaddeeda Dabiiciga ah API. Ama, AutoML Dabiiciga Language API waa mid la qabsan kara noocyo badan oo qoraal ah oo soo saarid iyo falanqayn ah haddii aad rabto inaad ku barato qalabkaaga ereyada warshadahaaga.
APIs-yadu waxay si fudud ula falgalaan Gmail, Google Sheets, iyo abka kale ee Google, laakiin iyaga oo isticmaalaya barnaamijyada dhinac saddexaad waxay u baahan karaan kood kakan.
Xulashada ganacsi ee ugu habboon waa in lagu xidho codsiyada Google iyo Kaydinta Cloud sida adeegyada la maareeyay iyo API-yada.
IBM Watson
IBM Watson waa madal daruuro badan oo si degdeg ah u qabata oo bixisa awood hore loo dhisay, sida hadal-ka-qoraalka, taas oo ah software cajiib ah oo si toos ah u baari kara codadka la duubay iyo wicitaannada taleefanka.
Isticmaalka xogta CSV, Watson Barashada qoto dheer ee Luqadda Dabiiciga ah AI waxay abuuri kartaa moodooyin soosaar si ay u soo saarto qaybaha ama ereyada muhiimka ah.
Dhaqan ahaan, waxaad abuuri kartaa moodooyin aad uga sii casrisan. Dhammaan hawlaheeda shaqo waxaa laga heli karaa API-yada, in kasta oo loo baahan yahay aqoon codayn ballaaran.
Waxay si fiican ugu shaqeysaa ganacsiyada waaweyn ee u baahan inay baaraan xog-ururin weyn oo ay haystaan ilo farsamo oo gudaha ah.
Cortical.io
Isticmaalka Semantic Folding, fikrad ka timid neurology, Cortical.io waxay bixisaa soo saarista qoraalka iyo xalalka NLU.
Tan waxa loo sameeyaa si loo dhaliyo "faraha semantic", kuwaas oo tilmaamaya labadaba macnaha qoraalka guud ahaan iyo erayadiisa gaarka ah. Si loo muujiyo cilaaqaadka ka dhexeeya kutlada kelmadda, faraha semantic ayaa muujinaya xogta qoraalka.
Dukumeentiga API interactive Cortical.io wuxuu daboolayaa shaqeynta mid kasta oo ka mid ah xalalka falanqaynta qoraalka, waana ay fududahay in la galo iyadoo la adeegsanayo Java, Python, iyo Javascript APIs.
Qalabka sirdoonka qandaraaska ee Cortical.io waxaa si gaar ah loogu sameeyay falanqaynta sharciga si loo sameeyo baaritaanno semantic, beddelo dukumentiyada la sawiray, iyo caawinta iyo kor u qaadida sharraxaadda.
Waxay ku habboon tahay ganacsiyada raadinaya API-yada si fudud loo isticmaali karo oo aan u baahnayn aqoonta AI, gaar ahaan qaybta sharciga.
Daanyeer Baro
Dhammaan luqadaha kumbuyuutarka ee waaweyn waxaa taageera MonkeyLearn's APIs waxayna dejiyeen si fudud dhowr sadar oo kood ah si loo soo saaro faylka JSON oo ka kooban hay'adahaaga la saaray. Soosaarayaasha iyo falanqeeyayaasha qoraalka leh tababar hore, interface-ku waa saaxiibtinimo-saaxiibtinimo.
Ama, dhowr tillaabo oo fudud, waxaad ku abuuri kartaa soosaar gaar ah. Si loo dhimo wakhtiga loona wanaajiyo saxnaanta, habaynta luuqada dabiiciga ah ee horumarsan (NLP) oo qoto dheer barashada mashiinka waxay awood kuu siinaysaa inaad qoraalka u qiimayso siduu qofku u qiimayn lahaa.
Intaa waxaa dheer, SaaS API-yadu waxay xaqiijiyaan in ku xidhidhsinta aaladaha sida Google Sheets, Excel, Zapier, Zendesk, iyo kuwa kale aysan u baahnayn sanadaha aqoonta sayniska kombiyuutarka.
Hadda waxaa laga heli karaa biraawsarkaaga magaca soosaaraha, soosaaraha shirkadda, iyo soosaaraha goobta. Macluumaad ku saabsan sida loo dhiso kaaga, ka eeg maqaalka aqoonsiga cidda magaca leh.
Waxay ku habboon tahay ganacsiyada dhammaan cabbirrada ku lug leh tignoolajiyada, tafaariiqda, iyo e-ganacsiga e-commerce ee u baahan API-yada fudud-si-fudud ee noocyada kala duwan ee soo saarista qoraalka iyo falanqaynta qoraalka.
Garashada Amazon
Si loo fududeeyo in la xidho oo la isticmaalo Amazon Comprehend qalabkii hore loo dhisay isla markaaba, waxa lagu tababbaray boqolaal goobood oo kala duwan.
Looma baahna server-ka guriga dhexdiisa sababtoo ah kani waa adeeg la kormeero. Gaar ahaan haddii aad hadda isticmaaleyso daruuraha Amazon ilaa heer, API-yadooda waxay si fudud ula midoobaan abka hore u jiray. Iyo in yar oo tababar dheeraad ah, saxnaanta soo saarista waa la sara kicin karaa.
Mid ka mid ah farsamooyinka falanqaynta qoraalka ee aadka loogu kalsoon yahay ee lagu heli karo xogta diiwaannada caafimaadka iyo tijaabooyinka bukaan-socodka waa Fahmitaanka Caafimaadka Magacaaban ee Hay'adda iyo Xiriirka Xiriirka (NERE), kaas oo soo saari kara faahfaahinta daawooyinka, xaaladaha, natiijooyinka baaritaanka, iyo hababka.
Marka la barbardhigo xogta bukaanka si loo qiimeeyo loona hagaajiyo ogaanshaha, waxay noqon kartaa mid faa'iido leh. Doorashada ugu fiican ee ganacsiyada doonaya adeeg la maareeyey oo leh qalab horay loo tababaray.
Aylien
Si loo helo si sahlan oo loo heli karo falanqaynta qoraalka ee barashada mashiinka, AYLIEN waxay bixisaa saddex fur-in oo API ah oo ku qoran toddobo luqadood oo caan ah.
News API waxay bixisaa raadinta-waqtiga-dhabta ah iyo soo saarista hay'adaha tobanaan kun oo ilo wareed oo ka kala yimid daafaha caalamka.
Soo saarista hay'adda iyo dhowr hawlood oo kale oo falanqaynta qoraalka ah ayaa lagu fulin karaa iyada oo la adeegsanayo API Analysis Text ee dukumentiyada, warbaahinta bulshada goobaha, sahanka macaamiisha, iyo in ka badan.
Ugu dambeyntii, adigoo isticmaalaya Platform-ka Falanqaynta Qoraalka, waxaad samayn kartaa soosaarayaal kuu gaar ah oo si toos ah browserkaaga (TAP). Waxay si fiican ugu shaqeysaa shirkadaha u baahan inay si degdeg ah ugu daraan API-yada go'an.
SpaCy
SpaCy waa xirmo Habraaca Luqadda Dabiiciga ah ee Python (NLP) kaas oo ah il furan, bilaash ah, oo leh astaamo la dhisay.
Waxaa aad iyo aad u sii badanaysa Xogta NLP habaynta iyo falanqaynta. Xogta qoraalka ee aan qaabaysan ayaa loo abuuray miisaan aad u weyn, sidaas awgeed waa muhiim in la falanqeeyo oo laga soo saaro fikrado.
Si taas loo gaaro, waa in aad xaqiiqada u sawirtaa si kombuyuutarku u fahmi karo. Waxaad ku samayn kartaa iyada oo loo marayo NLP. Aad bay u dhaqso badan tahay, oo leh waqti dib u dhac ah oo ah 30ms oo keliya, laakiin si daran, looguma talagelin isticmaalka bogagga HTTPS.
Tani waa ikhtiyaar fiican oo lagu baadho server-kaaga ama intranetkaaga sababtoo ah waxay ka shaqeysaa gudaha, laakiin maaha qalab lagu barto internetka oo dhan.
Ugu Dambeyn
Aqoonsiga cidda loo magacaabay (NER) waa nidaam ay ganacsiyadu u isticmaali karaan inay ku calaamadiyaan macluumaadka khuseeya codsiyada taageerada macaamiisha, u helaan hay'adaha lagu tixraaco jawaab celinta macaamiisha, oo ay si dhakhso ah u soo saaraan xogta muhiimka ah sida faahfaahinta xiriirka, goobaha, iyo taariikhaha, iyo waxyaabo kale.
Habka ugu caansan ee lagu magacaabo aqoonsiga cidda waa iyada oo la adeegsanayo API-yada soo saarista cidda (haddii ay bixiyaan maktabado il furan ama alaabta SaaS).
Si kastaba ha noqotee, doorashada beddelka ugu fiican waxay ku xirnaan doontaa waqtigaaga, dhaqaalahaaga, iyo xirfaddaada. Nooc kasta oo ganacsi ah, soo saarista cidda iyo tignoolajiyada falanqaynta qoraalka ee aad u casrisan ayaa si cad faa'iido u leh.
Marka qalabka wax lagu barto mashiinka si sax ah loo baro, waa sax oo ma iloobaan wax xog ah, taas oo kuu badbaadinaysa wakhti iyo lacag. Waxaad u habayn kartaa xalalkan inay si joogto ah oo toos ah u shaqeeyaan adoo isku daraya API-yada.
Kaliya dooro habka ficilka ee ugu fiican shirkaddaada.
Leave a Reply