Fizahan-takelaka[Afeno][Aseho]
Manana fahaizana voajanahary isika hamantatra sy hanasokajy ny teny ho olona, toerana, toerana, soatoavina, ary ny maro hafa isaky ny mandre na mamaky azy ireo isika. Mahay manasokajy, mamantatra ary mahazo teny haingana ny olombelona.
Ohatra, azonao atao ny manasokajy zavatra iray ary mahazo toetra telo na efatra farafahakeliny rehefa mandre ny anarana hoe "Steve Jobs",
- Olona: "Steve Jobs"
- Fikambanana: "Apple"
- Toerana: "California"
Koa satria tsy manana an'io fahaizana voajanahary io ny solosaina, dia tsy maintsy manampy azy ireo isika amin'ny fahafantarana ny teny na ny lahatsoratra sy ny fanasokajiana izany. Named Entity Recognition (NER) no ampiasaina amin'ity toe-javatra ity.
Ato amin'ity lahatsoratra ity, dia handinika ny NER (Named Entity Recognition) amin'ny antsipiriany isika, ao anatin'izany ny maha-zava-dehibe azy, ny tombony, ny API NER ambony, ary ny maro hafa.
Inona no atao hoe NER (Named Entity Recognition)?
Ny fomba fanodinana fiteny voajanahary (NLP) fantatra amin'ny anarana hoe entity recognition (NER), indraindray fantatra amin'ny anarana hoe entity identification na entity extraction, dia mamadika ho azy ireo anarana voatonona ao anaty lahatsoratra ary manambatra azy ireo ho sokajy efa voafaritra.
Ny sampan-draharaha dia ahitana ny anaran'olona, vondrona, toerana, daty, vola, sandan'ny dolara, isan-jato ary maro hafa. Amin'ny alàlan'ny fanekena ny sampan-draharaha nomena anarana, azonao atao ny mampiasa azy io hanangonana angona manan-danja ho an'ny angon-drakitra iray na haka fampahalalana tena ilaina mba hahatakarana ny momba ny antontan-taratasy iray.
Ny NER no vato fehizoro iankinan'ny rafitra AI mba handinihana lahatsoratra momba ny semantika sy fihetseham-po, na dia maneho fandrosoana lehibe amin'ny fizotran'ny fanadihadiana lahatsoratra aza ny NLP.
Inona no dikan'ny hoe NER?
Ny fototry ny fomba famakafakana lahatsoratra dia NER. Ny maodely ML dia tsy maintsy omena santionany an-tapitrisany amin'ny voalohany misy sokajy voafaritra mialoha vao mahazo ny teny anglisy.
Ny API dia mihatsara amin'ny fotoana ahafantarana ireo singa ireo amin'ny lahatsoratra izay vakiana voalohany. Mitombo ny herin'ny motera analyse lahatsoratra miaraka amin'ny fahaiza-manao sy tanjaky ny NER.
Araka ny hita eto dia hetsika ML maromaro no ateraky ny NER.
Fikarohana semantika
Hita ao amin'ny Google izao ny fikarohana semantika. Afaka mametraka fanontaniana ianao, ary hiezaka hamaly amin'ny valiny. Mba hahitana ny fampahalalana dia misy mpampiasa mitady, mpanampy nomerika toa an'i Alexa, Siri, chatbots, ary ny hafa dia mampiasa karazana fikarohana semantika.
Ity fiasa ity dia mety ho voa na tsy hita, saingy mitombo isa ny fampiasana azy, ary mitombo haingana ny fahombiazany.
Data Analytics
Ity dia fehezanteny ankapobeny amin'ny fampiasana algorithm mba hamoronana fanadihadiana avy amin'ny angona tsy voarafitra. Ampifandraisin'izy io ny fomba fanehoana an'io data io miaraka amin'ny dingan'ny fitadiavana sy fanangonana angona mifandraika amin'izany.
Mety haka endrika fanazavana statistika mivantana momba ny vokatra na fanehoana an-tsary ny angon-drakitra izany. Ny famakafakana ny fahalianana sy ny firotsahana amin'ny lohahevitra iray dia azo atao amin'ny fampiasana fampahalalana avy amin'ny fijerena YouTube, ao anatin'izany ny rehefa manindry lahatsary iray manokana ny mpijery.
Ny kintan'ny vokatra dia azo dinihina amin'ny fampiasana angon-drakitra avy amin'ny tranokala e-varotra mba hanomezana isa amin'ny ankapobeny ny fomba fiasan'ny vokatra.
Famakafakana fihetseham-po
Fandinihana bebe kokoa ny NER, famakafakana ny fahatsapana afaka manavaka ny tsara sy ny ratsy hevitra na dia tsy misy vaovao avy amin'ny kintana naoty.
Fantatra fa misy dikany ratsy ny teny toy ny hoe “ambony”, “fiddly”, ary “adala”, fa ny teny toy ny “mahasoa”, “faingana”, ary “mora”. Ny teny hoe "mora" dia azo adika ho ratsy amin'ny lalao ordinatera.
Ny algorithm sophisticated koa dia afaka mamantatra ny fifandraisan'ny zavatra.
Analytics an-tsoratra
Mitovy amin'ny famakafakana angon-drakitra, ny famakafakana lahatsoratra dia maka vaovao avy amin'ny tady lahatsoratra tsy voarafitra ary mampiasa ny NER ho aotra amin'ny angona manan-danja.
Azo ampiasaina izy io mba hanangonana angona momba ny filazana vokatra, ny vidiny antonony, na ny teny ampiasain'ny mpanjifa matetika indrindra hamaritana marika iray.
Famakafakana votoaty video
Ny rafitra sarotra indrindra dia ireo izay mamoaka angon-drakitra avy amin'ny fampahalalana amin'ny horonan-tsary amin'ny alàlan'ny famantarana ny tarehy, ny famakafakana feo ary ny famantarana ny sary.
Amin'ny fampiasana famakafakana votoaty video dia afaka mahita horonan-tsary "unboxing" YouTube ianao, fihetsiketsehana lalao Twitch, syncs amin'ny molotrao amin'ny fitaovanao amin'ny Reels, sy ny maro hafa.
Mba hialana amin'ny tsy fahampian'ny fampahafantarana manan-danja momba ny fomba ifandraisan'ny olona amin'ny vokatrao na ny serivisinao rehefa mitombo ny habetsaky ny akora video an-tserasera, dia ilaina ny teknika haingana sy mamorona kokoa ho an'ny famakafakana atiny video mifototra amin'ny NER.
Fampiharana ny NER tena izy
Ny fanekena enti-milaza anarana (NER) dia mamaritra ireo lafiny tena ilaina amin'ny lahatsoratra toy ny anaran'olona, toerana, marika, sanda ara-bola, sy ny maro hafa.
Ny fakana ireo singa lehibe amin'ny lahatsoratra dia manampy amin'ny fanasokajiana angon-drakitra tsy voarafitra sy fitadiavana fampahalalana manan-danja, izay tena zava-dehibe rehefa mifandray amin'ny angona lehibe.
Ireto misy ohatra sasantsasany amin'ny tena zava-misy mahaliana momba ny fanekena anarana nomena anarana:
Famakafakana ny hevitry ny mpanjifa
Loharanom-baovaon'ny mpanjifa ny tsikera an-tserasera satria afaka manome anao fampahalalana amin'ny antsipiriany momba ny zavatra tian'ny mpanjifa sy ny halany momba ny entanao ary koa ny faritra tokony hatsaraina amin'ny orinasanao.
Ireo fandraisan'ny mpanjifa rehetra ireo dia azo alamina amin'ny alàlan'ny rafitra NER, izay afaka mamantatra ireo olana miverimberina ihany koa.
Ohatra, amin'ny fampiasana ny NER hamantarana ireo toerana voatonona matetika amin'ny tsikera mpanjifa tsy mahasoa, dia afaka manapa-kevitra ny hifantoka amin'ny sampana birao iray ianao.
Soso-kevitra momba ny atiny
Ny lisitr'ireo lahatsoratra mifandray amin'ilay vakinao dia hita ao amin'ny tranonkala toa ny BBC sy CNN rehefa mamaky zavatra iray ao ianao.
Ireo vohikala ireo dia manome soso-kevitra ho an'ny tranokala fanampiny izay manome fampahalalana momba ireo sampan-draharaha nalainy avy amin'ny atiny vakianao amin'ny fampiasana NER.
Mandamina tapakila amin'ny fanohanana ny mpanjifa
Azonao atao ny mampiasa algorithm faneken'ny sampana nomena anarana hamaliana haingana kokoa ny fangatahan'ny mpanjifa raha mitantana fitomboan'ny isan'ny tapakila fanohanana avy amin'ny mpanjifa ianao.
Manaova automatique ny raharaha momba ny fikarakarana mpanjifa mandany fotoana, toy ny fanasokajiana ny fitarainan'ny mpanjifa sy ny fanontanian'ny mpanjifa, mba hamonjena vola, hampitombo ny fahasambaran'ny mpanjifa, ary hampitombo ny tahan'ny famahana olana.
Ny fitrandrahana enti-manana dia azo ampiasaina ihany koa haka angon-drakitra mifandraika amin'izany, toy ny anaran'ny vokatra na laharan-tariby, mba hanamora kokoa ny fandefasana tapakila mankany amin'ny mpandraharaha na ekipa mety hamahana io olana io.
Ny algorithm fikarohana
Efa nanontany tena ve ianao hoe ahoana no ahafahan'ny tranokala misy fampahalalana an-tapitrisany mamokatra valiny mifandraika amin'ny fikarohanao? Diniho ny tranonkala Wikipedia.
Wikipedia dia mampiseho pejy misy sampan-draharaha efa voafaritra mialoha izay mety hifandraisan'ny teny fikarohana rehefa mikaroka “asa” ianao, fa tsy mamerina ny lahatsoratra rehetra misy ny teny hoe “asa” ao anatiny.
Noho izany, Wikipedia dia manolotra rohy mankany amin'ny lahatsoratra izay mamaritra ny "fibodoana", fizarana ho an'ny olona antsoina hoe Jobs, ary sehatra iray hafa ho an'ny haino aman-jery toy ny sarimihetsika, lalao video, sy ny fialam-boly hafa ahitana ny teny hoe “asa”.
Hahita fizarana hafa koa ianao ho an'ny toerana misy ny teny fikarohana.
Mikarakara ny resume
Mba hitadiavana ny mpangataka mety indrindra, mandany ampahany betsaka amin'ny androny ny recruiters amin'ny famerenana ny resume. Ny résumé tsirairay dia manana fampahalalana mitovy, saingy samy hafa ny fanolorana sy ny fandaminana azy ireo, izay ohatra mahazatra amin'ny angona tsy voarindra.
Ny fampahalalana manan-danja indrindra momba ny kandidà dia azo alaina haingana amin'ny alàlan'ny fandraisana ekipa mampiasa mpangalatra orinasa, ao anatin'izany ny angon-drakitra manokana (toy ny anarana, adiresy, nomeraon-telefaona, daty nahaterahana, ary mailaka) ary fampahalalana momba ny fianarany sy ny traikefany (toy ny mari-pahaizana, diplaoma. , anaran'ny orinasa, fahaiza-manao, sns).
E-commerce
Mikasika ny algorithm amin'ny fikarohana ny vokatra, ireo mpivarotra an-tserasera manana entana an-jatony na an'arivony dia hahazo tombony amin'ny NER.
Raha tsy misy ny NER, ny fitadiavana “baoty hoditra mainty” dia hitondra vokatra ahitana hoditra sy kiraro tsy mainty. Raha izany no izy dia mety ho very mpanjifa ny tranokala e-varotra.
IAmin'ny tranga misy anay, ny NER dia manasokajy ny teny fikarohana ho karazana vokatra ho an'ny kiraro hoditra ary mainty ho loko.
API Extraction Entity tsara indrindra
Google Cloud NLP
Ho an'ny fitaovana efa voaofana, Google Cloud NLP dia manome ny API amin'ny fiteny voajanahary. Na koa, ny AutoML Natural Language API dia azo ampifanarahana amin'ny karazana fakana lahatsoratra sy famakafakana maro raha te-hampianatra ny fitaovanao momba ny voambolan'ny indostrianao ianao.
Mifandray mora amin'ny Gmail, Google Sheets, ary fampiharana Google hafa ny API, fa ny fampiasana azy amin'ny programa an'ny antoko fahatelo dia mety mila kaody sarotra kokoa.
Ny safidy tsara indrindra amin'ny raharaham-barotra dia ny mampifandray ny rindranasa Google sy ny Cloud Storage ho serivisy fitantanana sy API.
IBM Watson
IBM Watson dia sehatra rahona marobe izay mahavita haingana haingana ary manome fahaiza-manao efa vita, toy ny speech-to-text, izay rindrambaiko mahagaga izay afaka mamakafaka ho azy ireo feo sy antso an-telefaona voarakitra.
Amin'ny fampiasana angona CSV, ny fianarana lalina an'i Watson Natural Language Understanding AI dia afaka mamorona maodely fitrandrahana hanesorana ireo singa na teny fototra.
Ary miaraka amin'ny fanazaran-tena dia afaka mamorona modely izay be pitsiny lavitra ianao. Ny fiasany rehetra dia azo idirana amin'ny alàlan'ny API, na dia ilaina aza ny fahalalana kaody midadasika.
Izy io dia miasa tsara ho an'ny orinasa lehibe izay mila mandinika angon-drakitra lehibe ary manana loharano ara-teknika anatiny.
Cortical.io
Amin'ny fampiasana Semantic Folding, hevitra avy amin'ny neurology, Cortical.io dia manome fitrandrahana lahatsoratra sy vahaolana NLU.
Natao izany mba hamoronana “fanondro-tanana semantika”, izay manondro ny hevitry ny lahatsoratra amin'ny teny iray manontolo sy manokana. Mba hampisehoana ny fifandraisana misy eo amin'ny vondron-teny, ny dian-tanana semantika dia maneho ny angona lahatsoratra.
Ny antontan-taratasin'ny API interactive an'ny Cortical.io dia mirakitra ny fiasan'ny vahaolana famakafakana lahatsoratra tsirairay, ary mora ny miditra amin'ny fampiasana ny Java, Python, ary Javascript API.
Ny fitaovana Contract Intelligence avy amin'ny Cortical.io dia noforonina manokana ho an'ny famakafakana ara-dalàna hanaovana fikarohana semantika, hanovana ireo antontan-taratasy notarafina, ary hanampy sy hanatsara amin'ny fanamarihana.
Tena mety ho an'ny orinasa mitady API mora ampiasaina izay tsy mila fahalalana AI, indrindra amin'ny sehatry ny lalàna.
Monkey Learn
Ny fiteny informatika lehibe rehetra dia tohanan'ny MonkeyLearn's APIs ary manangana kaody vitsivitsy fotsiny mba hamokarana rakitra JSON misy ireo singa nalainao. Ho an'ny mpitrandraka sy mpandinika lahatsoratra miaraka amin'ny fiofanana teo aloha, ny interface dia mora ampiasaina.
Na, amin'ny dingana tsotra vitsivitsy, dia afaka mamorona extractor tsy manam-paharoa. Mba hampihenana ny fotoana sy hanatsara ny fahitsiana, mandroso amin'ny fiteny voajanahary (NLP) amin'ny lalina fianarana milina ahafahanao manombana lahatsoratra tahaka ny ataon'ny olona iray.
Fanampin'izany, ny API SaaS dia miantoka fa ny fametrahana fifandraisana amin'ny fitaovana toy ny Google Sheets, Excel, Zapier, Zendesk, ary ny hafa dia tsy mitaky fahalalana momba ny siansa informatika an-taonany maro.
Misy amin'izao fotoana izao ao amin'ny navigateur anao ny anarana extractor, orinasa extractor, ary toerana extractor. Raha mila fanazavana momba ny fomba fananganana anao manokana dia jereo ny lahatsoratra bilaogy momba ny fanekena enti-milaza.
Tena mety ho an'ny orinasa amin'ny habe rehetra tafiditra amin'ny teknolojia, varotra ary e-varotra izay mila API tsotra ho an'ny karazana fitrandrahana lahatsoratra sy famakafakana lahatsoratra.
Amazon Comprehend
Mba hanamora ny fampifandraisana sy fampiasana ireo fitaovana efa vita avy hatrany ao amin'ny Amazon Comprehend, dia voaofana amin'ny sehatra samihafa an-jatony izy ireo.
Tsy mila mpizara ao an-trano satria serivisy fanaraha-maso ity. Indrindra fa raha mampiasa ny rahon'i Amazon ianao amin'izao fotoana izao, ny API-n'izy ireo dia mitambatra mora amin'ny fampiharana efa nisy teo aloha. Ary miaraka amin'ny fanofanana kely fotsiny dia azo ampitomboina ny fahamarinan'ny fitrandrahana.
Iray amin'ireo teknika famakafakana lahatsoratra azo ianteherana indrindra amin'ny fahazoana angon-drakitra avy amin'ny firaketana ara-pitsaboana sy fitsapana ara-pitsaboana ny Comprehend's Medical Named Entity and Relationship Extraction (NERe), izay afaka mamoaka antsipiriany momba ny fanafody, ny fepetra, ny valin'ny fitsapana ary ny fomba fiasa.
Rehefa mampitaha ny angon-drakitra momba ny marary amin'ny fanombanana sy ny fitiliana tsara dia mety hahasoa tokoa. Safidy tsara indrindra ho an'ny orinasa mitady serivisy mitantana miaraka amin'ny fitaovana efa voaofana mialoha.
Aylien
Mba hanomezana fidirana mora amin'ny famakafakana lahatsoratra fianarana milina matanjaka, AYLIEN dia manolotra plug-in API telo amin'ny fiteny fandaharana malaza fito.
Ny News API-n'izy ireo dia manome fikarohana amin'ny fotoana tena izy sy fitrandrahana orinasa avy amin'ny loharanom-baovao an'aliny manerana an'izao tontolo izao.
Ny fitrandrahana enti-manana sy ny asa famakafakana lahatsoratra maro hafa dia azo atao amin'ny alàlan'ny Text Analysis API amin'ny antontan-taratasy, haino aman-jery sosialy sehatra, fanadihadiana momba ny mpanjifa, sy ny maro hafa.
Farany, amin'ny fampiasana ny Sehatry ny Famakafakana Text, dia azonao atao ny mamorona mpitrandraka anao manokana ary mahitsy kokoa amin'ny navigateur (TAP). Izy io dia miasa tsara ho an'ny orinasa mila mampiditra haingana ny API raikitra.
SpaCy
SpaCy dia fonosana Python Natural Language Processing (NLP) izay loharano misokatra, maimaim-poana, ary manana endri-javatra an-taonany maro.
Mihamitombo hatrany izany ho an'ny Takelaka data NLP fanodinana sy fanadihadiana. Ny angon-drakitra an-tsoratra tsy voarafitra dia noforonina amin'ny ambaratonga lehibe, noho izany dia zava-dehibe ny famakafakana azy sy ny fakana hevitra avy aminy.
Mba hanatanterahana izany, dia tsy maintsy maneho ny zava-misy amin'ny fomba azon'ny ordinatera ianao. Azonao atao izany amin'ny alàlan'ny NLP. Haingana be izy io, miaraka amin'ny fotoana fahatarana 30ms ihany, fa ny tena zava-dehibe dia tsy natao hampiasaina amin'ny pejy HTTPS.
Ity dia safidy tsara amin'ny scan ny lohamilina na intranet anao satria miasa eo an-toerana izy io, saingy tsy fitaovana hianarana ny Internet manontolo.
Famaranana
Ny fanekena enti-mitondra anarana (NER) dia rafitra azon'ny orinasa ampiasaina mba hanamarihana ny vaovao mifandraika amin'ny fangatahana fanohanana ny mpanjifa, hitadiavana ireo sampan-draharaha voatondro ao amin'ny tamberin'ny mpanjifa, ary hanesorana haingana ny angona manan-danja toy ny antsipirian'ny fifandraisana, ny toerana sy ny daty, ankoatra ny zavatra hafa.
Ny fomba mahazatra indrindra amin'ny anarana hoe fanekena ny sampan-draharaha dia amin'ny alàlan'ny fampiasana API fitrandrahana enti-manana (na omen'ny tranomboky misokatra na vokatra SaaS).
Na izany aza, ny fisafidianana ny safidy tsara indrindra dia miankina amin'ny fotoananao, ny volanao ary ny fahaizanao. Ho an'ny karazana orinasa rehetra, ny fitrandrahana orinasa sy ny teknolojia famakafakana lahatsoratra be pitsiny kokoa dia mety hahasoa.
Rehefa ampianarina araka ny tokony ho izy ny fitaovana fianarana milina, dia marina izy ireo ary tsy manadino angon-drakitra, mitsitsy fotoana sy vola. Azonao atao ny manamboatra ireo vahaolana ireo mba handehanana tsy tapaka sy ho azy amin'ny alàlan'ny fampidirana API.
Fidio tsotra izao ny fomba fiasa izay mety indrindra ho an'ny orinasanao.
Leave a Reply