Inhaltsverzeechnes[Verstoppen][Show]
Mir hunn déi gebierteg Fäegkeet Wierder an Individuen, Plazen, Plazen, Wäerter a méi z'erkennen an ze klassifizéieren wa mir se héieren oder liesen. Mënsche si fäeg Wierder séier ze kategoriséieren, z'identifizéieren a verstoen.
Zum Beispill kënnt Dir en Objet kategoriséieren a séier mat op d'mannst dräi bis véier Qualitéite kommen wann Dir den Numm "Steve Jobs" héiert.
- Persoun: "Steve Jobs"
- Organisatioun: "Apple"
- Plaz: "Kalifornien"
Well Computeren dës gebierteg Fäegkeet feelen, musse mir hinnen hëllefen Wierder oder Text z'erkennen an ze klassifizéieren. Named Entity Recognition (NER) gëtt an dëser Situatioun benotzt.
An dësem Artikel wäerte mir NER (Named Entity Recognition) am Detail ënnersichen, dorënner seng Wichtegkeet, Virdeeler, Top NER APIs, a vill méi.
Wat ass NER (Named Entity Recognition)?
Eng natierlech Sproochveraarbechtung (NLP) Approche bekannt als genannt Entitéitserkennung (NER), heiansdo bekannt als Entitéitsidentifikatioun oder Entitéitsextraktioun, erkennt automatesch benannt Entitéiten an engem Text a gruppéiert se a virbestëmmte Kategorien.
Entitéite enthalen Nimm vun Individuen, Gruppen, Plazen, Datumen, Betrag, Dollarbetrag, Prozentzuelen a méi. Mat der genannter Entitéitserkennung kënnt Dir se entweder benotze fir bedeitend Donnéeën fir eng Datebank ze sammelen oder vital Informatioun ze extrahieren fir ze verstoen wat en Dokument ass.
NER ass den Ecksteen op deem en AI System hänkt fir Text fir relativ Semantik a Gefill ze analyséieren, och wann NLP e wesentleche Fortschrëtt am Textanalytikprozess duerstellt.
Wat ass d'Bedeitung vum NER?
D'Fundament vun enger Textanalytik Approche ass NER. En ML Modell muss am Ufank Millioune Proben mat virdefinéierte Kategorien ginn ier en Englesch versteet.
D'API verbessert mat der Zäit dës Komponenten an Texter z'erkennen déi se fir d'éischte Kéier liest. D'Kraaft vum Textanalytikmotor erhéicht mat der Kompetenz a Kraaft vun der NER Kapazitéit.
Wéi hei gesi ginn, gi verschidde ML Operatioune vum NER ausgeléist.
Semantesch Sich
Semantesch Sich ass elo op Google verfügbar. Dir kënnt eng Fro aginn, an et wäert probéieren hir Bescht mat enger Äntwert ze äntweren. Fir d'Informatioun ze fannen, e Benotzer sicht, digital Assistenten wéi Alexa, Siri, Chatbots, an anerer benotzen eng Aart vu semantescher Sich.
Dës Funktioun kann getraff ginn oder verpasst ginn, awer et ginn eng wuessend Zuel vu Gebrauch dofir, an hir Effektivitéit ass séier erop.
Donnéeën Analytics
Dëst ass en allgemenge Saz fir Algorithmen ze benotzen fir Analyse vun onstrukturéierten Donnéeën ze kreéieren. Et integréiert Methoden fir dës Donnéeën ze weisen mam Prozess fir pertinent Donnéeën ze fannen an ze sammelen.
Dëst kann d'Form vun enger einfacher statistescher Erklärung vun de Resultater oder enger visueller Duerstellung vun den Donnéeën huelen. Analyse vun Interessi an Engagement mat engem bestëmmten Thema kann mat Informatiounen aus YouTube Views gemaach ginn, och wann Zuschauer e spezifesche Video klickt.
D'Stärebewäertunge vun engem Produkt kënne analyséiert ginn mat Datenschrauwen vun E-Commerce Siten fir e Gesamtscore ze bidden wéi gutt de Produkt et mécht.
Gefiller Analyse
Weider Entdeckung vum NER, sentimentanalyse kann tëscht gutt a schlecht Kritik z'ënnerscheeden och an der Verontreiung vun Informatiounen aus Stär Bewäertungen.
Et ass bewosst datt Begrëffer wéi "iwwerbewäert", "fiddly" an "domm" negativ Konnotatiounen hunn, wärend Begrëffer wéi "nëtzlech", "séier" an "einfach" dat maachen. D'Wuert "einfach" kéint an engem Computerspill negativ interpretéiert ginn.
Raffinéiert Algorithmen kënnen och d'Relatioun tëscht Saachen erkennen.
Textanalysen
Ähnlech wéi Datenanalyse, Textanalyse extrahéiert Informatioun aus onstrukturéierten Textstringen a benotzt NER fir déi wichteg Donnéeën ze null.
Et kann benotzt ginn fir Daten iwwer d'Ernimmungen vun engem Produkt, den Duerchschnëttspräis oder d'Begrëffer ze kompiléieren déi Clienten am meeschten benotzen fir eng bestëmmte Mark ze beschreiwen.
Video Inhalt Analyse
Déi komplizéiertste Systemer sinn déi, déi Daten aus Videoinformatioun extrahéieren mat Gesiichtserkennung, Audioanalyse a Bilderkennung.
Mat Videoinhaltsanalyse kënnt Dir YouTube "unboxing" Videoen, Twitch Spilldemonstratiounen, Lipsynchroniséierung vun Ärem Audiomaterial op Reels, a méi.
Fir ze vermeiden datt wichteg Informatioun vermësst wéi d'Leit mat Ärem Produkt oder Service verbannen wéi de Volume vum Online Videomaterial wiisst, sinn méi séier a méi inventiv Technike fir NER-baséiert Videoinhaltsanalyse wesentlech.
Real-Welt Uwendung vun NER
Named Entity Unerkennung (NER) identifizéiert wesentlech Aspekter an engem Text wéi Nimm vu Leit, Plazen, Marken, monetäre Wäerter a méi.
D'Extraktioun vun de wichtegsten Entitéiten an engem Text hëlleft bei der Sortéierung vun onstrukturéierten Donnéeën a bedeitend Informatioun z'entdecken, wat kritesch ass wann Dir mat groussen Datesätz handelt.
Hei sinn e puer faszinéierend Real-Welt Beispiller vu benannten Entitéitserkennung:
Client Feedback analyséieren
Online Bewäertunge sinn eng fantastesch Quell vu Konsumentefeedback, well se Iech detailléiert Informatioun ubidden iwwer wat d'Clienten gär hunn an haassen iwwer Är Wueren wéi och wéi eng Gebidder vun Ärer Firma musse verbessert ginn.
All dës Client Input kann mat NER Systemer organiséiert ginn, déi och reoccurring Themen identifizéieren kënnen.
Zum Beispill, andeems Dir NER benotzt fir Plazen z'identifizéieren, déi dacks an ongënschtleche Clientsbewäertungen zitéiert ginn, kënnt Dir décidéieren op eng bestëmmte Bürozweig ze konzentréieren.
Empfehlung fir Inhalt
Eng Lëscht vun Artikelen, déi mat deem verbonne sinn, deen Dir liest, kann op Websäite wéi BBC an CNN fonnt ginn, wann Dir en Artikel do liest.
Dës Websäite maachen Empfehlungen fir zousätzlech Websäiten, déi Informatioun iwwer d'Entitéiten ubidden, déi se aus dem Inhalt extrahéiert hunn, deen Dir liest mat NER.
Organiséiert Ticketen an der Clientssupport
Dir kënnt genannt Entitéitserkennungsalgorithmen benotze fir méi séier op Clientsufroen ze reagéieren wann Dir eng Erhéijung vun der Unzuel vun Support Tickete vu Clienten verwaltet.
Automatiséieren Zäit-opwänneg Client Betreiung chores, wéi Klassifikatioun vun Clienten Reklamatiounen an Ufroen, fir selwer Suen ze spueren, Erhéijung Client glécklech, an Erhéijung Resolutioun Tariffer.
Entitéitsextraktioun kann och benotzt ginn fir pertinent Donnéeën ze extrahieren, sou wéi Produktnimm oder Seriennummeren, fir et méi einfach ze maachen Ticketen un de richtegen Agent oder Team ze router fir dëst Thema ze léisen.
D'Sich Algorithmus
Hutt Dir jeemools gefrot wéi Websäite mat Millioune vun Informatiounsstécker Resultater produzéieren déi pertinent sinn fir Är Sich? Betruecht der Websäit Wikipedia.
Wikipedia weist eng Säit mat virdefinéierten Entitéite mat deenen de Sichbegrëff bezéie kann wann Dir no "Aarbechtsplazen" sicht, anstatt all Artikele mat dem Wuert "Aarbechtsplazen" anzeginn.
Also bitt Wikipedia e Link op den Artikel deen "Beruff" definéiert, eng Rubrik fir Leit mam Numm Jobs, an en anert Gebitt fir Medien wéi Filmer, Video Spiller, an aner Forme vun Ënnerhalung wou de Begrëff "Aarbechtsplazen" schéngt.
Dir gesitt och en anert Segment fir Plazen déi d'Sichwuert enthalen.
Këmmert sech ëm CVen
Op der Sich no dem ideale Bewerber verbréngen Recruteuren e wesentlechen Deel vun hirem Dag fir CVen ze iwwerpréiwen. All Resumé huet déiselwecht Informatioun, awer si ginn all anescht presentéiert an organiséiert, wat en typescht Beispill vun onstrukturéierten Donnéeën ass.
Déi relevantst Informatioun iwwer Kandidate ka séier extrahéiert ginn andeems Dir Teams rekrutéiert, déi Entitéitsextraktoren benotzen, inklusiv perséinlech Donnéeën (wéi Numm, Adress, Telefonsnummer, Gebuertsdatum an E-Mail) an Informatioun iwwer hir Ausbildung an Erfahrung (wéi Zertifizéierungen, Grad). , Firmennimm, Fäegkeeten, etc).
E-commerce
Wat hire Produktsich Algorithmus ugeet, online Händler mat Honnerte oder Dausende vu Wueren profitéiere vum NER.
Ouni NER, eng Sich no "schwaarz Lieder Stiefel" géif Resultater zréckginn, déi souwuel Lieder a Schong enthalen, déi net schwaarz waren. Wann jo, riskéieren E-Commerce Websäite Clienten ze verléieren.
In eisem Fall géif NER d'Sichwuert als Produkttyp fir Lieder Stiefel kategoriséieren a schwaarz als Faarf.
Beschte Entity Extraktioun APIen
Google Cloud NLP
Fir scho trainéiert Tools bitt Google Cloud NLP seng Natural Language API. Oder, d'AutoML Natural Language API ass adaptéierbar fir vill Aarte vun Textextraktioun an Analyse wann Dir Är Tools iwwer d'Terminologie vun Ärer Industrie wëllt educéieren.
D'APIs interagéieren einfach mat Gmail, Google Sheets an aner Google Apps, awer se mat Drëtt-Partei Programmer benotzen kann méi komplexe Code brauchen.
Déi ideal Geschäftsoptioun ass Google Uwendungen a Cloud Storage als geréiert Servicer an APIen ze verbannen.
IBM Watson
IBM Watson ass eng Multi-Cloud Plattform déi onheemlech séier funktionnéiert a pre-built Fäegkeeten ubitt, sou wéi Ried-zu-Text, déi erstaunlech Software ass déi automatesch opgeholl Audio an Telefonsuriff analyséiere kann.
Mat der Notzung vun CSV Daten, Watson Natural Language Understanding's Deep Learning AI kann Extraktiounsmodeller erstellen fir Entitéiten oder Schlësselwieder ze extrahieren.
A mat der Praxis kënnt Dir Modeller kreéieren déi vill méi raffinéiert sinn. All seng Funktionalitéite sinn iwwer APIen zougänglech, obwuel extensiv Kodéierungskenntnisser gebraucht ginn.
Et funktionnéiert gutt fir grouss Geschäfter déi enorm Datesätz ënnersichen an intern technesch Ressourcen hunn.
Cortical.io
Mat Semantic Folding, eng Notioun aus der Neurologie, bitt Cortical.io Textextraktioun an NLU Léisungen.
Dëst gëtt gemaach fir "semantesch Fangerofdréck" ze generéieren, déi souwuel d'Bedeitung vun engem Text a senge ganzen a spezifesche Begrëffer uginn. Fir d'Relatiounen tëscht Wuertcluster ze weisen, semantesch Fangerofdréck weisen Textdaten.
Cortical.io d'interaktiv API Dokumentatioun deckt d'Funktionalitéit vun jiddereng vun den Text Analyse Léisungen, an et ass einfach Zougang mat der Java, Python, an Javascript APIs.
De Contract Intelligence Tool vun Cortical.io gouf speziell fir juristesch Analyse erstallt fir semantesch Recherchen ze maachen, gescannt Dokumenter ze transforméieren an ze hëllefen an ze verbesseren mat Annotatioun.
Et ass ideal fir Geschäfter déi no einfach ze benotzen APIen sichen déi keng AI Wëssen brauchen, besonnesch am juristesche Secteur.
Monkey Léieren
All déi grouss Computersprooche ginn vun MonkeyLearn's APIen ënnerstëtzt an einfach nëmmen e puer Zeilen Code opgestallt fir eng JSON Datei ze produzéieren déi Är extrahéiert Entitéiten enthält. Fir Extraktoren an Textanalytiker mat virdru Training ass d'Interface userfrëndlech.
Oder, an nëmmen e puer einfache Schrëtt, kënnt Dir en eenzegaartegen Extraktor erstellen. Fir d'Zäit ze reduzéieren an d'Genauegkeet ze verbesseren, fortgeschratt natierlech Sproochveraarbechtung (NLP) mat déif Maschinn léieren erlaabt Iech Text ze bewäerten wéi eng Persoun géif.
Zousätzlech suergen d'SaaS APIs datt d'Opstelle vu Verbindunge mat Tools wéi Google Sheets, Excel, Zapier, Zendesk, an anerer net Joeren Informatikwëssen erfuerderen.
Momentan verfügbar an Ärem Browser sinn den Numm Extractor, Firma Extractor, a Standort Extractor. Fir Informatiounen iwwer wéi Dir Äert eegent konstruéiert, kuckt de genannten Entitéitserkennungs Blog Artikel.
Et ass ideal fir Geschäfter vun alle Gréissten, déi an Technologie, Retail, an E-Commerce involvéiert sinn, déi einfach ze implementéieren APIs fir verschidden Aarte vun Textextraktioun an Textanalyse brauchen.
Amazon verstinn
Fir et einfach ze maachen an d'Amazon Comprehend's pre-built Tools direkt direkt ze pluggen an ze benotzen, gi se an Honnerte vu verschiddene Felder trainéiert.
Keen intern Server sinn erfuerderlech well dëst e iwwerwaachte Service ass. Besonnesch wann Dir de Moment d'Amazon Cloud op e puer Niveau benotzt, integréieren hir APIen einfach mat virdru existéierend Apps. A mat nëmmen e bësse méi Training kann d'Genauegkeet vun der Extraktioun erhéicht ginn.
Eng vun den zouverlässegsten Textanalysetechnike fir Daten aus medizinesche Rekorder a klineschen Studien ze kréien ass Comprehend's Medical Named Entity and Relationship Extraction (NERe), déi Detailer iwwer Medikamenter, Bedéngungen, Testresultater a Prozeduren extrahéieren.
Wann Dir d'Patientendaten vergläicht fir d'Diagnos ze bewäerten an ze verfeineren, kann et zimmlech gutt sinn. Déi bescht Optioun fir Geschäfter déi e verwalteten Service mat pre-trainéierten Tools sichen.
Aylien
Fir en einfachen Zougang zu robust Maschinnléieren Textanalyse ze bidden, bitt AYLIEN dräi API Plug-ins a siwe populäre Programméierungssproochen.
Hir News API bitt Echtzäit Sich an Entitéitsextraktioun aus Zéngdausende vun Neiegkeetsquellen aus der ganzer Welt.
Entitéitsextraktioun a verschidde aner Textanalyseaufgaben kënne mat der Text Analysis API op Dokumenter duerchgefouert ginn, sozial Medien Plattformen, Konsument Ëmfroen, a méi.
Endlech, andeems Dir d'Textanalyseplattform benotzt, kënnt Dir Är eege Extraktoren erstellen a méi direkt an Ärem Browser (TAP). Et funktionnéiert gutt fir Firmen déi haaptsächlech fix APIe séier musse integréieren.
Epacitéit
SpaCy ass e Python Natural Language Processing (NLP) Package deen Open-Source ass, gratis an huet eng Tonn agebaute Featuren.
Et gëtt ëmmer méi heefeg fir NLP Daten Veraarbechtung an Analyse. Onstrukturéiert textuell Donnéeën ginn op enger enormer Skala erstallt, dofir ass et entscheedend se ze analyséieren an Abléck dovunner ze extrahieren.
Fir dat z'erreechen, musst Dir d'Fakten op eng Manéier portraitéieren déi d'Computeren verstinn. Dir kënnt et duerch NLP maachen. Et ass extrem séier, mat enger Lagzäit vun nëmmen 30ms, awer kritesch ass et net geduecht fir mat HTTPS Säiten ze benotzen.
Dëst ass eng flott Optioun fir Är eege Serveren oder Intranet ze scannen well et lokal funktionnéiert, awer et ass keen Tool fir de ganzen Internet ze studéieren.
Konklusioun
Named Entity Recognition (NER) ass e System deen d'Geschäfter benotze kënne fir pertinent Informatioun a Clientssupport Ufroen ze markéieren, Entitéiten ze fannen, déi am Client Feedback referenzéiert sinn, a séier entscheedend Daten extrahéieren wéi Kontaktdetailer, Plazen, an Datumen, ënner anerem.
Déi heefegst Approche fir Entitéitserkennung genannt ze ginn ass duerch d'Benotzung vun Entitéitsextraktioun APIs (egal ob se vun Open-Source Bibliothéiken oder SaaS Produkter geliwwert ginn).
Wéi och ëmmer, déi bescht Alternativ ze wielen wäert op Är Zäit, Finanzen a Fäegkeete setzen. Fir all Zort vu Geschäft, Entitéitsextraktioun a méi sophistikéiert Textanalysetechnologien kënne kloer avantagéis sinn.
Wann d'Maschinn Léierinstrumenter korrekt geléiert ginn, si se korrekt an iwwersinn keng Daten, spuert Iech Zäit a Suen. Dir kënnt dës Léisunge konfiguréieren fir kontinuéierlech an automatesch ze lafen andeems Dir APIen integréiert.
Wielt einfach de Verlaf vun der Handlung déi am Beschten fir Är Firma ass.
Hannerlooss eng Äntwert