Kunsmatige intelligensie verander die manier waarop ons inhoud beplan en genereer. Dit beïnvloed ook hoe mense materiaal ontdek, van waarna hulle op Google soek tot wat hulle op Netflix binge-kyk.
Nog belangriker, vir inhoudbemarkers, stel dit spanne in staat om te groei deur sekere soorte inhoudgenerering te outomatiseer en huidige materiaal te ontleed om dit wat jy lewer te verbeter en beter te pas by kliënte se voorneme.
Daar is verskeie bewegende stukke in die KI en machine learning prosesse. Het jy al ooit 'n slim assistent (soos Siri of Alexa) 'n vraag gevra?
Die antwoord is heel waarskynlik "ja", wat daarop dui dat jy reeds op 'n sekere vlak vertroud is met natuurlike taalverwerking (NLP).
Alan Turing is 'n naam waarvan elke tegneerder gehoor het. Die bekende Turing-toets is vir die eerste keer in 1950 deur die bekende wiskundige en rekenaarwetenskaplike Alan Turing ontwerp.
Hy het in sy werk beweer Rekenaarmasjinerie en intelligensie dat 'n masjien kunsmatig intelligent is as dit met 'n persoon kan gesels en hom mislei om te dink hy gesels met 'n mens.
Dit het gedien as die basis vir NLP-tegnologie. 'n Doeltreffende NLP-stelsel sal in staat wees om die navraag en sy konteks te begryp, dit te ontleed, die beste manier van aksie te kies en te antwoord in 'n taal wat die gebruiker sal verstaan.
Wêreldwye standaarde vir die voltooiing van take op data sluit kunsmatige intelligensie en masjienleertegnieke in. Maar wat van mensetaal?
Die velde van natuurlike taalgenerering (NLG), natuurlike taalbegrip (NLU) en natuurlike taalverwerking (NLP) het almal die afgelope jare baie aandag gekry.
Maar omdat die drie verskillende verantwoordelikhede het, is dit van kardinale belang om verwarring te voorkom. Baie glo dat hulle hierdie idees in hul geheel begryp.
Aangesien natuurlike taal reeds in die name teenwoordig is, is al wat 'n mens doen om dit te verwerk, te verstaan en te produseer. Ons het egter besluit dat dit nuttig kan wees om 'n bietjie dieper te gaan, gegewe hoe gereeld ons hierdie frases teëkom wat uitruilbaar gebruik word.
Kom ons begin gevolglik deur elkeen van hulle noukeurig te bekyk.
Wat is natuurlike taalverwerking?
Enige natuurlike taal word deur rekenaars as 'n vrye vorm-teks beskou. Dit volg dat daar tydens die invoer van data geen vaste sleutelwoorde op vaste plekke is nie. Behalwe dat dit ongestruktureerd is, het natuurlike taal ook 'n verskeidenheid uitdrukkingsopsies. Neem hierdie drie frases as 'n illustrasie:
- Hoe is die weer vandag?
- Het vandag enige kans op reën?
- Vereis vandag dat ek my sambreel bring?
Elkeen van hierdie stellings vra oor die weervoorspelling vir vandag, wat die gemene deler is.
As mense kan ons hierdie fundamentele verbande byna onmiddellik sien en toepaslik optree.
Dit is egter 'n uitdaging vir rekenaars aangesien elke algoritme die invoer vereis om 'n spesifieke formaat te volg, en al drie stellings het verskillende strukture en formate.
En dinge sal baie gou baie moeilik raak as ons probeer om reëls vir elke woordkombinasie in elke natuurlike taal te kodifiseer om 'n rekenaar te help om te verstaan. NLP tree in die prentjie in hierdie situasie.
Natuurlike taalverwerking (NLP), wat probeer om model natuurlike menslike taal data, afkomstig van rekenaarlinguistiek.
Daarbenewens konsentreer NLP op die gebruik van masjienleer en diepleerbenaderings terwyl 'n aansienlike hoeveelheid menslike insette verwerk word. Dit word gereeld gebruik in filosofie, taalkunde, rekenaarwetenskap, inligtingstelsels en kommunikasie.
Rekenaarlinguistiek, sintaksisanalise, spraakherkenning, masjienvertaling en ander subvelde van NLP is slegs 'n paar. Natuurlike taalverwerking transformeer ongestruktureerde materiaal in die toepaslike formaat of 'n gestruktureerde teks om te funksioneer.
Om te verstaan wat die gebruiker bedoel wanneer hulle iets sê, bou dit die algoritme en lei die model op deur groot hoeveelhede data te gebruik.
Dit werk deur verskillende entiteite saam te groepeer vir identifikasie (bekend as entiteitsherkenning) en deur woordpatrone te herken. Lemmatisering, tokenisering en stemmingstegnieke word gebruik om die woordpatrone te vind.
Inligtingonttrekking, stemherkenning, woordsoortmerking en ontleding is net 'n paar van die take wat NLP doen.
In die regte wêreld word NLP gebruik vir take, insluitend ontologiebevolking, taalmodellering, sentiment analise, onderwerponttrekking, benoemde entiteitsherkenning, spraakgedeelte-etikettering, konneksieonttrekking, masjienvertaling en geoutomatiseerde vraagbeantwoording.
Wat is Natuurlike Taalbegrip?
'n Klein gedeelte van natuurlike taalverwerking is natuurlike taalbegrip. Nadat die taal vereenvoudig is, moet die rekenaarsagteware verstaan, betekenis aflei en moontlik selfs sentimentanalise uitvoer.
Dieselfde teks kan verskeie betekenisse hê, verskeie frases kan dieselfde betekenis hê, of die betekenis kan verander na gelang van die omstandighede.
NLU-algoritmes gebruik berekeningsmetodes om teks uit baie bronne te verwerk om die invoerteks te verstaan, wat so basies kan wees soos om te weet wat 'n frase beteken of so ingewikkeld soos die interpretasie van 'n gesprek tussen twee individue.
Jou teks word omskep in 'n masjienleesbare formaat. As gevolg hiervan gebruik NLU rekenaartegnieke om die teks te ontsyfer en 'n resultaat te genereer.
NLU kan in 'n verskeidenheid situasies toegepas word, soos om 'n gesprek tussen twee mense te verstaan, te bepaal hoe iemand oor 'n sekere omstandigheid voel, en ander situasies van 'n soortgelyke aard.
Daar is veral vier taalvlakke om NLU te begryp:
- Sintaksis: Dit is die proses om te bepaal of die grammatika gepas gebruik word en hoe sinne saamgestel word. Byvoorbeeld, 'n sin se konteks en grammatika moet in ag geneem word om te bepaal of dit sin maak.
- Semantiek: Wanneer ons die teks ondersoek, is kontekstuele betekenisnuanses soos werkwoordtenoor of woordkeuse tussen twee persone daar. Hierdie stukkies inligting kan ook deur 'n NLU-algoritme gebruik word om uitkomste te verskaf van enige scenario waarin dieselfde gesproke woord gebruik kan word.
- Woordbetekenis-ondubbelsinnigheid: Dit is die proses om uit te vind wat elke woord in 'n frase beteken. Afhangende van die konteks gee dit 'n term sy betekenis.
- Pragmatiese analise: Dit help om die opset en doel van die werk te begryp.
NLU is betekenisvol vir data wetenskaplikes want daarsonder het hulle nie die vermoë om betekenis uit tegnologieë soos kletsbotte en spraakherkenningsagteware te onttrek nie.
Mense is immers gewoond daaraan om 'n gesprek te voer met 'n spraak-geaktiveerde bot; rekenaars, aan die ander kant, het nie hierdie luukse van gemak nie.
Daarbenewens kan NLU emosies en vloekwoorde in 'n toespraak herken presies soos jy kan. Dit impliseer dat datawetenskaplikes verskeie inhoudformate nuttig kan ondersoek en teks kan klassifiseer deur die vermoëns van NLU te gebruik.
NLG werk in direkte opposisie met natuurlike taalbegrip, wat daarop gemik is om ongestruktureerde data te organiseer en sin te maak om dit in bruikbare data te omskep. Kom ons definieer dan NLG en ondersoek die maniere waarop datawetenskaplikes dit in praktiese gebruiksgevalle gebruik.
Wat is natuurlike taalgenerering?
Natuurlike taalverwerking sluit ook natuurlike taalproduksie in. Rekenaars kan skryf deur natuurlike taalproduksie te gebruik, maar natuurlike taalbegrip fokus op leesbegrip.
Deur sekere data-invoer te gebruik, skep NLG 'n geskrewe antwoord in mensetaal. Teks-na-spraak dienste kan ook gebruik word om hierdie teks in spraak te omskep.
Wanneer datawetenskaplikes 'n NLG-stelsel van data voorsien, ontleed die stelsel die data om narratiewe te produseer wat deur dialoog begryp kan word.
In wese skakel NLG datastelle om in 'n taal wat ons albei verstaan, natuurlike taal genoem. Sodat dit uitset kan lewer wat noukeurig bestudeer en akkuraat is tot die maksimum mate moontlik, is NLG toegerus met die ervaring van 'n werklike mens.
Hierdie metode, wat teruggevoer kan word na sommige van Alan Turing se geskrifte wat ons reeds bespreek het, is van kardinale belang om mense te oortuig dat 'n rekenaar op 'n geloofwaardige en natuurlike manier met hulle gesels, ongeag die onderwerp ter sprake.
NLG kan deur organisasies gebruik word om gespreksnarratiewe te produseer wat deur almal binne die maatskappy gebruik kan word.
NLG, wat die meeste gebruik word vir besigheidsintelligensie-kontroleskerms, outomatiese inhoudproduksie en meer effektiewe data-analise, kan 'n groot hulp wees vir professionele persone wat in afdelings soos bemarking, menslike hulpbronne, verkope en inligtingstegnologie werk.
Watter rol speel NLU en NGL in NLP?
NLP kan gebruik word deur data wetenskaplikes en kunsmatige intelligensie professionele persone om ongestruktureerde datastelle om te skakel in vorms wat rekenaars na spraak en teks kan vertaal – hulle kan selfs antwoorde konstrueer wat kontekstueel toepaslik is vir 'n vraag wat jy hulle vra (dink weer terug aan virtuele assistente soos Siri en Alexa).
Maar waar pas NLU en NLG by NLP in?
Al speel hulle almal verskillende rolle, het al drie hierdie dissiplines een ding in gemeen: hulle handel almal oor natuurlike taal. So, wat is die onderskeid tussen die drie?
Beskou dit so: terwyl NLU daarop gemik is om die taal wat mense gebruik te verstaan, identifiseer NLP die belangrikste data en organiseer dit in dinge soos teks en syfers.
Dit kan selfs help met skadelike geïnkripteer kommunikasie. NLG, aan die ander kant, gebruik versamelings van ongestruktureerde data om stories te produseer wat ons as betekenisvol kan interpreteer.
Toekoms van NLP
Alhoewel NLP tans talle kommersiële gebruike het, het baie besighede dit moeilik gevind om dit breedweg aan te neem.
Dit is meestal as gevolg van die volgende kwessies: Een kwessie wat organisasies gereeld raak, is inligtingoorlading, wat dit vir hulle uitdagend maak om te identifiseer watter datastelle deurslaggewend is te midde van 'n oënskynlik oneindige see van meer data.
Om NLP effektief te gebruik, benodig organisasies ook gereeld sekere metodes en toerusting wat hulle in staat stel om waardevolle inligting uit data te onttrek.
Laastens, maar nie die minste nie, impliseer NLP dat maatskappye die nuutste masjinerie benodig as hulle versamelings van data uit verskeie databronne wil hanteer en behou deur NLP te gebruik.
Ten spyte van struikelblokke wat die grootste deel van die firmas daarvan weerhou om NLP aan te neem, blyk dit waarskynlik dat hierdie selfde organisasies uiteindelik NLP, NLU en NLG sal omhels om hul robotte in staat te stel om realistiese, mensagtige interaksies en besprekings te onderhou.
Semantiek en sintaksis is twee NLP-subvelde van navorsing wat baie aandag geniet.
Gevolgtrekking
Met inagneming van wat ons tot dusver bespreek het: Deur betekenis aan stem en skryf toe te ken, lees en verstaan NLU natuurlike taal, en NLG ontwikkel en voer nuwe taal met behulp van masjiene uit.
Taal word deur NLU gebruik om feite te onttrek, terwyl NLG die insigte wat NLU verkry gebruik om natuurlike taal te produseer.
Wees op die uitkyk vir groot rolspelers in die IT-bedryf soos Apple, Google en Amazon om voort te gaan om in NLP te belê sodat hulle kan stelsels ontwikkel wat menslike gedrag naboots.
Lewer Kommentaar