Мундариҷа[Пинҳон кардан][Намоиш]
Мо қобилияти модарзодии шинохтан ва тасниф кардани калимаҳоро ба шахсони алоҳида, ҷойҳо, маконҳо, арзишҳо ва ғайра дорем, вақте ки онҳоро мешунавем ё мехонем. Одамон метавонанд калимаҳоро зуд гурӯҳбандӣ кунанд, муайян кунанд ва дарк кунанд.
Масалан, вақте ки шумо номи "Стив Ҷобс" -ро мешунавед, шумо метавонед объектро гурӯҳбандӣ кунед ва ба зудӣ ҳадди аққал се-чор хислатро пайдо кунед.
- Шахс: "Стив Ҷобс"
- Ташкилот: Apple
- Макон: "Калифорния"
Азбаски компютерҳо ин маҳорати модарзодӣ надоранд, мо бояд ба онҳо дар шинохти калимаҳо ё матн ва тасниф кардани он кумак кунем. Дар ин вазъият Шиносоии номбаршуда (NER) истифода мешавад.
Дар ин мақола, мо NER-ро (Шиноёти номбаршуда) ба таври муфассал баррасӣ хоҳем кард, аз ҷумла аҳамияти он, манфиатҳо, API-ҳои беҳтарини NER ва ғайра.
NER (Эътироф кардани объекти номбаршуда) чист?
Равиши коркарди забони табиӣ (NLP), ки бо номи шинохти номбаршуда (NER) маъруф аст, ки баъзан бо номи шахсият ё истихроҷи объект маълум аст, объектҳои номбаршударо дар матн ба таври худкор эътироф мекунад ва онҳоро ба категорияҳои пешакӣ муайяншуда гурӯҳбандӣ мекунад.
Ба субъектҳо номҳои шахсони алоҳида, гурӯҳҳо, ҷойҳо, санаҳо, маблағҳо, маблағи доллар, фоизҳо ва ғайра дохил мешаванд. Бо эътирофи субъекти номбаршуда, шумо метавонед онро барои ҷамъоварии маълумоти муҳим барои пойгоҳи додаҳо ё истихроҷи иттилооти муҳим барои фаҳмидани он, ки ҳуҷҷат дар бораи он истифода баред.
NER санги асосест, ки системаи AI барои таҳлили матн барои семантикаи нисбӣ ва эҳсосот вобаста аст, ҳатто агар NLP пешрафти назаррасро дар раванди таҳлили матн нишон диҳад.
Аҳамияти NER чист?
Асоси равиши таҳлили матн NER мебошад. Модели ML дар аввал бояд миллионҳо намуна бо категорияҳои пешакӣ муайяншуда дода шавад, то он ки забони англисиро фаҳмад.
API бо мурури замон дар шинохти ин ҷузъҳо дар матнҳое, ки бори аввал мехонанд, такмил меёбад. Қувваи муҳаррики таҳлилии матн бо салоҳият ва тавоноии NER меафзояд.
Тавре ки дар ин ҷо дида мешавад, якчанд амалиёти ML аз ҷониби NER оғоз мешавад.
Ҷустуҷӯи семантикӣ
Ҷустуҷӯи семантикӣ ҳоло дар Google дастрас аст. Шумо метавонед саволе ворид кунед ва он кӯшиш мекунад, ки бо ҷавоб ҷавоб диҳад. Барои дарёфти маълумот корбар дар ҷустуҷӯи ёрдамчиёни рақамӣ ба монанди Alexa, Siri, чатботҳо ва дигарон як намуди ҷустуҷӯи семантикиро истифода мебаранд.
Ин функсия метавонад зарба занад ё аз даст дода шавад, аммо шумораи афзояндаи истифодаи он вуҷуд дорад ва самаранокии онҳо босуръат меафзояд.
Аналитика маълумот
Ин ибораи умумӣ барои истифодаи алгоритмҳо барои эҷоди таҳлил аз маълумоти сохторнашуда мебошад. Он усулҳои намоиши ин маълумотро бо раванди дарёфт ва ҷамъоварии маълумоти мувофиқ муттаҳид мекунад.
Ин метавонад дар шакли шарҳи оддии омории натиҷаҳо ё муаррифии визуалии маълумот бошад. Таҳлили таваҷҷӯҳ ба мавзӯи муайян ва ҷалби онҳо метавонад бо истифода аз маълумот аз намоишҳои YouTube анҷом дода шавад, аз ҷумла вақте ки тамошобинон видеои мушаххасро пахш мекунанд.
Рейтингҳои ситораҳои маҳсулотро метавон бо истифода аз скрепинги маълумот аз сайтҳои тиҷорати электронӣ таҳлил кард, то баҳои умумии он то чӣ андоза хуб кор карда истодааст.
Таҳлили ҳиссиёт
Таҳқиқи минбаъдаи NER, таҳлили таҳлил метавонад байни баррасиҳои хуб ва бад ҳатто дар сурати набудани маълумот аз рейтингҳои ситораҳо фарқ кунад.
Маълум аст, ки истилоҳот ба монанди "аз ҳад зиёд арзёбӣ", "беақл" ва "беақл" маънои манфӣ доранд, дар ҳоле ки истилоҳот ба монанди "фоида", "тез" ва "осон" доранд. Калимаи «осон»-ро дар бозии компютерӣ манфӣ маънидод кардан мумкин аст.
Алгоритмҳои мураккаб инчунин метавонанд муносибати байни ашёро эътироф кунанд.
Таҳлили матн
Монанди таҳлили додаҳо, таҳлили матн маълумотро аз сатрҳои матнии сохторнашуда истихроҷ мекунад ва NER-ро барои сифр кардани маълумоти муҳим истифода мебарад.
Он метавонад барои ҷамъоварӣ кардани маълумот дар бораи зикри маҳсулот, нархи миёна ё истилоҳоте, ки муштариён аксар вақт барои тавсифи бренди муайян истифода мебаранд, истифода шавад.
Таҳлили мундариҷаи видео
Мушкилтарин системаҳоест, ки аз иттилооти видеоӣ бо истифода аз шинохти чеҳра, таҳлили аудио ва шинохти тасвир маълумот мегиранд.
Бо истифода аз таҳлили мундариҷаи видео, шумо метавонед видеоҳои "қуттии кушода" -и YouTube, намоишҳои бозии Twitch, ҳамоҳангсозии лабҳои маводи аудиоии худро дар Reels ва ғайра пайдо кунед.
Барои аз даст додани маълумоти муҳим дар бораи он ки чӣ тавр одамон ба маҳсулот ё хидмати шумо пайваст мешаванд, бо афзоиши ҳаҷми маводи видеоии онлайн, усулҳои тезтар ва ихтироъкоронатар барои таҳлили мундариҷаи видео дар асоси NER муҳиманд.
Барномаи воқеии NER
Шиносоии субъекти номбаршуда (NER) ҷанбаҳои муҳими матнро ба монанди номи одамон, маконҳо, брендҳо, арзишҳои пулӣ ва ғайра муайян мекунад.
Истихроҷи объектҳои асосӣ дар матн дар ҷудо кардани маълумоти сохторнашуда ва ошкор кардани иттилооти муҳим, ки ҳангоми кор бо маҷмӯи додаҳои калон муҳим аст, кӯмак мекунад.
Инҳоянд баъзе мисолҳои ҷолиби воқеии эътирофи субъектҳои номбаршуда:
Таҳлили фикру мулоҳизаҳои муштариён
Баррасиҳои онлайн манбаи афсонавии фикру мулоҳизаҳои истеъмолкунандагон мебошанд, зеро онҳо метавонанд ба шумо маълумоти муфассалро дар бораи он, ки муштариён дар бораи молҳои шумо дӯст медоранд ва нафрат доранд ва инчунин кадом соҳаҳои ширкати шуморо беҳтар кардан лозим аст, пешниҳод кунанд.
Ҳамаи ин вуруди муштариро метавон бо истифода аз системаҳои NER ташкил кард, ки он ҳамчунин метавонад мушкилоти такроршавандаро муайян кунад.
Масалан, бо истифода аз NER барои муайян кардани ҷойҳое, ки аксар вақт дар баррасиҳои номусоиди муштариён зикр мешаванд, шумо метавонед қарор диҳед, ки диққати худро ба як филиали офис равона кунед.
Тавсия барои мундариҷа
Рӯйхати мақолаҳоеро, ки ба мақолае, ки шумо хонда истодаед, дар вебсайтҳои монанди BBC ва CNN ҳангоми хондани мақола пайдо кардан мумкин аст.
Ин вебсайтҳо барои вебсайтҳои иловагӣ тавсия медиҳанд, ки маълумотро дар бораи объектҳое, ки онҳо аз мундариҷае, ки шумо бо истифода аз NER мехонед, гирифтаанд.
Дар Дастгирии муштариён чиптаҳоро ташкил кунед
Агар шумо афзоиши шумораи чиптаҳои дастгирии муштариёнро идора карда истода бошед, шумо метавонед алгоритмҳои шинохти субъектҳои номбаршударо барои зудтар посух додан ба дархостҳои муштарӣ истифода баред.
Автоматикунонии корҳои ғамхории муштариён, аз қабили тасниф кардани шикоятҳо ва дархостҳои муштариён, барои сарфа кардани пул, хушбахтии муштариён ва баланд бардоштани сатҳи ҳалли онҳо.
Истихроҷи объект инчунин метавонад барои истихроҷи маълумоти дахлдор, аз қабили номҳои маҳсулот ё рақамҳои силсилавӣ истифода шавад, то роҳи чиптаҳоро ба агент ё дастаи мувофиқ барои ҳалли ин масъала осонтар кунад.
Алгоритми ҷустуҷӯ
Оё шумо боре савол додаед, ки чӣ гуна вебсайтҳои дорои миллионҳо дона иттилоот метавонанд натиҷаҳои ба ҷустуҷӯи шумо мувофиқро ба даст оранд? Вебсайти Википедиаро баррасӣ кунед.
Википедиа саҳифаеро намоиш медиҳад, ки дорои объектҳои пешакӣ муайяншуда мебошад, ки истилоҳи ҷустуҷӯ метавонад ҳангоми ҷустуҷӯи "корҳо" ба онҳо дахл дошта бошад, ба ҷои баргардонидани ҳама мақолаҳо бо калимаи "кор" дар онҳо.
Ҳамин тариқ, Википедиа истинод ба мақолаеро пешниҳод мекунад, ки "шуғл" -ро муайян мекунад, бахш барои одамоне бо номи Ҷобс ва як минтақаи дигар барои ВАО ба монанди филмҳо, бозии видеои, ва дигар шаклҳои фароғат, ки дар он истилоҳи "корҳо" пайдо мешавад.
Шумо инчунин сегменти дигареро барои маконҳое мебинед, ки калимаи ҷустуҷӯро доранд.
Нигоҳубини резюме
Дар ҷустуҷӯи довталаби идеалӣ, рекрутерҳо қисми зиёди рӯзи худро барои баррасии резюме сарф мекунанд. Ҳар як резюме дорои як маълумот аст, аммо ҳамаи онҳо ба таври гуногун пешниҳод ва ташкил карда мешаванд, ки намунаи маъмулии маълумоти сохторнашуда мебошад.
Маълумоти аз ҳама мувофиқро дар бораи номзадҳо метавон аз ҷониби гурӯҳҳои ҷалбкунанда бо истифода аз истихроҷкунандагони муассиса, аз ҷумла маълумоти шахсӣ (ба монанди ном, суроға, рақами телефон, санаи таваллуд ва почтаи электронӣ) ва маълумот дар бораи таҳсил ва таҷрибаи онҳо (ба монанди сертификатсия, дараҷа) ба даст овардан мумкин аст. , номҳои ширкатҳо, малакаҳо ва ғайра).
E-тиҷорати
Дар робита ба алгоритми ҷустуҷӯи маҳсулот, фурӯшандагони онлайн бо садҳо ё ҳазорҳо молҳо аз NER баҳра хоҳанд бурд.
Бе NER, ҷустуҷӯи "мӯзаҳои чармии сиёҳ" натиҷаҳоеро бармегардонад, ки ҳам чарм ва ҳам пойафзоли сиёҳро дар бар мегирифтанд. Агар ин тавр бошад, вебсайтҳои тиҷорати электронӣ хатари аз даст додани мизоҷонро доранд.
IДар ҳолати мо, NER калимаи ҷустуҷӯро ҳамчун навъи маҳсулот барои мӯзаҳои чармӣ ва сиёҳро ҳамчун ранг гурӯҳбандӣ мекунад.
Беҳтарин APIs Extraction Entity
Google Cloud NLP
Барои абзорҳои аллакай омӯзонидашуда Google Cloud NLP API-и забони табиии худро таъмин мекунад. Ё, API-и AutoML Natural Language барои бисёр намудҳои истихроҷ ва таҳлили матн мутобиқ карда мешавад, агар шумо хоҳед, ки асбобҳои худро дар бораи истилоҳоти соҳаи худ таълим диҳед.
APIҳо бо Gmail, Google Sheets ва дигар барномаҳои Google ба осонӣ ҳамкорӣ мекунанд, аммо истифодаи онҳо бо барномаҳои тарафи сеюм метавонад рамзи мураккабтарро талаб кунад.
Варианти беҳтарини тиҷорат ин пайваст кардани замимаҳои Google ва Cloud Storage ҳамчун хидматҳои идорашаванда ва API мебошад.
IBM Уотсон
IBM Watson як платформаи бисёр абрист, ки бениҳоят зуд иҷро мекунад ва қобилиятҳои қаблан сохташударо таъмин мекунад, аз қабили сухан ба матн, ки нармафзори аҷибест, ки метавонад ба таври худкор зангҳои аудио ва телефонии сабтшударо таҳлил кунад.
Бо истифода аз маълумоти CSV, омӯзиши амиқи AI-и Watson Natural Language Understanding метавонад моделҳои истихроҷро барои истихроҷи объектҳо ё калимаҳои калидӣ эҷод кунад.
Ва бо амалия, шумо метавонед моделҳои хеле мураккабтар эҷод кунед. Ҳама функсияҳои он тавассути APIҳо дастрасанд, гарчанде ки дониши васеи рамзгузорӣ лозим аст.
Он барои тиҷорати калон, ки тафтиши маҷмӯаҳои азими додаҳоро талаб мекунанд ва дорои захираҳои дохилии техникӣ мебошанд, хуб кор мекунад.
Cortical.io
Истифодаи Semantic Folding, мафҳуми неврология, Cortical.io истихроҷи матн ва ҳалли NLU-ро таъмин мекунад.
Ин барои тавлиди "изи ангуштони семантикӣ" анҷом дода мешавад, ки ҳам маънои матнро дар тамоми истилоҳҳо ва ҳам мушаххас нишон медиҳанд. Барои нишон додани муносибатҳои байни кластерҳои калимаҳо, изи ангуштони семантикӣ маълумоти матниро тасвир мекунанд.
Ҳуҷҷатҳои интерактивии API Cortical.io функсияҳои ҳар як ҳалли таҳлили матнро дар бар мегирад ва дастрасӣ бо API-ҳои Java, Python ва Javascript осон аст.
Воситаи иктишофии шартнома аз Cortical.io махсус барои таҳлили ҳуқуқӣ барои анҷом додани ҷустуҷӯҳои семантикӣ, табдил додани ҳуҷҷатҳои сканшуда ва кӯмак ва такмил додани эзоҳ сохта шудааст.
Он барои корхонаҳое, ки дар ҷустуҷӯи API-ҳои оддӣ истифода мешаванд, ки ба дониши AI ниёз надоранд, махсусан дар бахши ҳуқуқӣ беҳтарин аст.
Маймун омӯзед
Ҳама забонҳои асосии компютериро API-ҳои MonkeyLearn дастгирӣ мекунанд ва танҳо чанд сатри кодро барои тавлиди файли JSON, ки дорои объектҳои истихроҷи шумо ҳастанд, насб мекунанд. Барои истихроҷкунандагон ва таҳлилгарони матн, ки омӯзиши қаблӣ доранд, интерфейс барои корбар дӯстона аст.
Ё, танҳо бо чанд қадами оддӣ, шумо метавонед як истихроҷи беназир эҷод кунед. Барои кам кардани вақт ва такмил додани дақиқ, коркарди пешрафтаи забони табиӣ (NLP) бо чуқур омӯзиши машқҳо ба шумо имкон медиҳад, ки матнро ҳамчун шахс арзёбӣ кунед.
Илова бар ин, API-ҳои SaaS кафолат медиҳанд, ки пайвастшавӣ бо абзорҳо ба монанди Google Sheets, Excel, Zapier, Zendesk ва дигарон дониши чандинсолаи илми информатикаро талаб намекунад.
Дар айни замон дар браузери шумо истихроҷи ном, истихроҷи ширкат ва истихроҷи ҷойгиршавӣ мавҷуданд. Барои маълумот дар бораи чӣ гуна сохтани худатон, ба мақолаи блоги шинохтани субъекти номбаршуда нигаред.
Он барои тиҷорати ҳама ҳаҷмҳое, ки ба технология, савдои чакана ва тиҷорати электронӣ машғуланд, беҳтарин аст, ки ба API-ҳои соддаи татбиқшаванда барои намудҳои гуногуни истихроҷи матн ва таҳлили матн ниёз доранд.
Amazon Comprehend
Барои осон кардани васл кардан ва истифодаи асбобҳои қаблан сохташудаи Amazon Comprehend фавран, онҳо дар садҳо соҳаҳои гуногун таълим мегиранд.
Серверҳои дохилӣ талаб карда намешаванд, зеро ин хидмати назоратшаванда аст. Махсусан, агар шумо ҳоло абри Amazon-ро то як дараҷа истифода баред, API-ҳои онҳо ба осонӣ бо барномаҳои қаблан мавҷудбуда ҳамгиро мешаванд. Ва танҳо бо омӯзиши каме бештар, дақиқии истихроҷро метавон баланд кард.
Яке аз усулҳои боэътимоди таҳлили матн барои ба даст овардани маълумот аз сабтҳои тиббӣ ва озмоишҳои клиникӣ ин аст, ки Comprehend's Medical Named Entity and Relationship Extraction (NERe) мебошад, ки метавонад тафсилотро дар бораи доруҳо, шароитҳо, натиҷаҳои санҷиш ва расмиёт ба даст орад.
Ҳангоми муқоисаи маълумоти бемор барои арзёбӣ ва дақиқ кардани ташхис, метавонад хеле муфид бошад. Беҳтарин вариант барои корхонаҳое, ки хидматрасонии идорашавандаро бо абзорҳои қаблан омӯзонидашуда меҷӯянд.
Айлин
Бо мақсади фароҳам овардани дастрасии осон ба таҳлили матнии мустаҳками омӯзиши мошин, AYLIEN се плагини API-ро бо ҳафт забони маъмули барномасозӣ пешниҳод мекунад.
API-и News онҳо дар вақти воқеӣ ҷустуҷӯ ва истихроҷи объектҳоро аз даҳҳо ҳазор манбаъҳои хабарӣ аз саросари ҷаҳон таъмин мекунад.
Истихроҷи ашё ва як қатор дигар вазифаҳои таҳлили матнро метавон бо истифода аз API таҳлили матн дар ҳуҷҷатҳо, ВАО иҷтимоӣ платформаҳо, пурсишҳои истеъмолкунандагон ва ғайра.
Ниҳоят, бо истифода аз Платформаи Таҳлили Матн, шумо метавонед истихроҷи шахсии худро ва мустақиман дар браузери худ эҷод кунед (TAP). Он барои ширкатҳое хуб кор мекунад, ки бояд API-ҳои собитро зуд муттаҳид кунанд.
SpaCy
SpaCy бастаи Python Processing Natural Language (NLP) мебошад, ки сарчашмаи кушода, ройгон ва дорои як тонна хусусиятҳои дарунсохт мебошад.
Он бештар ва бештар маъмул барои Маълумоти NLP коркард ва таҳлил. Маълумоти матнии сохторнашуда дар миқёси бузург эҷод карда мешавад, аз ин рӯ таҳлили он ва гирифтани фаҳмиш аз он муҳим аст.
Барои ноил шудан ба ин, шумо бояд далелҳоро тавре тасвир кунед, ки компютерҳо фаҳманд. Шумо метавонед онро тавассути NLP иҷро кунед. Он бениҳоят зуд аст, бо таъхири ҳамагӣ 30ms, аммо муҳим аст, он барои истифода бо саҳифаҳои HTTPS пешбинӣ нашудааст.
Ин як варианти хуб барои скан кардани серверҳои шахсии шумо ё интранет аст, зеро он ба таври маҳаллӣ кор мекунад, аммо ин восита барои омӯзиши тамоми интернет нест.
хулоса
Шинохти субъекти номбаршуда (NER) як системаест, ки корхонаҳо метавонанд барои нишон додани маълумоти дахлдор дар дархостҳои дастгирии муштариён, пайдо кардани субъектҳои дар фикру мулоҳизаҳои муштариён истинодшуда ва зуд истихроҷи маълумоти муҳим ба монанди тафсилоти тамос, маконҳо ва санаҳо ва ғайра истифода баранд.
Равиши маъмултарин барои шинохтани номи субъектҳо ин истифодаи API-ҳои истихроҷи объект мебошад (хоҳ онҳо аз ҷониби китобхонаҳои кушодаасос ё маҳсулоти SaaS таъмин карда мешаванд).
Аммо, интихоби беҳтарин алтернатива ба вақт, молия ва маҷмӯи маҳорати шумо такя мекунад. Барои ҳама гуна тиҷорат, истихроҷи объект ва технологияҳои мураккабтари таҳлили матн метавонанд ба таври возеҳ фоидаовар бошанд.
Вақте ки асбобҳои омӯзиши мошинсозӣ дуруст таълим дода мешаванд, онҳо дақиқанд ва ҳеҷ гуна маълумотро сарфи назар намекунанд ва вақт ва пулро сарфа мекунанд. Шумо метавонед ин қарорҳоро тавассути ҳамгироии API-ҳо барои пайваста ва ба таври худкор кор кардан танзим кунед.
Танҳо роҳи амалеро интихоб кунед, ки барои ширкати шумо беҳтар аст.
Дин ва мазҳаб