Гарчиг[Нуух][Үзүүлэх]
Бид үгийг сонсох, унших бүртээ хувь хүн, газар нутаг, байршил, үнэ цэнэ гэх мэт зүйлсийг таньж, ангилах төрөлхийн чадвартай. Хүмүүс үгсийг хурдан ангилж, ялгаж, ойлгох чадвартай байдаг.
Жишээлбэл, та "Стив Жобс" гэсэн нэрийг сонсоод объектыг ангилж, дор хаяж XNUMX-XNUMX чанарыг хурдан гаргаж чадна.
- Хүн: "Стив Жобс"
- Байгууллага: "Apple"
- Байршил: "Калифорни"
Компьютерт энэ төрөлхийн чадвар дутагдаж байгаа тул бид үг, текстийг таньж, ангилахад нь туслах ёстой. Нэрлэсэн аж ахуйн нэгжийг хүлээн зөвшөөрөх (NER) нь энэ нөхцөлд ашиглагддаг.
Энэ нийтлэлд бид NER (Нэрлэсэн аж ахуйн нэгжийг таних)-ийн ач холбогдол, ашиг тус, шилдэг NER API болон бусад зүйлийг нарийвчлан судлах болно.
NER (Нэрлэсэн аж ахуйн нэгжийг таних) гэж юу вэ?
Байгалийн хэлээр боловсруулах (NLP) арга нь нэрлэсэн аж ахуйн нэгжийг таних (NER), заримдаа аж ахуйн нэгжийг таних эсвэл аж ахуйн нэгжийг задлах гэж нэрлэдэг бөгөөд текст дэх нэрлэгдсэн нэгжүүдийг автоматаар таньж, урьдчилан тодорхойлсон ангилалд бүлэглэдэг.
Аж ахуйн нэгжид хувь хүн, бүлэг, газар, огноо, дүн, долларын дүн, хувь гэх мэт нэрс орно. Нэрлэсэн аж ахуйн нэгжийг хүлээн зөвшөөрснөөр та өгөгдлийн сангийн чухал мэдээлэл цуглуулах эсвэл баримт бичиг юу болохыг ойлгохын тулд чухал мэдээллийг задлахад ашиглах боломжтой.
NER бол NLP нь текстийн аналитик үйл явцад мэдэгдэхүйц ахиц дэвшил гаргасан ч гэсэн текстийг харьцангуй утга санаа, мэдрэмжийн үүднээс шинжлэхийн тулд AI системээс хамаардаг тулгын чулуу юм.
NER-ийн ач холбогдол юу вэ?
Текстийн аналитик аргын үндэс нь NER юм. ML загвар нь англи хэлийг ойлгохын тулд эхлээд урьдчилан тодорхойлсон категори бүхий сая сая дээжийг өгөх ёстой.
API нь анх удаа уншиж буй текст дээрх эдгээр бүрэлдэхүүн хэсгүүдийг танихдаа цаг хугацаа өнгөрөх тусам сайжирдаг. Текстийн аналитик хөдөлгүүрийн хүч нь NER чадварын чадвар, хүч чадлаар нэмэгддэг.
Эндээс харахад NER хэд хэдэн ML үйлдлүүдийг өдөөдөг.
Семаль хайлт
Одоо Google дээр семантик хайлт хийх боломжтой. Та асуулт оруулах боломжтой бөгөөд энэ нь хариултаар хариулахыг хичээх болно. Мэдээллийг олохын тулд хэрэглэгч хайж байгаа дижитал туслахууд болох Alexa, Siri, чатботууд болон бусад төрлийн семантик хайлтыг ашигладаг.
Энэ функцийг цохих эсвэл алдах боломжтой, гэхдээ үүнийг ашиглах нь улам бүр нэмэгдэж, үр нөлөө нь хурдацтай нэмэгдэж байна.
Өгөгдлийн анализ
Энэ нь бүтэцгүй өгөгдлөөс дүн шинжилгээ хийх алгоритмыг ашиглах ерөнхий хэллэг юм. Энэ нь эдгээр өгөгдлийг харуулах аргуудыг холбогдох өгөгдлийг хайж олох, цуглуулах үйл явцтай нэгтгэдэг.
Энэ нь үр дүнгийн статистикийн шууд тайлбар эсвэл өгөгдлийн дүрслэл хэлбэрээр байж болно. Тодорхой сэдвийг сонирхож буй байдал, оролцооны дүн шинжилгээг үзэгчид тодорхой видеог дарах зэрэг YouTube-ийн үзвэрийн мэдээллийг ашиглан хийж болно.
Бүтээгдэхүүний одны үнэлгээг цахим худалдааны сайтуудаас өгөгдөл хусах замаар дүн шинжилгээ хийж, тухайн бүтээгдэхүүн хэр сайн ажиллаж байгаа талаар ерөнхий үнэлгээ өгөх боломжтой.
Сэтгэлийн дүн шинжилгээ
NER-ийг цаашид судлах, сэтгэл хөдлөлийн шинжилгээ Оддын үнэлгээний мэдээлэл байхгүй байсан ч сайн, муу шүүмжийг ялгаж чаддаг.
"Хэт үнэлэгдсэн", "хөгжилтэй", "тэнэг" гэх мэт нэр томъёо нь сөрөг утгатай, харин "ашигтай", "хурдан", "хялбар" гэх мэт үгсийг ойлгодог. "Хялбар" гэдэг үгийг компьютер тоглоомд сөрөг байдлаар тайлбарлаж болно.
Нарийн алгоритмууд нь юмс хоорондын хамаарлыг таньж чаддаг.
Текст анализ
Өгөгдлийн аналитиктай адил текстийн шинжилгээ нь бүтэцгүй текстийн мөрүүдээс мэдээллийг гаргаж авч, чухал өгөгдлийг тэглэхийн тулд NER ашигладаг.
Энэ нь бүтээгдэхүүний дурьдсан мэдээлэл, дундаж үнэ эсвэл тодорхой брэндийг тодорхойлохдоо хэрэглэгчдийн хамгийн их ашигладаг нэр томъёоны мэдээллийг нэгтгэхэд ашиглаж болно.
Видео агуулгын шинжилгээ
Хамгийн төвөгтэй систем бол царай таних, дууны шинжилгээ, зураг таних зэргийг ашиглан видео мэдээллээс өгөгдөл гаргаж авдаг системүүд юм.
Видео агуулгын шинжилгээг ашигласнаар та YouTube-ийн "хайрцагнаас задлах" видео, Twitch тоглоомын үзүүлбэр, Reels дээрх аудио материалын уруулын синк болон бусад зүйлийг олох боломжтой.
Онлайн видео материалын хэмжээ өсөхийн хэрээр хүмүүс таны бүтээгдэхүүн, үйлчилгээтэй хэрхэн холбогдож байгаа талаарх чухал мэдээллийг алдахаас зайлсхийхийн тулд NER-д суурилсан видео агуулгын дүн шинжилгээ хийх илүү хурдан бөгөөд илүү шинэлэг арга техникийг ашиглах нь чухал юм.
NER-ийн бодит хэрэглээ
Нэрлэсэн аж ахуйн нэгжийг хүлээн зөвшөөрөх (NER) нь хүмүүсийн нэр, байршил, брэнд, мөнгөний үнэ цэнэ гэх мэт текст дэх чухал талуудыг тодорхойлдог.
Текст дэх үндсэн нэгжүүдийг задлах нь бүтэцгүй өгөгдлийг эрэмбэлэх, томоохон мэдээллийн багцтай ажиллахад чухал ач холбогдолтой мэдээллийг илрүүлэхэд тусалдаг.
Нэрлэсэн аж ахуйн нэгжийг хүлээн зөвшөөрөх зарим гайхалтай бодит жишээнүүд энд байна:
Хэрэглэгчийн санал хүсэлтэд дүн шинжилгээ хийх
Онлайн тойм нь хэрэглэгчдийн санал хүсэлтийн гайхалтай эх сурвалж бөгөөд таны барааг худалдан авагчид юунд дуртай, үзэн яддаг, мөн танай компанийн аль хэсгийг сайжруулах шаардлагатай байгаа талаар дэлгэрэнгүй мэдээлэл өгөх боломжтой.
Үйлчлүүлэгчийн энэ бүх оролтыг NER системийг ашиглан зохион байгуулж болох бөгөөд энэ нь мөн дахин гарч буй асуудлуудыг тодорхойлох боломжтой.
Жишээлбэл, үйлчлүүлэгчийн таагүй шүүмжлэлд байнга дурдагддаг газруудыг тодорхойлохын тулд NER-ийг ашигласнаар та тодорхой оффисын салбарт анхаарлаа төвлөрүүлэхээр шийдэж болно.
Агуулгын талаархи зөвлөмж
Таны уншиж буй нийтлэлтэй холбогдсон нийтлэлүүдийн жагсаалтыг BBC, CNN зэрэг вэбсайтуудаас уншиж байхдаа олж болно.
Эдгээр вэб сайтууд нь NER ашиглан таны уншиж буй контентоос гаргаж авсан аж ахуйн нэгжүүдийн талаарх мэдээллийг санал болгодог нэмэлт вэбсайтуудад зөвлөмж өгдөг.
Хэрэглэгчийн тусламжийн тасалбарыг зохион байгуул
Хэрэв та үйлчлүүлэгчдээс үзүүлэх тусламжийн тасалбарын тоог нэмэгдүүлж байгаа бол үйлчлүүлэгчийн хүсэлтэд илүү хурдан хариу өгөхийн тулд нэрлэгдсэн аж ахуйн нэгжийг таних алгоритмуудыг ашиглаж болно.
Хэрэглэгчийн гомдол, лавлагааг ангилах гэх мэт цаг хугацаа шаардсан үйлчлүүлэгчийн тусламж үйлчилгээний ажлыг автоматжуулж, мөнгөө хэмнэж, үйлчлүүлэгчийн аз жаргалыг нэмэгдүүлж, шийдвэрлэлтийн түвшинг нэмэгдүүлнэ.
Аж ахуйн нэгжийн олборлолтыг бүтээгдэхүүний нэр эсвэл серийн дугаар зэрэг холбогдох өгөгдлийг гаргаж авахад ашиглаж болох бөгөөд энэ асуудлыг шийдвэрлэхийн тулд тасалбарыг зөв агент эсвэл баг руу чиглүүлэхэд хялбар болгох боломжтой.
Хайлтын алгоритм
Сая сая мэдээлэл бүхий вэбсайтууд таны хайлтанд тохирох үр дүнг хэрхэн гаргаж чадах талаар та хэзээ нэгэн цагт асууж байсан уу? Википедиа вэбсайтыг авч үзье.
Википедиа нь "ажлын байр" гэсэн үгтэй бүх нийтлэлийг буцаахын оронд таныг "ажлын байр" гэж хайхад хайлтын нэр томъёонд хамаарах урьдчилан тодорхойлсон нэгжүүдийг агуулсан хуудсыг харуулдаг.
Тиймээс Википедиа нь "мэргэжил" гэсэн өгүүллийн холбоосыг санал болгож байна, Jobs нэртэй хүмүүст зориулсан хэсэг, кино, видео тоглоом, болон "ажлын байр" гэсэн нэр томъёо гарч ирсэн зугаа цэнгэлийн бусад хэлбэрүүд.
Та хайлтын үг агуулсан байршлын өөр сегментийг харах болно.
Анкетуудад анхаарал тавих
Хамгийн тохиромжтой ажил горилогчийг хайж олохын тулд ажилд зуучлагчид өдрийн ихэнх хэсгийг анкетаа шалгахад зарцуулдаг. Товч намтар бүр ижил мэдээлэлтэй боловч тэдгээр нь бүгд өөр өөр байдлаар танилцуулагдаж, зохион байгуулагддаг нь бүтэцгүй өгөгдлийн ердийн жишээ юм.
Нэр дэвшигчдийн талаарх хамгийн хамааралтай мэдээллийг хувийн мэдээлэл (нэр, хаяг, утасны дугаар, төрсөн огноо, цахим шуудан гэх мэт) болон тэдний боловсрол, туршлага (гэрчилгээ, зэрэг гэх мэт) зэрэг аж ахуйн нэгжийн олборлогчийг ашиглан ажилд авах багууд хурдан гаргаж авах боломжтой. , компанийн нэр, ур чадвар гэх мэт).
Имэйл-худалдаа
Бүтээгдэхүүний хайлтын алгоритмын тухайд, олон зуун эсвэл олон мянган бараатай онлайн жижиглэн худалдаачид NER-ээс ашиг хүртэх болно.
NER байхгүй бол "хар савхин гутал" гэж хайвал хар биш арьс, гутлын аль алиныг нь багтаасан үр дүн гарах болно. Хэрэв тийм бол цахим худалдааны вэбсайтууд үйлчлүүлэгчдээ алдах эрсдэлтэй.
IМанай тохиолдолд NER хайлтын үгийг савхин гутлын бүтээгдэхүүний төрөл, хар өнгө гэж ангилдаг.
Шилдэг аж ахуйн нэгжийн олборлолтын API
Google Cloud NLP
Аль хэдийн бэлтгэгдсэн хэрэгслүүдийн хувьд Google Cloud NLP нь байгалийн хэлний API-г өгдөг. Эсвэл AutoML Natural Language API нь олон төрлийн текст задлах, дүн шинжилгээ хийхэд тохиромжтой бөгөөд хэрэв та өөрийн багаж хэрэгслийг салбарынхаа нэр томьёоны талаар сургахыг хүсвэл.
API-ууд нь Gmail, Google Sheets болон Google-ийн бусад апп-уудтай амархан харьцдаг боловч тэдгээрийг гуравдагч талын програмуудтай ашиглахад илүү төвөгтэй код хэрэгтэй болно.
Бизнесийн хамгийн тохиромжтой сонголт бол Google програмууд болон Cloud Storage-ийг удирддаг үйлчилгээ болон API болгон холбох явдал юм.
IBM Ватсон
IBM Watson нь маш хурдан ажилладаг олон үүлэн платформ бөгөөд ярианаас текст рүү шилжих гэх мэт урьдчилан бүтээгдсэн чадавхийг хангадаг бөгөөд энэ нь бичигдсэн аудио болон утасны дуудлагыг автоматаар шинжлэх боломжтой гайхалтай програм хангамж юм.
CSV өгөгдлийг ашигласнаар Watson Natural Language Understanding-ийн гүнзгий суралцах хиймэл оюун ухаан нь аж ахуйн нэгж эсвэл түлхүүр үгсийг задлах задлах загваруудыг бий болгож чадна.
Мөн дадлага хийснээр та хамаагүй илүү боловсронгуй загваруудыг бий болгож чадна. Түүний бүх функцийг API-ээр дамжуулан ашиглах боломжтой боловч кодчиллын өргөн мэдлэг шаардлагатай.
Энэ нь асар их мэдээллийн багцыг шалгах шаардлагатай, дотоод техникийн нөөцтэй томоохон бизнесүүдэд сайн ажилладаг.
Cortical.io
Неврологийн ойлголт болох семантик нугалах аргыг ашиглан Cortical.io текст задлах болон NLU шийдлүүдийг өгдөг.
Энэ нь текстийн утгыг бүхэлд нь болон тодорхой нэр томъёогоор илэрхийлдэг "семантик хурууны хээ"-г бий болгохын тулд хийгддэг. Үгсийн кластер хоорондын хамаарлыг харуулахын тулд семантик хурууны хээ нь текстийн өгөгдлийг дүрсэлдэг.
Cortical.io-ийн интерактив API баримт бичиг нь текст шинжилгээний шийдэл бүрийн функцийг хамардаг бөгөөд Java, Python, Javascript API ашиглан хандахад хялбар байдаг.
Cortical.io-ийн Contract Intelligence хэрэгсэл нь семантик хайлт хийх, сканнердсан баримт бичгүүдийг хувиргах, тайлбар өгөхөд туслах, сайжруулах зорилгоор хууль эрх зүйн шинжилгээнд зориулж тусгайлан бүтээгдсэн.
Энэ нь хиймэл оюун ухааны мэдлэг шаардлагагүй, ялангуяа хуулийн салбарт ашиглахад хялбар API хайж буй бизнесүүдэд тохиромжтой.
Сармагчин сур
Компьютерийн бүх гол хэлийг MonkeyLearn-ийн API-ууд дэмждэг бөгөөд таны гаргаж авсан объектуудыг агуулсан JSON файл үүсгэхийн тулд хэдхэн мөр кодыг тохируулдаг. Урьдчилан сургалтанд хамрагдсан олборлогч болон текстийн шинжээчдийн хувьд интерфэйс нь хэрэглэгчдэд ээлтэй.
Эсвэл хэдхэн энгийн алхмаар та өвөрмөц олборлогч үүсгэж болно. Цаг хугацааг багасгаж, нарийвчлалыг сайжруулахын тулд байгалийн хэлний дэвшилтэт боловсруулалт (NLP) -ийг гүнзгийрүүлсэн машин суралцах нь текстийг хүн шиг үнэлэх боломжийг танд олгоно.
Нэмж дурдахад, SaaS API-ууд нь Google Sheets, Excel, Zapier, Zendesk болон бусад хэрэгслүүдтэй холболт тогтооход компьютерийн шинжлэх ухааны олон жилийн мэдлэг шаарддаггүй.
Одоогоор таны хөтөч дээр нэр олборлогч, компанийн олборлогч, байршил олборлогч ашиглах боломжтой. Өөрийгөө хэрхэн бүтээх тухай мэдээллийг нэрлэсэн аж ахуйн нэгжийг таних блог нийтлэлээс үзнэ үү.
Энэ нь технологи, жижиглэнгийн худалдаа, цахим худалдааны чиглэлээр үйл ажиллагаа явуулдаг бүх төрлийн бизнесүүдэд тохиромжтой бөгөөд текст задлах, текст дүн шинжилгээ хийх янз бүрийн төрлийн API-г ашиглахад хялбар байдаг.
Amazon Comprehend
Amazon Comprehend-ийн урьдчилан бүтээсэн хэрэгслүүдийг шууд холбож, ашиглахад хялбар болгохын тулд тэдгээрийг олон зуун өөр чиглэлээр сургадаг.
Энэ нь хяналттай үйлчилгээ учраас дотоод сервер шаардлагагүй. Ялангуяа та Amazon-ийн клоудыг тодорхой түвшинд ашиглаж байгаа бол тэдгээрийн API нь өмнө нь байсан програмуудтай амархан нэгтгэгддэг. Мөн бага зэрэг илүү бэлтгэл хийснээр олборлолтын нарийвчлалыг нэмэгдүүлэх боломжтой.
Эмнэлгийн бүртгэл, эмнэлзүйн туршилтаас мэдээлэл авах хамгийн найдвартай текстийн шинжилгээний аргуудын нэг бол Comprehend's Medical Named Entity and Relationship Extraction (NERe) бөгөөд эм, нөхцөл, шинжилгээний үр дүн, процедурын талаар дэлгэрэнгүй мэдээлэл авах боломжтой.
Оношийг үнэлэх, нарийн тааруулахын тулд өвчтөний өгөгдлийг харьцуулах нь маш ашигтай байж болно. Урьдчилан бэлтгэгдсэн багаж хэрэгслээр удирддаг үйлчилгээг хайж буй бизнес эрхлэгчдэд зориулсан хамгийн сайн сонголт.
Айлиен
AYLIEN нь хүчирхэг машин сурах текстийн шинжилгээнд хялбар нэвтрэх боломжийг олгохын тулд долоон алдартай програмчлалын хэл дээр гурван API залгаасыг санал болгодог.
Тэдний News API нь дэлхийн өнцөг булан бүрээс хэдэн арван мянган мэдээний эх сурвалжаас бодит цагийн хайлт, аж ахуйн нэгжийн олборлолтыг хангадаг.
Баримт бичиг дээрх Text Analysis API ашиглан объект задлах болон бусад хэд хэдэн текст дүн шинжилгээ хийх ажлыг хийж болно. олон нийтийн сүлжээ платформ, хэрэглэгчийн судалгаа гэх мэт.
Эцэст нь, Текст шинжилгээний платформыг ашигласнаар та хөтчдөө (TAP) өөрийн олборлогчийг үүсгэж болно. Энэ нь үндсэндээ тогтмол API-г хурдан нэгтгэх шаардлагатай компаниудад сайн ажилладаг.
SpaCy
SpaCy бол Python Natural Language Processing (NLP) багц бөгөөд нээлттэй эх сурвалжтай, үнэ төлбөргүй бөгөөд олон тооны суулгасан функцуудтай.
Энэ нь улам бүр түгээмэл болж байна NLP өгөгдөл боловсруулах, дүн шинжилгээ хийх. Бүтэцгүй текстийн өгөгдөл нь асар их хэмжээгээр бүтээгдсэн тул түүнд дүн шинжилгээ хийж, түүнээс ойлголт авах нь маш чухал юм.
Үүнийг хэрэгжүүлэхийн тулд та баримтуудыг компьютер ойлгохуйцаар дүрслэн харуулах ёстой. Та үүнийг NLP-ээр дамжуулан хийж болно. Энэ нь маш хурдан бөгөөд ердөө 30 мс-ийн хоцрогдолтой боловч хамгийн чухал нь HTTPS хуудастай ашиглахад зориулагдаагүй юм.
Энэ нь дотооддоо ажилладаг тул өөрийн сервер эсвэл дотоод сүлжээгээ сканнердах сайхан сонголт боловч интернетийг бүхэлд нь судлах хэрэгсэл биш юм.
Дүгнэлт
Нэрлэсэн аж ахуйн нэгжийг таних систем (NER) нь бизнес эрхлэгчид хэрэглэгчийн тусламжийн хүсэлтэд холбогдох мэдээллийг шошголох, хэрэглэгчийн санал хүсэлтэд дурдсан байгууллагуудыг хайж олох, холбоо барих мэдээлэл, байршил, огноо гэх мэт чухал өгөгдлийг хурдан гаргаж авах боломжтой систем юм.
Аж ахуйн нэгжийг хүлээн зөвшөөрөх хамгийн түгээмэл арга бол аж ахуйн нэгжийн олборлолтын API ашиглах явдал юм (нээлттэй эхийн номын сангууд эсвэл SaaS бүтээгдэхүүнээр хангагдсан эсэх).
Гэсэн хэдий ч хамгийн сайн хувилбарыг сонгох нь таны цаг хугацаа, санхүү, ур чадвараас хамаарна. Аливаа бизнесийн хувьд аж ахуйн нэгжийг задлах, илүү боловсронгуй текст шинжилгээний технологи нь давуу талтай байх нь ойлгомжтой.
Машин сургалтын хэрэгслийг зөв зааж сургавал тэдгээр нь үнэн зөв бөгөөд ямар ч өгөгдлийг үл тоомсорлодоггүй тул цаг хугацаа, мөнгөө хэмнэдэг. Та API-г нэгтгэснээр эдгээр шийдлүүдийг тасралтгүй, автоматаар ажиллуулахаар тохируулах боломжтой.
Танай компанид тохирох үйл ажиллагааны чиглэлийг сонгоход л хангалттай.
хариу үлдээх