အမည်ပေးထားသည့် Entity Recognition (NER) - အယူအဆ၊ အပလီကေးရှင်းနှင့် API များ

မာတိကာ[ဖျောက်][ရှိုး]

NER (Named Entity Recognition) ဆိုတာဘာလဲ။
NER ရဲ့ အဓိပ္ပါယ်က ဘာလဲ။+-
NER ၏ လက်တွေ့ကမ္ဘာအသုံးချမှု+-
အကောင်းဆုံး Entity Extraction API များ+-
ကောက်ချက်

ကျွန်ုပ်တို့သည် စကားလုံးများကို တစ်ဦးချင်း၊ နေရာများ၊ တည်နေရာများ၊ တန်ဖိုးများနှင့် ၎င်းတို့ကို ကြားရသည့်အခါတိုင်း သို့မဟုတ် ဖတ်သည့်အခါတိုင်းတွင် ခွဲခြားသိမြင်နိုင်သော မွေးရာပါစွမ်းရည်ရှိသည်။ လူသားများသည် စကားလုံးများကို အမျိုးအစားခွဲခြင်း၊ ခွဲခြားသတ်မှတ်ခြင်းနှင့် နားလည်သဘောပေါက်ခြင်းတို့ကို လျင်မြန်စွာလုပ်ဆောင်နိုင်ကြသည်။

ဥပမာအားဖြင့်၊ သင်သည် အရာဝတ္ထုတစ်ခုအား အမျိုးအစားခွဲခြားနိုင်ပြီး “Steve Jobs” ဟူသောအမည်ကို ကြားသောအခါတွင် အနည်းဆုံး အရည်အသွေး သုံးခုမှ လေးခုအထိ လျင်မြန်စွာ ရရှိလာနိုင်သည်။

ပုဂ္ဂိုလ်: "စတိဗ်ဂျော့ဘ်"

အဖွဲ့အစည်း- "Apple"

တည်နေရာ- "ကယ်လီဖိုးနီးယား"

ကွန်ပြူတာများသည် ဤမွေးရာပါ ကျွမ်းကျင်မှု မရှိသောကြောင့်၊ စကားလုံးများ သို့မဟုတ် စာသားများကို ခွဲခြားသိမြင်ပြီး ၎င်းကို အမျိုးအစားခွဲရာတွင် ကူညီပေးရပါမည်။ Entity Recognition (NER) ကို ဤအခြေအနေတွင် အသုံးပြုသည်။

ဤဆောင်းပါးတွင်၊ ၎င်း၏အရေးကြီးမှု၊ အကျိုးခံစားခွင့်များ၊ ထိပ်တန်း NER API များနှင့် အခြားအရာများအပါအဝင် NER (Named Entity Recognition) ကို အသေးစိတ်စစ်ဆေးပါမည်။

NER (Named Entity Recognition) ဆိုတာဘာလဲ။

အမည်ပေးထားသော entity recognition (NER) ဟု လူသိများသော သဘာဝဘာသာစကားဖြင့် လုပ်ဆောင်ခြင်း (NLP) ချဉ်းကပ်နည်းသည် တစ်ခါတစ်ရံတွင် entity identification သို့မဟုတ် entity ထုတ်ယူခြင်းဟု လူသိများသော၊ စာသားတစ်ခုတွင် အမည်ပေးထားသည့်အရာများကို အလိုအလျောက်မှတ်မိပြီး ၎င်းတို့အား ကြိုတင်သတ်မှတ်ထားသော အမျိုးအစားများအဖြစ် စုစည်းထားသည်။

အကြောင်းအရာများတွင် တစ်ဦးချင်းအမည်များ၊ အဖွဲ့များ၊ နေရာများ၊ ရက်စွဲများ၊ ပမာဏများ၊ ဒေါ်လာပမာဏ၊ ရာခိုင်နှုန်းများနှင့် အခြားအရာများ ပါဝင်သည်။ အမည်ရှိ entity recognition ဖြင့်၊ ဒေတာဘေ့စ်တစ်ခုအတွက် သိသာထင်ရှားသောအချက်အလက်များကို စုဆောင်းရန် သို့မဟုတ် စာရွက်စာတမ်းတစ်ခုအကြောင်း နားလည်သဘောပေါက်ရန် အရေးကြီးသောအချက်အလက်များကို ထုတ်ယူရန် ၎င်းကို အသုံးပြုနိုင်သည်။

NER သည် စာသားခွဲခြမ်းစိတ်ဖြာမှုလုပ်ငန်းစဉ်တွင် သိသာထင်ရှားသောတိုးတက်မှုကို ကိုယ်စားပြုနေသော်လည်း NLP သည် နှိုင်းရအသုံးအနှုန်းများနှင့် ခံစားချက်များအတွက် စာသားကိုခွဲခြမ်းစိတ်ဖြာရန်အတွက် AI စနစ်ပေါ်တွင်မူတည်သည့် အခြေခံအုတ်မြစ်ဖြစ်သည်။

NER ရဲ့ အဓိပ္ပါယ်က ဘာလဲ။

စာသားခွဲခြမ်းစိတ်ဖြာမှုချဉ်းကပ်မှု၏အခြေခံမှာ NER ဖြစ်သည်။ ML မော်ဒယ်သည် အင်္ဂလိပ်ဘာသာစကားကို နားမလည်မီ ကြိုတင်သတ်မှတ်ထားသော အမျိုးအစားများနှင့်အတူ နမူနာသန်းပေါင်းများစွာကို ကနဦးပေးရပါမည်။

API သည် ၎င်းကို ပထမဆုံးအကြိမ်ဖတ်နေသည့် စာသားများတွင် ဤအစိတ်အပိုင်းများကို အသိအမှတ်ပြုရာတွင် အချိန်နှင့်အမျှ တိုးတက်လာသည်။ စာသားပိုင်းခြားစိတ်ဖြာချက်အင်ဂျင်၏ ပါဝါသည် NER စွမ်းရည်နှင့် စွမ်းပကားတို့နှင့်အတူ တိုးလာသည်။

ဤတွင်တွေ့မြင်ရသည့်အတိုင်း ML လုပ်ဆောင်ချက်များစွာကို NER မှ အစပျိုးသည်။

ဝေါဟာရရှာဖွေမှု

ဝေါဟာရရှာဖွေမှုကို Google တွင် ယခုရရှိနိုင်ပါပြီ။ မေးခွန်းတစ်ခုကို သင်ထည့်သွင်းနိုင်ပြီး အဖြေတစ်ခုဖြင့် တုံ့ပြန်ရန် အကောင်းဆုံးကြိုးစားပါမည်။ အချက်အလက်ကို ရှာဖွေရန်အတွက် အသုံးပြုသူတစ်ဦးသည် Alexa၊ Siri၊ chatbots နှင့် အခြားအရာများကဲ့သို့ ဒစ်ဂျစ်တယ်လက်ထောက်များကို ရှာဖွေနေပါသည်။

ဤလုပ်ဆောင်ချက်သည် ထိမှန်ခြင်း သို့မဟုတ် လွဲချော်နိုင်သော်လည်း ၎င်းအတွက် အသုံးပြုမှု များပြားလာပြီး ၎င်းတို့၏ ထိရောက်မှုသည် လျင်မြန်စွာ မြင့်တက်လာပါသည်။

ဒေတာကို Analytics မှ

ဤသည်မှာ ဖွဲ့စည်းတည်ဆောက်ပုံမထားသောဒေတာမှ ခွဲခြမ်းစိတ်ဖြာမှုကို ဖန်တီးရန် algorithms ကိုအသုံးပြုခြင်းအတွက် ယေဘုယျစကားစုဖြစ်သည်။ ၎င်းသည် သက်ဆိုင်ရာအချက်အလက်များကို ရှာဖွေစုဆောင်းခြင်းလုပ်ငန်းစဉ်နှင့် ဤဒေတာကိုပြသရန် နည်းလမ်းများကို ပေါင်းစပ်ထားသည်။

၎င်းသည် ရလဒ်များ၏ ရိုးရှင်းသော ကိန်းဂဏန်းဆိုင်ရာ ရှင်းလင်းချက်ပုံစံ သို့မဟုတ် ဒေတာ၏ အမြင်အာရုံကို ကိုယ်စားပြုမှုပုံစံကို ယူဆောင်နိုင်သည်။ အကြောင်းအရာတစ်ခုနှင့် ပတ်သက်မှုအပေါ် စိတ်ပါဝင်စားမှုနှင့် ပတ်သက်မှုအား ပိုင်းခြားစိတ်ဖြာခြင်းအား ကြည့်ရှုသူများသည် သီးခြားဗီဒီယိုတစ်ခုကို ကလစ်သည့်အခါ အပါအဝင် YouTube ကြည့်ရှုမှုများမှ အချက်အလက်များကို အသုံးပြု၍ လုပ်ဆောင်နိုင်ပါသည်။

ထုတ်ကုန်တစ်ခု၏ကြယ်ပွင့်အဆင့်သတ်မှတ်ချက်များကို e-commerce ဆိုက်များမှ ဒေတာများကို ခြစ်ထုတ်အသုံးပြု၍ ထုတ်ကုန်၏စွမ်းဆောင်ရည်ကို အလုံးစုံရမှတ်ပေးစွမ်းနိုင်သည် ။

စိတ်ဓါတ်ခွဲခြမ်းစိတ်ဖြာ

နောက်ထပ် NER စူးစမ်းလေ့လာခြင်း၊ စိတ်ဓါတ်ခွဲခြမ်းစိတ်ဖြာ ကြယ်ပွင့်အဆင့်သတ်မှတ်ချက်များမှ အချက်အလက်များမရှိသည့်တိုင် အကောင်းနှင့်အဆိုး သုံးသပ်ချက်များကို ပိုင်းခြားနိုင်သည်။

"လွန်ကဲသော၊" "အမိုက်စား" နှင့် "မိုက်မဲ" ကဲ့သို့သော ဝေါဟာရများသည် အပျက်သဘောဆောင်သည့် အဓိပ္ပါယ်များရှိပြီး "အသုံးဝင်သော" "အမြန်" နှင့် "လွယ်ကူသည်" ကဲ့သို့သော ဝေါဟာရများ ရှိနေသည်ကို သတိပြုမိပါသည်။ “လွယ်ကူသည်” ဟူသော စကားလုံးကို ကွန်ပျူတာဂိမ်းတွင် အပျက်သဘောဖြင့် အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်။.

ဆန်းပြားသော အယ်လဂိုရီသမ်များသည် အရာများကြားရှိ ဆက်နွယ်မှုကိုလည်း အသိအမှတ်ပြုနိုင်သည်။

စာသား Analytics

ဒေတာခွဲခြမ်းစိတ်ဖြာခြင်းကဲ့သို့ပင်၊ စာသားခွဲခြမ်းစိတ်ဖြာခြင်းသည် ဖွဲ့စည်းပုံမထားသော စာသားကြိုးများမှ အချက်အလက်များကို ထုတ်ယူပြီး အရေးကြီးသောဒေတာကို ဝင်ရောက်ရန် NER ကို အသုံးပြုသည်။

ထုတ်ကုန်တစ်ခု၏ဖော်ပြချက်များ၊ ပျမ်းမျှစျေးနှုန်း သို့မဟုတ် အမှတ်တံဆိပ်တစ်ခုဖော်ပြရန် သုံးစွဲသူများ အများဆုံးအသုံးပြုလေ့ရှိသည့် အသုံးအနှုန်းများဆိုင်ရာ အချက်အလက်များကို စုစည်းရန် ၎င်းကို အသုံးပြုနိုင်သည်။

ဗီဒီယို အကြောင်းအရာ ခွဲခြမ်းစိတ်ဖြာခြင်း။

အရှုပ်ထွေးဆုံးစနစ်များသည် မျက်နှာမှတ်မိခြင်း၊ အသံပိုင်းခြားစိတ်ဖြာခြင်းနှင့် ရုပ်ပုံမှတ်သားခြင်းတို့ကို အသုံးပြု၍ ဗီဒီယိုအချက်အလက်မှ ဒေတာများကို ထုတ်ယူသည့်စနစ်များဖြစ်သည်။

ဗီဒီယိုအကြောင်းအရာ ခွဲခြမ်းစိတ်ဖြာမှုကို အသုံးပြုခြင်းဖြင့်၊ သင်သည် YouTube “unboxing” ဗီဒီယိုများ၊ Twitch ဂိမ်းသရုပ်ပြမှုများ၊ Reels ပေါ်ရှိ သင့်အသံပစ္စည်း၏ နှုတ်ခမ်းစင့်ခ်လုပ်ခြင်းများနှင့် အခြားအရာများကို သင်ရှာတွေ့နိုင်ပါသည်။

အွန်လိုင်းဗီဒီယိုပစ္စည်း ပမာဏ တိုးများလာသည်နှင့်အမျှ လူများက သင့်ထုတ်ကုန် သို့မဟုတ် ဝန်ဆောင်မှုနှင့် ချိတ်ဆက်ပုံဆိုင်ရာ အရေးကြီးသော အချက်အလက်များကို လွဲမှားခြင်းမှ ရှောင်ရှားနိုင်ရန်၊ NER-based ဗီဒီယိုအကြောင်းအရာခွဲခြမ်းစိတ်ဖြာမှုအတွက် ပိုမိုမြန်ဆန်ပြီး တီထွင်ဆန်းသစ်သော နည်းပညာများသည် မရှိမဖြစ်လိုအပ်ပါသည်။

NER ၏ လက်တွေ့ကမ္ဘာအသုံးချမှု

အမည်ပေးထားသည့် အဖွဲ့အစည်း အသိအမှတ်ပြုခြင်း (NER) သည် လူများ၏အမည်များ၊ တည်နေရာများ၊ အမှတ်တံဆိပ်များ၊ ငွေကြေးတန်ဖိုးများနှင့် အခြားအရာများကဲ့သို့သော စာသားတစ်ခုရှိ မရှိမဖြစ်အချက်များကို ခွဲခြားသတ်မှတ်သည်။

စာသားတစ်ခုရှိ အဓိကအရာများကို ဖြည်ထုတ်ခြင်းသည် ကြီးမားသောဒေတာအတွဲများကို ကိုင်တွယ်ဖြေရှင်းရာတွင် အရေးကြီးသည့် ဖွဲ့စည်းပုံမရှိသောဒေတာကိုစီရန်နှင့် သိသာထင်ရှားသောအချက်အလက်များကိုရှာဖွေရာတွင် အထောက်အကူဖြစ်စေသည်။

ဤသည်မှာ အမည်ပေးထားသည့် entity အသိအမှတ်ပြုခြင်း၏ ဆွဲဆောင်မှုရှိသော လက်တွေ့ကမ္ဘာ ဥပမာအချို့ဖြစ်သည်။

ဖောက်သည်တုံ့ပြန်ချက်ကို ပိုင်းခြားစိတ်ဖြာခြင်း။

အွန်လိုင်းပြန်လည်သုံးသပ်ခြင်းများသည် သင့်ကုန်ပစ္စည်းနှင့်ပတ်သက်သော သုံးစွဲသူများကြိုက်နှစ်သက်မှုနှင့် မုန်းတီးမှုဆိုင်ရာ အသေးစိတ်အချက်အလက်များကို ပေးစွမ်းနိုင်သောကြောင့် သုံးစွဲသူများ၏ တုံ့ပြန်ချက်အား ကောင်းမွန်သောအရင်းအမြစ်တစ်ခုဖြစ်သည်။

ဤကလိုင်းယင့်ထည့်သွင်းမှုအားလုံးကို NER စနစ်များကို အသုံးပြု၍ စီစဉ်နိုင်ပြီး၊ ထပ်တလဲလဲ ပြဿနာများကို ဖော်ထုတ်နိုင်သည်။

ဥပမာအားဖြင့်၊ ဖောက်သည်ပြန်လည်သုံးသပ်ခြင်းများတွင် မကြာခဏကိုးကားခံရသောနေရာများကိုခွဲခြားသတ်မှတ်ရန် NER ကိုအသုံးပြုခြင်းဖြင့်၊ အချို့သောရုံးခွဲတစ်ခုကိုအာရုံစိုက်ရန် သင်ဆုံးဖြတ်နိုင်သည်။

အကြောင်းအရာအတွက် ထောက်ခံချက်

သင်ဖတ်နေသည့် ဆောင်းပါးများနှင့် ချိတ်ဆက်ထားသည့် ဆောင်းပါးများစာရင်းကို BBC နှင့် CNN ကဲ့သို့ ဝဘ်ဆိုက်များတွင် သင် ထိုနေရာတွင် ဖတ်သောအခါတွင် တွေ့နိုင်သည်။

ဤဝဘ်ဆိုဒ်များသည် NER ကို သင်ဖတ်နေသည့် အကြောင်းအရာမှ ၎င်းတို့ထုတ်နုတ်ထားသော အကြောင်းအရာများအကြောင်း အချက်အလက်များကို ပေးဆောင်သည့် အပိုဝဘ်ဆိုဒ်များအတွက် အကြံပြုချက်များ ပြုလုပ်ပါသည်။

Customer Support တွင် လက်မှတ်များကို စုစည်းပါ။

အကယ်၍ သင်သည် သုံးစွဲသူများထံမှ ပံ့ပိုးမှုလက်မှတ်အရေအတွက် တိုးလာမှုကို စီမံခန့်ခွဲပါက သုံးစွဲသူများ၏ တောင်းဆိုမှုများကို ပိုမိုလျင်မြန်စွာ တုံ့ပြန်ရန် အမည်ပေးထားသည့် အဖွဲ့အစည်း အသိအမှတ်ပြု အယ်လဂိုရီသမ်ကို အသုံးပြုနိုင်သည်။

ဖောက်သည်များ၏ မကျေနပ်ချက်များနှင့် စုံစမ်းမေးမြန်းမှုများကို အမျိုးအစားခွဲခြားခြင်း၊ သင့်ကိုယ်သင် ငွေချွေတာရန်၊ ဖောက်သည်များ၏ ပျော်ရွှင်မှုကို တိုးမြင့်လာစေရန်နှင့် ဖြေရှင်းမှုနှုန်းများ တိုးမြှင့်ခြင်းကဲ့သို့သော အချိန်ကုန်သော ဖောက်သည်စောင့်ရှောက်မှုများကို အလိုအလျောက်လုပ်ဆောင်ပါ။

ထိုပြဿနာကိုဖြေရှင်းရန်အတွက် မှန်ကန်သောအေးဂျင့် သို့မဟုတ် အဖွဲ့ထံသို့ လက်မှတ်များလမ်းကြောင်းပေးရာတွင် ပိုမိုလွယ်ကူစေရန် ထုတ်ကုန်အမည်များ သို့မဟုတ် အမှတ်စဉ်နံပါတ်များကဲ့သို့သော သက်ဆိုင်ရာဒေတာများကို ထုတ်ယူရန်အတွက်လည်း အသုံးပြုနိုင်သည်။

ရှာဖွေမှု algorithm

အချက်အလက် သန်းပေါင်းများစွာရှိတဲ့ ဝဘ်ဆိုဒ်တွေက သင့်ရှာဖွေမှုနဲ့ သက်ဆိုင်တဲ့ ရလဒ်တွေကို ဘယ်လိုထုတ်ပေးနိုင်သလဲလို့ သင်မေးခွန်းထုတ်ဖူးပါသလား။ ဝဘ်ဆိုဒ် ဝီကီပီးဒီးယားကို သုံးသပ်ကြည့်ပါ။

Wikipedia သည် “အလုပ်များ” ကို သင်ရှာဖွေသောအခါတွင် ရှာဖွေသည့်စကားလုံးနှင့် ဆက်စပ်နိုင်သည့် စာမျက်နှာတစ်ခုအား ၎င်းတို့တွင် “အလုပ်များ” ဟူသော စကားလုံးဖြင့် ဆောင်းပါးအားလုံးကို ပြန်ပေးမည့်အစား၊

ထို့ကြောင့်၊ Wikipedia သည် “အလုပ်အကိုင်” ဟုသတ်မှတ်ထားသော ဆောင်းပါး၊ Jobs အမည်ပေးထားသော လူများအတွက် ကဏ္ဍတစ်ခုနှင့် ရုပ်ရှင်များကဲ့သို့သော မီဒီယာများအတွက် အခြားနယ်ပယ်တစ်ခု၊ ဗီဒီယိုဂိမ်းများနှင့် "အလုပ်အကိုင်များ" ဟူသောအသုံးအနှုန်းပေါ်လာသည့် အခြားဖျော်ဖြေရေးပုံစံများ။

ရှာဖွေမှုစကားလုံးပါရှိသော တည်နေရာများအတွက် အခြားအပိုင်းကိုလည်း သင်တွေ့ရပါမည်။

ကိုယ်ရေးရာဇဝင်များကို ဂရုစိုက်ပါ။

စံပြလျှောက်ထားသူအား ရှာဖွေရာတွင် လူသစ်စုဆောင်းသူများသည် ၎င်းတို့၏နေ့စဉ်မှတ်တမ်းများကို ပြန်လည်သုံးသပ်ခြင်း၏ အရေးပါသောအစိတ်အပိုင်းကို အသုံးပြုကြသည်။ ကိုယ်ရေးရာဇဝင်တစ်ခုစီတွင် တူညီသောအချက်အလက်များရှိသော်လည်း ၎င်းတို့အားလုံးကို ကွဲပြားစွာတင်ပြပြီး ဖွဲ့စည်းတည်ဆောက်ပုံမထားသောဒေတာ၏ ပုံမှန်ဥပမာတစ်ခုဖြစ်သည်။

ကိုယ်ရေးကိုယ်တာအချက်အလက်များ (အမည်၊ လိပ်စာ၊ ဖုန်းနံပါတ်၊ မွေးသက္ကရာဇ်နှင့် အီးမေးလ်ကဲ့သို့သော) နှင့် ၎င်းတို့၏ ပညာရေးနှင့် အတွေ့အကြုံ (ဥပမာ လက်မှတ်များ၊ ဘွဲ့လက်မှတ်များကဲ့သို့သော ကိုယ်ရေးကိုယ်တာအချက်အလက်များ အပါအဝင် entity extractors များကို စုဆောင်းအသုံးပြုသည့် အဖွဲ့များက ခေါ်ယူခြင်းဖြင့် လျှောက်ထားသူများ၏ အသက်ဆိုင်ဆုံးအချက်အလက်များကို လျင်မြန်စွာထုတ်ယူနိုင်သည်။ ကုမ္ပဏီအမည်များ၊ ကျွမ်းကျင်မှုများ၊ စသည်)။

e-commerce

၎င်းတို့၏ ထုတ်ကုန်ရှာဖွေမှု အယ်လဂိုရီသမ်နှင့်ပတ်သက်၍၊ ရာနှင့်ချီသော ကုန်ပစ္စည်းထောင်ပေါင်းများစွာရှိသော အွန်လိုင်းလက်လီရောင်းချသူများသည် NER ထံမှ အကျိုးအမြတ်ရရှိမည်ဖြစ်သည်။

NER မပါဘဲ၊ "အနက်ရောင်သားရေဘွတ်ဖိနပ်" ကိုရှာဖွေခြင်းသည် အနက်ရောင်မဟုတ်သော သားရေနှင့် ဖိနပ်နှစ်ခုလုံးပါ၀င်သည့် ရလဒ်များကို ပြန်ပေးလိမ့်မည်။ သို့ဆိုလျှင် e-commerce ဝဘ်ဆိုဒ်များသည် ဖောက်သည်များ ဆုံးရှုံးနိုင်ခြေရှိသည်။

In ကျွန်ုပ်တို့၏ကိစ္စတွင်၊ NER သည် ရှာဖွေရေးစကားလုံးကို သားရေဖိနပ်နှင့် အနက်ရောင်အတွက် ထုတ်ကုန်အမျိုးအစားအဖြစ် အမျိုးအစားခွဲမည်ဖြစ်သည်။

အကောင်းဆုံး Entity Extraction API များ

Google Cloud NLP

လေ့ကျင့်ပြီးသား ကိရိယာများအတွက် Google Cloud NLP သည် ၎င်း၏ Natural Language API ကို ပံ့ပိုးပေးပါသည်။ သို့မဟုတ်၊ သင့်စက်မှုလုပ်ငန်း၏ အသုံးအနှုန်းများကို သင်ပညာပေးလိုပါက AutoML Natural Language API သည် စာသားထုတ်ယူခြင်းနှင့် ခွဲခြမ်းစိတ်ဖြာမှု အမျိုးအစားများစွာအတွက် လိုက်လျောညီထွေဖြစ်စေသည်။

Google Cloud NLP

API များသည် Gmail၊ Google Sheets နှင့် အခြား Google အက်ပ်များနှင့် လွယ်ကူစွာ အပြန်အလှန် ဆက်သွယ်နိုင်သော်လည်း ၎င်းတို့ကို ပြင်ပပရိုဂရမ်များနှင့် အသုံးပြုခြင်းဖြင့် ပိုမိုရှုပ်ထွေးသော ကုဒ်များ လိုအပ်နိုင်သည်။

စံပြလုပ်ငန်းရွေးချယ်ခွင့်မှာ Google အက်ပ်လီကေးရှင်းများနှင့် Cloud Storage ကို စီမံခန့်ခွဲထားသော ဝန်ဆောင်မှုများနှင့် API များအဖြစ် ချိတ်ဆက်ရန်ဖြစ်သည်။

IBM က Watson

IBM Watson သည် အသံနှင့် ဖုန်းခေါ်ဆိုမှုများကို အလိုအလျောက် ပိုင်းခြားစိတ်ဖြာနိုင်သည့် အံ့သြဖွယ်ကောင်းသော ဆော့ဖ်ဝဲဖြစ်သည့် စကားပြောမှ စာတိုကဲ့သို့သော ကြိုတင်တည်ဆောက်ထားသော စွမ်းရည်များကို ပေးစွမ်းသည့် ကလောက်အများအပြား cloud platform တစ်ခုဖြစ်သည်။

CSV ဒေတာကိုအသုံးပြုခြင်းဖြင့် Watson Natural Language Understanding ၏ နက်နဲသောသင်ယူမှု AI သည် အကြောင်းအရာများ သို့မဟုတ် သော့ချက်စာလုံးများကို ထုတ်ယူရန်အတွက် ထုတ်ယူမှုပုံစံများကို ဖန်တီးနိုင်သည်။

IBM က Watson

လက်တွေ့အားဖြင့်၊ သင်သည် ပို၍ ဆန်းပြားသော မော်ဒယ်များကို ဖန်တီးနိုင်သည်။ ကျယ်ပြန့်သော coding အသိပညာလိုအပ်သော်လည်း ၎င်း၏လုပ်ဆောင်ချက်အားလုံးကို APIs များမှတစ်ဆင့် ရယူနိုင်သည်။

အလွန်ကြီးမားသော ဒေတာအတွဲများကို ဆန်းစစ်ရန်နှင့် စက်တွင်းနည်းပညာဆိုင်ရာ အရင်းအမြစ်များ ပါ၀င်သော ကြီးမားသော စီးပွားရေးလုပ်ငန်းကြီးများအတွက် ၎င်းသည် ကောင်းမွန်စွာ အလုပ်လုပ်ပါသည်။

Cortical.io

အာရုံကြောပညာမှ အယူအဆတစ်ခုဖြစ်သော Semantic Folding ကိုအသုံးပြု၍ Cortical.io သည် စာသားထုတ်ယူခြင်းနှင့် NLU ဖြေရှင်းချက်များကို ပံ့ပိုးပေးသည်။

၎င်းသည် စာသားတစ်ခုလုံးနှင့် တိကျသောအသုံးအနှုန်းများတွင် စာသားတစ်ခု၏အဓိပ္ပာယ်နှစ်ခုလုံးကိုဖော်ပြသည့် "အခေါ်အဝေါ်လက်ဗွေများ" ထုတ်လုပ်ရန် လုပ်ဆောင်သည်။ စကားလုံးအစုအဝေးများကြား ဆက်စပ်မှုများကို သရုပ်ပြရန်အတွက်၊ အဓိပ္ပါယ်ရှိသော လက်ဗွေများသည် စာသားဒေတာကို ဖော်ပြသည်။

Cortical.io ၏အပြန်အလှန်အကျိုးသက်ရောက်သော API စာရွက်စာတမ်းသည် စာသားခွဲခြမ်းစိတ်ဖြာမှုဖြေရှင်းချက်တစ်ခုစီ၏လုပ်ဆောင်နိုင်စွမ်းကို အကျုံးဝင်ပြီး Java၊ Python နှင့် Javascript APIs များကို အသုံးပြု၍ ဝင်ရောက်ရန် ရိုးရှင်းပါသည်။

Cortical.io

Cortical.io မှ Contract Intelligence tool ကို တရားရေးဆိုင်ရာ ခွဲခြမ်းစိတ်ဖြာမှုအတွက် အထူးဖန်တီးထားပြီး ဝေါဟာရရှာဖွေမှုများ ပြုလုပ်ရန်၊ စကင်န်ဖတ်ထားသော စာရွက်စာတမ်းများကို အသွင်ပြောင်းရန်နှင့် မှတ်ချက်ဖြင့် မြှင့်တင်ရန်တို့ကို ကူညီပေးပါသည်။

အထူးသဖြင့် ဥပဒေကဏ္ဍတွင် AI အသိပညာမလိုအပ်သော ရိုးရှင်းသောအသုံးပြုမှု API များကို ရှာဖွေနေသည့် စီးပွားရေးလုပ်ငန်းများအတွက် စံပြဖြစ်သည်။

မျောက်လေ့လာပါ။

အဓိကကွန်ပြူတာဘာသာစကားအားလုံးကို MonkeyLearn ၏ APIs များမှပံ့ပိုးထားပြီး သင့်ထုတ်နှုတ်ထားသောအရာများပါရှိသော JSON ဖိုင်တစ်ခုထုတ်လုပ်ရန် ကုဒ်လိုင်းအနည်းငယ်ကိုသာ စနစ်ထည့်သွင်းပါ။ ကြိုတင်လေ့ကျင့်မှုဖြင့် ထုတ်ယူသူများနှင့် စာသားလေ့လာသုံးသပ်သူများအတွက်၊ အင်တာဖေ့စ်သည် အသုံးပြုရလွယ်ကူသည်။

သို့မဟုတ်၊ ရိုးရှင်းသောအဆင့်အနည်းငယ်တွင်၊ သင်သည် ထူးခြားသောထုတ်ယူမှုတစ်ခုကို ဖန်တီးနိုင်သည်။ အချိန်ကို လျှော့ချပြီး တိကျမှုကို မြှင့်တင်ရန်၊ နက်နဲသော အဆင့်မြင့် သဘာဝဘာသာစကား လုပ်ဆောင်ခြင်း (NLP) စက်သင်ယူမှု စာသားကို လူတစ်ယောက်လို အကဲဖြတ်နိုင်စေတယ်။

မျောက်လေ့လာပါ။

ထို့အပြင်၊ SaaS APIs များသည် Google Sheets၊ Excel၊ Zapier၊ Zendesk နှင့် အခြားအရာများကဲ့သို့ ကိရိယာများနှင့် ချိတ်ဆက်မှုများကို နှစ်ပေါင်းများစွာ ကွန်ပျူတာသိပ္ပံအသိပညာ မလိုအပ်ကြောင်း သေချာစေပါသည်။

သင့်ဘရောက်ဆာတွင် လက်ရှိရရှိနိုင်သော အမည်ထုတ်ယူသူ၊ ကုမ္ပဏီထုတ်ယူသူနှင့် တည်နေရာထုတ်ယူသည့်ကိရိယာများဖြစ်သည်။ သင့်ကိုယ်ပိုင်တည်ဆောက်ပုံဆိုင်ရာ အချက်အလက်အတွက်၊ အမည်ရှိ အဖွဲ့အစည်းအသိအမှတ်ပြုဘလော့ဂ်ဆောင်းပါးကို ကြည့်ပါ။

စာသားထုတ်ယူခြင်းနှင့် စာသားခွဲခြမ်းစိတ်ဖြာမှု အမျိုးအစားအမျိုးမျိုးအတွက် ရိုးရှင်းလွယ်ကူသော API များကို အကောင်အထည်ဖော်ရန် လိုအပ်သော နည်းပညာ၊ လက်လီ၊ နှင့် e-commerce တွင်ပါ၀င်သော အရွယ်အစားအားလုံးရှိ စီးပွားရေးလုပ်ငန်းများအတွက် စံပြဖြစ်သည်။

Amazon နားလည်မှု

Amazon Comprehend ၏ကြိုတင်တည်ဆောက်ထားသောကိရိယာများကို ချက်ချင်းလွယ်ကူစွာ ပလပ်ထိုး၍ အသုံးပြုနိုင်ရန် ၎င်းတို့ကို နယ်ပယ်ရာနှင့်ချီ၍ လေ့ကျင့်သင်ကြားပေးထားသည်။

ဤသည်မှာ စောင့်ကြည့်ထားသော ဝန်ဆောင်မှုတစ်ခုဖြစ်သောကြောင့် အိမ်တွင်းဆာဗာများ မလိုအပ်ပါ။ အထူးသဖြင့် သင်သည် လက်ရှိ Amazon ၏ cloud ကို အဆင့်တစ်ခုအထိ အသုံးပြုပါက၊ ၎င်းတို့၏ API များသည် ယခင်ရှိပြီးသားအက်ပ်များနှင့် အလွယ်တကူ ပေါင်းစပ်နိုင်သည်။ အနည်းငယ်ပိုလေ့ကျင့်ခြင်းဖြင့်သာ ထုတ်ယူမှုတိကျမှုကို မြှင့်တင်နိုင်သည်။

Amazon နားလည်မှု

ဆေးမှတ်တမ်းများနှင့် လက်တွေ့စမ်းသပ်မှုများမှ ဒေတာရယူခြင်းအတွက် အားကိုးရဆုံးသော စာသားခွဲခြမ်းစိတ်ဖြာမှုနည်းလမ်းများထဲမှ တစ်ခုသည် ဆေးဝါးများ၊ အခြေအနေများ၊ စမ်းသပ်မှုရလဒ်များနှင့် လုပ်ထုံးလုပ်နည်းများဆိုင်ရာ အသေးစိတ်အချက်အလက်များကို ထုတ်ယူနိုင်သည့် Comprehend's Medical Named Entity and Relationship Extraction (NERe) ဖြစ်သည်။

လူနာဒေတာကို အကဲဖြတ်ပြီး သေချာချိန်ညှိစစ်ဆေးသောအခါတွင် အလွန်အကျိုးရှိနိုင်ပါသည်။ ကြိုတင်လေ့ကျင့်ထားသော ကိရိယာများဖြင့် စီမံခန့်ခွဲထားသော ဝန်ဆောင်မှုကို ရှာဖွေနေသည့် စီးပွားရေးလုပ်ငန်းများအတွက် အကောင်းဆုံးရွေးချယ်မှု။

Aylien

ခိုင်မာသောစက်သင်ယူမှုစာသားခွဲခြမ်းစိတ်ဖြာမှုကို လွယ်ကူစွာဝင်ရောက်နိုင်ရန် AYLIEN သည် လူကြိုက်များသောပရိုဂရမ်ဘာသာစကားခုနစ်မျိုးဖြင့် API plug-in သုံးခုကို ပံ့ပိုးပေးပါသည်။

၎င်းတို့၏ News API သည် ကမ္ဘာတစ်ဝှမ်းမှ ထောင်သောင်းချီသော သတင်းရင်းမြစ်များမှ အချိန်နှင့်တစ်ပြေးညီ ရှာဖွေမှုနှင့် အကြောင်းအရာကို ထုတ်ယူမှုကို ပံ့ပိုးပေးပါသည်။

Aylien

အကြောင်းအရာ ထုတ်ယူခြင်းနှင့် အခြားသော စာသားခွဲခြမ်းစိတ်ဖြာခြင်း လုပ်ငန်းများစွာကို စာရွက်စာတမ်းများတွင် Text Analysis API ကို အသုံးပြု၍ ဆောင်ရွက်နိုင်သည်။ လူမှုမီဒီယာ ပလပ်ဖောင်းများ၊ စားသုံးသူစစ်တမ်းများနှင့် အခြားအရာများ။

နောက်ဆုံးအနေဖြင့်၊ Text Analysis Platform ကိုအသုံးပြု၍ သင်သည် သင်၏ကိုယ်ပိုင် extractors ကိုဖန်တီးနိုင်ပြီး သင်၏ browser (TAP) တွင် ပိုမိုဖြောင့်တန်းစွာလုပ်ဆောင်နိုင်ပါသည်။ အဓိကအားဖြင့် သတ်မှတ်ထားသော API များကို လျင်မြန်စွာ ပေါင်းစပ်လိုသော ကုမ္ပဏီများအတွက် ၎င်းသည် ကောင်းမွန်စွာ အလုပ်လုပ်ပါသည်။

SpaCy

SpaCy သည် Python Natural Language Processing (NLP) ပက်ကေ့ဂျ်ဖြစ်ပြီး open-source၊ အခမဲ့ဖြစ်ပြီး ပါ၀င်သည့်အင်္ဂါရပ်များစွာပါရှိသည်။

ဒါဟာ ပိုပိုပြီး အဖြစ်များလာတယ်။ NLP ဒေတာ လုပ်ဆောင်ခြင်းနှင့် ခွဲခြမ်းစိတ်ဖြာခြင်း။ ဖွဲ့စည်းပုံမရှိသော စာသားဒေတာကို ကြီးမားသောအတိုင်းအတာဖြင့် ဖန်တီးထားသောကြောင့် ၎င်းကိုခွဲခြမ်းစိတ်ဖြာပြီး ထိုးထွင်းသိမြင်မှုများကို ထုတ်ယူရန် အရေးကြီးပါသည်။

SpaCy

အဲဒါကို ပြီးမြောက်ဖို့၊ အချက်အလက်တွေကို ကွန်ပျူတာတွေ နားလည်နိုင်တဲ့ နည်းလမ်းနဲ့ ပုံဖော်ရပါမယ်။ NLP မှတဆင့်သင်ပြုလုပ်နိုင်သည်။ 30ms သာ နောက်ကျကျန်နေသဖြင့် အလွန်လျင်မြန်သော်လည်း အရေးကြီးသည်မှာ HTTPS စာမျက်နှာများကို အသုံးပြုရန်အတွက် မရည်ရွယ်ပါ။

၎င်းသည် ပြည်တွင်းတွင် လုပ်ဆောင်နေသောကြောင့် သင့်ကိုယ်ပိုင်ဆာဗာများ သို့မဟုတ် အင်ထရာနက်ကို စကင်န်ဖတ်ခြင်းအတွက် ကောင်းမွန်သောရွေးချယ်မှုတစ်ခုဖြစ်သော်လည်း ၎င်းသည် အင်တာနက်တစ်ခုလုံးကို လေ့လာရန်အတွက် ကိရိယာတစ်ခုမဟုတ်ပါ။

ကောက်ချက်

အမည်ပေးထားသည့် entity recognition (NER) သည် ဖောက်သည်ပံ့ပိုးမှုတောင်းဆိုမှုများတွင် သက်ဆိုင်ရာအချက်အလက်များကို အညွှန်းတပ်ရန်၊ ဖောက်သည်တုံ့ပြန်ချက်တွင် ကိုးကားထားသည့်အရာများကို ရှာဖွေရန်နှင့် အဆက်အသွယ်အသေးစိတ်၊ တည်နေရာနှင့် ရက်စွဲများကဲ့သို့သော အရေးကြီးသောဒေတာများကို အမြန်ထုတ်ယူနိုင်သည့်စနစ်တစ်ခုဖြစ်သည်။

entity recognition အမည်ပေးခံရခြင်းအတွက် အသုံးအများဆုံးနည်းလမ်းမှာ entity extraction APIs (၎င်းတို့ကို open-source libraries သို့မဟုတ် SaaS ထုတ်ကုန်များမှ ပံ့ပိုးပေးသည်ဖြစ်စေ) မှတဆင့်ဖြစ်သည်။

သို့သော်၊ အကောင်းဆုံးနည်းလမ်းကို ရွေးချယ်ခြင်းသည် သင်၏အချိန်၊ ငွေကြေးနှင့် ကျွမ်းကျင်မှုအပေါ် မူတည်ပါသည်။ မည်သည့်လုပ်ငန်းမျိုးအတွက်မဆို entity ထုတ်ယူခြင်းနှင့် ပိုမိုခေတ်မီသော စာသားခွဲခြမ်းစိတ်ဖြာခြင်းနည်းပညာများသည် အကျိုးကျေးဇူးများစွာရရှိနိုင်ပါသည်။

စက်သင်ယူမှုကိရိယာများကို မှန်ကန်စွာ သင်ကြားပေးသောအခါ ၎င်းတို့သည် တိကျမှန်ကန်ပြီး မည်သည့်ဒေတာကိုမျှ လျစ်လျူမရှုဘဲ သင့်အချိန်နှင့်ငွေကို သက်သာစေပါသည်။ APIs များကို ပေါင်းစပ်ခြင်းဖြင့် အဆက်မပြတ်နှင့် အလိုအလျောက် လုပ်ဆောင်ရန် ဤဖြေရှင်းချက်များကို သင် configure လုပ်နိုင်ပါသည်။

သင့်ကုမ္ပဏီအတွက် အသင့်တော်ဆုံး လုပ်ဆောင်ချက်ကို ရိုးရှင်းစွာရွေးချယ်ပါ။

အမည်ပေးထားသည့် Entity Recognition (NER) – အယူအဆ၊ အပလီကေးရှင်းနှင့် API များ

NER (Named Entity Recognition) ဆိုတာဘာလဲ။