မာတိကာ[ဖျောက်][ရှိုး]
ကျွန်ုပ်တို့သည် စကားလုံးများကို တစ်ဦးချင်း၊ နေရာများ၊ တည်နေရာများ၊ တန်ဖိုးများနှင့် ၎င်းတို့ကို ကြားရသည့်အခါတိုင်း သို့မဟုတ် ဖတ်သည့်အခါတိုင်းတွင် ခွဲခြားသိမြင်နိုင်သော မွေးရာပါစွမ်းရည်ရှိသည်။ လူသားများသည် စကားလုံးများကို အမျိုးအစားခွဲခြင်း၊ ခွဲခြားသတ်မှတ်ခြင်းနှင့် နားလည်သဘောပေါက်ခြင်းတို့ကို လျင်မြန်စွာလုပ်ဆောင်နိုင်ကြသည်။
ဥပမာအားဖြင့်၊ သင်သည် အရာဝတ္ထုတစ်ခုအား အမျိုးအစားခွဲခြားနိုင်ပြီး “Steve Jobs” ဟူသောအမည်ကို ကြားသောအခါတွင် အနည်းဆုံး အရည်အသွေး သုံးခုမှ လေးခုအထိ လျင်မြန်စွာ ရရှိလာနိုင်သည်။
- ပုဂ္ဂိုလ်: "စတိဗ်ဂျော့ဘ်"
- အဖွဲ့အစည်း- "Apple"
- တည်နေရာ- "ကယ်လီဖိုးနီးယား"
ကွန်ပြူတာများသည် ဤမွေးရာပါ ကျွမ်းကျင်မှု မရှိသောကြောင့်၊ စကားလုံးများ သို့မဟုတ် စာသားများကို ခွဲခြားသိမြင်ပြီး ၎င်းကို အမျိုးအစားခွဲရာတွင် ကူညီပေးရပါမည်။ Entity Recognition (NER) ကို ဤအခြေအနေတွင် အသုံးပြုသည်။
ဤဆောင်းပါးတွင်၊ ၎င်း၏အရေးကြီးမှု၊ အကျိုးခံစားခွင့်များ၊ ထိပ်တန်း NER API များနှင့် အခြားအရာများအပါအဝင် NER (Named Entity Recognition) ကို အသေးစိတ်စစ်ဆေးပါမည်။
NER (Named Entity Recognition) ဆိုတာဘာလဲ။
အမည်ပေးထားသော entity recognition (NER) ဟု လူသိများသော သဘာဝဘာသာစကားဖြင့် လုပ်ဆောင်ခြင်း (NLP) ချဉ်းကပ်နည်းသည် တစ်ခါတစ်ရံတွင် entity identification သို့မဟုတ် entity ထုတ်ယူခြင်းဟု လူသိများသော၊ စာသားတစ်ခုတွင် အမည်ပေးထားသည့်အရာများကို အလိုအလျောက်မှတ်မိပြီး ၎င်းတို့အား ကြိုတင်သတ်မှတ်ထားသော အမျိုးအစားများအဖြစ် စုစည်းထားသည်။
အကြောင်းအရာများတွင် တစ်ဦးချင်းအမည်များ၊ အဖွဲ့များ၊ နေရာများ၊ ရက်စွဲများ၊ ပမာဏများ၊ ဒေါ်လာပမာဏ၊ ရာခိုင်နှုန်းများနှင့် အခြားအရာများ ပါဝင်သည်။ အမည်ရှိ entity recognition ဖြင့်၊ ဒေတာဘေ့စ်တစ်ခုအတွက် သိသာထင်ရှားသောအချက်အလက်များကို စုဆောင်းရန် သို့မဟုတ် စာရွက်စာတမ်းတစ်ခုအကြောင်း နားလည်သဘောပေါက်ရန် အရေးကြီးသောအချက်အလက်များကို ထုတ်ယူရန် ၎င်းကို အသုံးပြုနိုင်သည်။
NER သည် စာသားခွဲခြမ်းစိတ်ဖြာမှုလုပ်ငန်းစဉ်တွင် သိသာထင်ရှားသောတိုးတက်မှုကို ကိုယ်စားပြုနေသော်လည်း NLP သည် နှိုင်းရအသုံးအနှုန်းများနှင့် ခံစားချက်များအတွက် စာသားကိုခွဲခြမ်းစိတ်ဖြာရန်အတွက် AI စနစ်ပေါ်တွင်မူတည်သည့် အခြေခံအုတ်မြစ်ဖြစ်သည်။
NER ရဲ့ အဓိပ္ပါယ်က ဘာလဲ။
စာသားခွဲခြမ်းစိတ်ဖြာမှုချဉ်းကပ်မှု၏အခြေခံမှာ NER ဖြစ်သည်။ ML မော်ဒယ်သည် အင်္ဂလိပ်ဘာသာစကားကို နားမလည်မီ ကြိုတင်သတ်မှတ်ထားသော အမျိုးအစားများနှင့်အတူ နမူနာသန်းပေါင်းများစွာကို ကနဦးပေးရပါမည်။
API သည် ၎င်းကို ပထမဆုံးအကြိမ်ဖတ်နေသည့် စာသားများတွင် ဤအစိတ်အပိုင်းများကို အသိအမှတ်ပြုရာတွင် အချိန်နှင့်အမျှ တိုးတက်လာသည်။ စာသားပိုင်းခြားစိတ်ဖြာချက်အင်ဂျင်၏ ပါဝါသည် NER စွမ်းရည်နှင့် စွမ်းပကားတို့နှင့်အတူ တိုးလာသည်။
ဤတွင်တွေ့မြင်ရသည့်အတိုင်း ML လုပ်ဆောင်ချက်များစွာကို NER မှ အစပျိုးသည်။
ဝေါဟာရရှာဖွေမှု
ဝေါဟာရရှာဖွေမှုကို Google တွင် ယခုရရှိနိုင်ပါပြီ။ မေးခွန်းတစ်ခုကို သင်ထည့်သွင်းနိုင်ပြီး အဖြေတစ်ခုဖြင့် တုံ့ပြန်ရန် အကောင်းဆုံးကြိုးစားပါမည်။ အချက်အလက်ကို ရှာဖွေရန်အတွက် အသုံးပြုသူတစ်ဦးသည် Alexa၊ Siri၊ chatbots နှင့် အခြားအရာများကဲ့သို့ ဒစ်ဂျစ်တယ်လက်ထောက်များကို ရှာဖွေနေပါသည်။
ဤလုပ်ဆောင်ချက်သည် ထိမှန်ခြင်း သို့မဟုတ် လွဲချော်နိုင်သော်လည်း ၎င်းအတွက် အသုံးပြုမှု များပြားလာပြီး ၎င်းတို့၏ ထိရောက်မှုသည် လျင်မြန်စွာ မြင့်တက်လာပါသည်။
ဒေတာကို Analytics မှ
ဤသည်မှာ ဖွဲ့စည်းတည်ဆောက်ပုံမထားသောဒေတာမှ ခွဲခြမ်းစိတ်ဖြာမှုကို ဖန်တီးရန် algorithms ကိုအသုံးပြုခြင်းအတွက် ယေဘုယျစကားစုဖြစ်သည်။ ၎င်းသည် သက်ဆိုင်ရာအချက်အလက်များကို ရှာဖွေစုဆောင်းခြင်းလုပ်ငန်းစဉ်နှင့် ဤဒေတာကိုပြသရန် နည်းလမ်းများကို ပေါင်းစပ်ထားသည်။
၎င်းသည် ရလဒ်များ၏ ရိုးရှင်းသော ကိန်းဂဏန်းဆိုင်ရာ ရှင်းလင်းချက်ပုံစံ သို့မဟုတ် ဒေတာ၏ အမြင်အာရုံကို ကိုယ်စားပြုမှုပုံစံကို ယူဆောင်နိုင်သည်။ အကြောင်းအရာတစ်ခုနှင့် ပတ်သက်မှုအပေါ် စိတ်ပါဝင်စားမှုနှင့် ပတ်သက်မှုအား ပိုင်းခြားစိတ်ဖြာခြင်းအား ကြည့်ရှုသူများသည် သီးခြားဗီဒီယိုတစ်ခုကို ကလစ်သည့်အခါ အပါအဝင် YouTube ကြည့်ရှုမှုများမှ အချက်အလက်များကို အသုံးပြု၍ လုပ်ဆောင်နိုင်ပါသည်။
ထုတ်ကုန်တစ်ခု၏ကြယ်ပွင့်အဆင့်သတ်မှတ်ချက်များကို e-commerce ဆိုက်များမှ ဒေတာများကို ခြစ်ထုတ်အသုံးပြု၍ ထုတ်ကုန်၏စွမ်းဆောင်ရည်ကို အလုံးစုံရမှတ်ပေးစွမ်းနိုင်သည် ။
စိတ်ဓါတ်ခွဲခြမ်းစိတ်ဖြာ
နောက်ထပ် NER စူးစမ်းလေ့လာခြင်း၊ စိတ်ဓါတ်ခွဲခြမ်းစိတ်ဖြာ ကြယ်ပွင့်အဆင့်သတ်မှတ်ချက်များမှ အချက်အလက်များမရှိသည့်တိုင် အကောင်းနှင့်အဆိုး သုံးသပ်ချက်များကို ပိုင်းခြားနိုင်သည်။
"လွန်ကဲသော၊" "အမိုက်စား" နှင့် "မိုက်မဲ" ကဲ့သို့သော ဝေါဟာရများသည် အပျက်သဘောဆောင်သည့် အဓိပ္ပါယ်များရှိပြီး "အသုံးဝင်သော" "အမြန်" နှင့် "လွယ်ကူသည်" ကဲ့သို့သော ဝေါဟာရများ ရှိနေသည်ကို သတိပြုမိပါသည်။ “လွယ်ကူသည်” ဟူသော စကားလုံးကို ကွန်ပျူတာဂိမ်းတွင် အပျက်သဘောဖြင့် အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်။.
ဆန်းပြားသော အယ်လဂိုရီသမ်များသည် အရာများကြားရှိ ဆက်နွယ်မှုကိုလည်း အသိအမှတ်ပြုနိုင်သည်။
စာသား Analytics
ဒေတာခွဲခြမ်းစိတ်ဖြာခြင်းကဲ့သို့ပင်၊ စာသားခွဲခြမ်းစိတ်ဖြာခြင်းသည် ဖွဲ့စည်းပုံမထားသော စာသားကြိုးများမှ အချက်အလက်များကို ထုတ်ယူပြီး အရေးကြီးသောဒေတာကို ဝင်ရောက်ရန် NER ကို အသုံးပြုသည်။
ထုတ်ကုန်တစ်ခု၏ဖော်ပြချက်များ၊ ပျမ်းမျှစျေးနှုန်း သို့မဟုတ် အမှတ်တံဆိပ်တစ်ခုဖော်ပြရန် သုံးစွဲသူများ အများဆုံးအသုံးပြုလေ့ရှိသည့် အသုံးအနှုန်းများဆိုင်ရာ အချက်အလက်များကို စုစည်းရန် ၎င်းကို အသုံးပြုနိုင်သည်။
ဗီဒီယို အကြောင်းအရာ ခွဲခြမ်းစိတ်ဖြာခြင်း။
အရှုပ်ထွေးဆုံးစနစ်များသည် မျက်နှာမှတ်မိခြင်း၊ အသံပိုင်းခြားစိတ်ဖြာခြင်းနှင့် ရုပ်ပုံမှတ်သားခြင်းတို့ကို အသုံးပြု၍ ဗီဒီယိုအချက်အလက်မှ ဒေတာများကို ထုတ်ယူသည့်စနစ်များဖြစ်သည်။
ဗီဒီယိုအကြောင်းအရာ ခွဲခြမ်းစိတ်ဖြာမှုကို အသုံးပြုခြင်းဖြင့်၊ သင်သည် YouTube “unboxing” ဗီဒီယိုများ၊ Twitch ဂိမ်းသရုပ်ပြမှုများ၊ Reels ပေါ်ရှိ သင့်အသံပစ္စည်း၏ နှုတ်ခမ်းစင့်ခ်လုပ်ခြင်းများနှင့် အခြားအရာများကို သင်ရှာတွေ့နိုင်ပါသည်။
အွန်လိုင်းဗီဒီယိုပစ္စည်း ပမာဏ တိုးများလာသည်နှင့်အမျှ လူများက သင့်ထုတ်ကုန် သို့မဟုတ် ဝန်ဆောင်မှုနှင့် ချိတ်ဆက်ပုံဆိုင်ရာ အရေးကြီးသော အချက်အလက်များကို လွဲမှားခြင်းမှ ရှောင်ရှားနိုင်ရန်၊ NER-based ဗီဒီယိုအကြောင်းအရာခွဲခြမ်းစိတ်ဖြာမှုအတွက် ပိုမိုမြန်ဆန်ပြီး တီထွင်ဆန်းသစ်သော နည်းပညာများသည် မရှိမဖြစ်လိုအပ်ပါသည်။
NER ၏ လက်တွေ့ကမ္ဘာအသုံးချမှု
အမည်ပေးထားသည့် အဖွဲ့အစည်း အသိအမှတ်ပြုခြင်း (NER) သည် လူများ၏အမည်များ၊ တည်နေရာများ၊ အမှတ်တံဆိပ်များ၊ ငွေကြေးတန်ဖိုးများနှင့် အခြားအရာများကဲ့သို့သော စာသားတစ်ခုရှိ မရှိမဖြစ်အချက်များကို ခွဲခြားသတ်မှတ်သည်။
စာသားတစ်ခုရှိ အဓိကအရာများကို ဖြည်ထုတ်ခြင်းသည် ကြီးမားသောဒေတာအတွဲများကို ကိုင်တွယ်ဖြေရှင်းရာတွင် အရေးကြီးသည့် ဖွဲ့စည်းပုံမရှိသောဒေတာကိုစီရန်နှင့် သိသာထင်ရှားသောအချက်အလက်များကိုရှာဖွေရာတွင် အထောက်အကူဖြစ်စေသည်။
ဤသည်မှာ အမည်ပေးထားသည့် entity အသိအမှတ်ပြုခြင်း၏ ဆွဲဆောင်မှုရှိသော လက်တွေ့ကမ္ဘာ ဥပမာအချို့ဖြစ်သည်။
ဖောက်သည်တုံ့ပြန်ချက်ကို ပိုင်းခြားစိတ်ဖြာခြင်း။
အွန်လိုင်းပြန်လည်သုံးသပ်ခြင်းများသည် သင့်ကုန်ပစ္စည်းနှင့်ပတ်သက်သော သုံးစွဲသူများကြိုက်နှစ်သက်မှုနှင့် မုန်းတီးမှုဆိုင်ရာ အသေးစိတ်အချက်အလက်များကို ပေးစွမ်းနိုင်သောကြောင့် သုံးစွဲသူများ၏ တုံ့ပြန်ချက်အား ကောင်းမွန်သောအရင်းအမြစ်တစ်ခုဖြစ်သည်။
ဤကလိုင်းယင့်ထည့်သွင်းမှုအားလုံးကို NER စနစ်များကို အသုံးပြု၍ စီစဉ်နိုင်ပြီး၊ ထပ်တလဲလဲ ပြဿနာများကို ဖော်ထုတ်နိုင်သည်။
ဥပမာအားဖြင့်၊ ဖောက်သည်ပြန်လည်သုံးသပ်ခြင်းများတွင် မကြာခဏကိုးကားခံရသောနေရာများကိုခွဲခြားသတ်မှတ်ရန် NER ကိုအသုံးပြုခြင်းဖြင့်၊ အချို့သောရုံးခွဲတစ်ခုကိုအာရုံစိုက်ရန် သင်ဆုံးဖြတ်နိုင်သည်။
အကြောင်းအရာအတွက် ထောက်ခံချက်
သင်ဖတ်နေသည့် ဆောင်းပါးများနှင့် ချိတ်ဆက်ထားသည့် ဆောင်းပါးများစာရင်းကို BBC နှင့် CNN ကဲ့သို့ ဝဘ်ဆိုက်များတွင် သင် ထိုနေရာတွင် ဖတ်သောအခါတွင် တွေ့နိုင်သည်။
ဤဝဘ်ဆိုဒ်များသည် NER ကို သင်ဖတ်နေသည့် အကြောင်းအရာမှ ၎င်းတို့ထုတ်နုတ်ထားသော အကြောင်းအရာများအကြောင်း အချက်အလက်များကို ပေးဆောင်သည့် အပိုဝဘ်ဆိုဒ်များအတွက် အကြံပြုချက်များ ပြုလုပ်ပါသည်။
Customer Support တွင် လက်မှတ်များကို စုစည်းပါ။
အကယ်၍ သင်သည် သုံးစွဲသူများထံမှ ပံ့ပိုးမှုလက်မှတ်အရေအတွက် တိုးလာမှုကို စီမံခန့်ခွဲပါက သုံးစွဲသူများ၏ တောင်းဆိုမှုများကို ပိုမိုလျင်မြန်စွာ တုံ့ပြန်ရန် အမည်ပေးထားသည့် အဖွဲ့အစည်း အသိအမှတ်ပြု အယ်လဂိုရီသမ်ကို အသုံးပြုနိုင်သည်။
ဖောက်သည်များ၏ မကျေနပ်ချက်များနှင့် စုံစမ်းမေးမြန်းမှုများကို အမျိုးအစားခွဲခြားခြင်း၊ သင့်ကိုယ်သင် ငွေချွေတာရန်၊ ဖောက်သည်များ၏ ပျော်ရွှင်မှုကို တိုးမြင့်လာစေရန်နှင့် ဖြေရှင်းမှုနှုန်းများ တိုးမြှင့်ခြင်းကဲ့သို့သော အချိန်ကုန်သော ဖောက်သည်စောင့်ရှောက်မှုများကို အလိုအလျောက်လုပ်ဆောင်ပါ။
ထိုပြဿနာကိုဖြေရှင်းရန်အတွက် မှန်ကန်သောအေးဂျင့် သို့မဟုတ် အဖွဲ့ထံသို့ လက်မှတ်များလမ်းကြောင်းပေးရာတွင် ပိုမိုလွယ်ကူစေရန် ထုတ်ကုန်အမည်များ သို့မဟုတ် အမှတ်စဉ်နံပါတ်များကဲ့သို့သော သက်ဆိုင်ရာဒေတာများကို ထုတ်ယူရန်အတွက်လည်း အသုံးပြုနိုင်သည်။
ရှာဖွေမှု algorithm
အချက်အလက် သန်းပေါင်းများစွာရှိတဲ့ ဝဘ်ဆိုဒ်တွေက သင့်ရှာဖွေမှုနဲ့ သက်ဆိုင်တဲ့ ရလဒ်တွေကို ဘယ်လိုထုတ်ပေးနိုင်သလဲလို့ သင်မေးခွန်းထုတ်ဖူးပါသလား။ ဝဘ်ဆိုဒ် ဝီကီပီးဒီးယားကို သုံးသပ်ကြည့်ပါ။
Wikipedia သည် “အလုပ်များ” ကို သင်ရှာဖွေသောအခါတွင် ရှာဖွေသည့်စကားလုံးနှင့် ဆက်စပ်နိုင်သည့် စာမျက်နှာတစ်ခုအား ၎င်းတို့တွင် “အလုပ်များ” ဟူသော စကားလုံးဖြင့် ဆောင်းပါးအားလုံးကို ပြန်ပေးမည့်အစား၊
ထို့ကြောင့်၊ Wikipedia သည် “အလုပ်အကိုင်” ဟုသတ်မှတ်ထားသော ဆောင်းပါး၊ Jobs အမည်ပေးထားသော လူများအတွက် ကဏ္ဍတစ်ခုနှင့် ရုပ်ရှင်များကဲ့သို့သော မီဒီယာများအတွက် အခြားနယ်ပယ်တစ်ခု၊ ဗီဒီယိုဂိမ်းများနှင့် "အလုပ်အကိုင်များ" ဟူသောအသုံးအနှုန်းပေါ်လာသည့် အခြားဖျော်ဖြေရေးပုံစံများ။
ရှာဖွေမှုစကားလုံးပါရှိသော တည်နေရာများအတွက် အခြားအပိုင်းကိုလည်း သင်တွေ့ရပါမည်။
ကိုယ်ရေးရာဇဝင်များကို ဂရုစိုက်ပါ။
စံပြလျှောက်ထားသူအား ရှာဖွေရာတွင် လူသစ်စုဆောင်းသူများသည် ၎င်းတို့၏နေ့စဉ်မှတ်တမ်းများကို ပြန်လည်သုံးသပ်ခြင်း၏ အရေးပါသောအစိတ်အပိုင်းကို အသုံးပြုကြသည်။ ကိုယ်ရေးရာဇဝင်တစ်ခုစီတွင် တူညီသောအချက်အလက်များရှိသော်လည်း ၎င်းတို့အားလုံးကို ကွဲပြားစွာတင်ပြပြီး ဖွဲ့စည်းတည်ဆောက်ပုံမထားသောဒေတာ၏ ပုံမှန်ဥပမာတစ်ခုဖြစ်သည်။
ကိုယ်ရေးကိုယ်တာအချက်အလက်များ (အမည်၊ လိပ်စာ၊ ဖုန်းနံပါတ်၊ မွေးသက္ကရာဇ်နှင့် အီးမေးလ်ကဲ့သို့သော) နှင့် ၎င်းတို့၏ ပညာရေးနှင့် အတွေ့အကြုံ (ဥပမာ လက်မှတ်များ၊ ဘွဲ့လက်မှတ်များကဲ့သို့သော ကိုယ်ရေးကိုယ်တာအချက်အလက်များ အပါအဝင် entity extractors များကို စုဆောင်းအသုံးပြုသည့် အဖွဲ့များက ခေါ်ယူခြင်းဖြင့် လျှောက်ထားသူများ၏ အသက်ဆိုင်ဆုံးအချက်အလက်များကို လျင်မြန်စွာထုတ်ယူနိုင်သည်။ ကုမ္ပဏီအမည်များ၊ ကျွမ်းကျင်မှုများ၊ စသည်)။
e-commerce
၎င်းတို့၏ ထုတ်ကုန်ရှာဖွေမှု အယ်လဂိုရီသမ်နှင့်ပတ်သက်၍၊ ရာနှင့်ချီသော ကုန်ပစ္စည်းထောင်ပေါင်းများစွာရှိသော အွန်လိုင်းလက်လီရောင်းချသူများသည် NER ထံမှ အကျိုးအမြတ်ရရှိမည်ဖြစ်သည်။
NER မပါဘဲ၊ "အနက်ရောင်သားရေဘွတ်ဖိနပ်" ကိုရှာဖွေခြင်းသည် အနက်ရောင်မဟုတ်သော သားရေနှင့် ဖိနပ်နှစ်ခုလုံးပါ၀င်သည့် ရလဒ်များကို ပြန်ပေးလိမ့်မည်။ သို့ဆိုလျှင် e-commerce ဝဘ်ဆိုဒ်များသည် ဖောက်သည်များ ဆုံးရှုံးနိုင်ခြေရှိသည်။
In ကျွန်ုပ်တို့၏ကိစ္စတွင်၊ NER သည် ရှာဖွေရေးစကားလုံးကို သားရေဖိနပ်နှင့် အနက်ရောင်အတွက် ထုတ်ကုန်အမျိုးအစားအဖြစ် အမျိုးအစားခွဲမည်ဖြစ်သည်။
အကောင်းဆုံး Entity Extraction API များ
Google Cloud NLP
လေ့ကျင့်ပြီးသား ကိရိယာများအတွက် Google Cloud NLP သည် ၎င်း၏ Natural Language API ကို ပံ့ပိုးပေးပါသည်။ သို့မဟုတ်၊ သင့်စက်မှုလုပ်ငန်း၏ အသုံးအနှုန်းများကို သင်ပညာပေးလိုပါက AutoML Natural Language API သည် စာသားထုတ်ယူခြင်းနှင့် ခွဲခြမ်းစိတ်ဖြာမှု အမျိုးအစားများစွာအတွက် လိုက်လျောညီထွေဖြစ်စေသည်။
API များသည် Gmail၊ Google Sheets နှင့် အခြား Google အက်ပ်များနှင့် လွယ်ကူစွာ အပြန်အလှန် ဆက်သွယ်နိုင်သော်လည်း ၎င်းတို့ကို ပြင်ပပရိုဂရမ်များနှင့် အသုံးပြုခြင်းဖြင့် ပိုမိုရှုပ်ထွေးသော ကုဒ်များ လိုအပ်နိုင်သည်။
စံပြလုပ်ငန်းရွေးချယ်ခွင့်မှာ Google အက်ပ်လီကေးရှင်းများနှင့် Cloud Storage ကို စီမံခန့်ခွဲထားသော ဝန်ဆောင်မှုများနှင့် API များအဖြစ် ချိတ်ဆက်ရန်ဖြစ်သည်။
IBM က Watson
IBM Watson သည် အသံနှင့် ဖုန်းခေါ်ဆိုမှုများကို အလိုအလျောက် ပိုင်းခြားစိတ်ဖြာနိုင်သည့် အံ့သြဖွယ်ကောင်းသော ဆော့ဖ်ဝဲဖြစ်သည့် စကားပြောမှ စာတိုကဲ့သို့သော ကြိုတင်တည်ဆောက်ထားသော စွမ်းရည်များကို ပေးစွမ်းသည့် ကလောက်အများအပြား cloud platform တစ်ခုဖြစ်သည်။
CSV ဒေတာကိုအသုံးပြုခြင်းဖြင့် Watson Natural Language Understanding ၏ နက်နဲသောသင်ယူမှု AI သည် အကြောင်းအရာများ သို့မဟုတ် သော့ချက်စာလုံးများကို ထုတ်ယူရန်အတွက် ထုတ်ယူမှုပုံစံများကို ဖန်တီးနိုင်သည်။
လက်တွေ့အားဖြင့်၊ သင်သည် ပို၍ ဆန်းပြားသော မော်ဒယ်များကို ဖန်တီးနိုင်သည်။ ကျယ်ပြန့်သော coding အသိပညာလိုအပ်သော်လည်း ၎င်း၏လုပ်ဆောင်ချက်အားလုံးကို APIs များမှတစ်ဆင့် ရယူနိုင်သည်။
အလွန်ကြီးမားသော ဒေတာအတွဲများကို ဆန်းစစ်ရန်နှင့် စက်တွင်းနည်းပညာဆိုင်ရာ အရင်းအမြစ်များ ပါ၀င်သော ကြီးမားသော စီးပွားရေးလုပ်ငန်းကြီးများအတွက် ၎င်းသည် ကောင်းမွန်စွာ အလုပ်လုပ်ပါသည်။
Cortical.io
အာရုံကြောပညာမှ အယူအဆတစ်ခုဖြစ်သော Semantic Folding ကိုအသုံးပြု၍ Cortical.io သည် စာသားထုတ်ယူခြင်းနှင့် NLU ဖြေရှင်းချက်များကို ပံ့ပိုးပေးသည်။
၎င်းသည် စာသားတစ်ခုလုံးနှင့် တိကျသောအသုံးအနှုန်းများတွင် စာသားတစ်ခု၏အဓိပ္ပာယ်နှစ်ခုလုံးကိုဖော်ပြသည့် "အခေါ်အဝေါ်လက်ဗွေများ" ထုတ်လုပ်ရန် လုပ်ဆောင်သည်။ စကားလုံးအစုအဝေးများကြား ဆက်စပ်မှုများကို သရုပ်ပြရန်အတွက်၊ အဓိပ္ပါယ်ရှိသော လက်ဗွေများသည် စာသားဒေတာကို ဖော်ပြသည်။
Cortical.io ၏အပြန်အလှန်အကျိုးသက်ရောက်သော API စာရွက်စာတမ်းသည် စာသားခွဲခြမ်းစိတ်ဖြာမှုဖြေရှင်းချက်တစ်ခုစီ၏လုပ်ဆောင်နိုင်စွမ်းကို အကျုံးဝင်ပြီး Java၊ Python နှင့် Javascript APIs များကို အသုံးပြု၍ ဝင်ရောက်ရန် ရိုးရှင်းပါသည်။
Cortical.io မှ Contract Intelligence tool ကို တရားရေးဆိုင်ရာ ခွဲခြမ်းစိတ်ဖြာမှုအတွက် အထူးဖန်တီးထားပြီး ဝေါဟာရရှာဖွေမှုများ ပြုလုပ်ရန်၊ စကင်န်ဖတ်ထားသော စာရွက်စာတမ်းများကို အသွင်ပြောင်းရန်နှင့် မှတ်ချက်ဖြင့် မြှင့်တင်ရန်တို့ကို ကူညီပေးပါသည်။
အထူးသဖြင့် ဥပဒေကဏ္ဍတွင် AI အသိပညာမလိုအပ်သော ရိုးရှင်းသောအသုံးပြုမှု API များကို ရှာဖွေနေသည့် စီးပွားရေးလုပ်ငန်းများအတွက် စံပြဖြစ်သည်။
မျောက်လေ့လာပါ။
အဓိကကွန်ပြူတာဘာသာစကားအားလုံးကို MonkeyLearn ၏ APIs များမှပံ့ပိုးထားပြီး သင့်ထုတ်နှုတ်ထားသောအရာများပါရှိသော JSON ဖိုင်တစ်ခုထုတ်လုပ်ရန် ကုဒ်လိုင်းအနည်းငယ်ကိုသာ စနစ်ထည့်သွင်းပါ။ ကြိုတင်လေ့ကျင့်မှုဖြင့် ထုတ်ယူသူများနှင့် စာသားလေ့လာသုံးသပ်သူများအတွက်၊ အင်တာဖေ့စ်သည် အသုံးပြုရလွယ်ကူသည်။
သို့မဟုတ်၊ ရိုးရှင်းသောအဆင့်အနည်းငယ်တွင်၊ သင်သည် ထူးခြားသောထုတ်ယူမှုတစ်ခုကို ဖန်တီးနိုင်သည်။ အချိန်ကို လျှော့ချပြီး တိကျမှုကို မြှင့်တင်ရန်၊ နက်နဲသော အဆင့်မြင့် သဘာဝဘာသာစကား လုပ်ဆောင်ခြင်း (NLP) စက်သင်ယူမှု စာသားကို လူတစ်ယောက်လို အကဲဖြတ်နိုင်စေတယ်။
ထို့အပြင်၊ SaaS APIs များသည် Google Sheets၊ Excel၊ Zapier၊ Zendesk နှင့် အခြားအရာများကဲ့သို့ ကိရိယာများနှင့် ချိတ်ဆက်မှုများကို နှစ်ပေါင်းများစွာ ကွန်ပျူတာသိပ္ပံအသိပညာ မလိုအပ်ကြောင်း သေချာစေပါသည်။
သင့်ဘရောက်ဆာတွင် လက်ရှိရရှိနိုင်သော အမည်ထုတ်ယူသူ၊ ကုမ္ပဏီထုတ်ယူသူနှင့် တည်နေရာထုတ်ယူသည့်ကိရိယာများဖြစ်သည်။ သင့်ကိုယ်ပိုင်တည်ဆောက်ပုံဆိုင်ရာ အချက်အလက်အတွက်၊ အမည်ရှိ အဖွဲ့အစည်းအသိအမှတ်ပြုဘလော့ဂ်ဆောင်းပါးကို ကြည့်ပါ။
စာသားထုတ်ယူခြင်းနှင့် စာသားခွဲခြမ်းစိတ်ဖြာမှု အမျိုးအစားအမျိုးမျိုးအတွက် ရိုးရှင်းလွယ်ကူသော API များကို အကောင်အထည်ဖော်ရန် လိုအပ်သော နည်းပညာ၊ လက်လီ၊ နှင့် e-commerce တွင်ပါ၀င်သော အရွယ်အစားအားလုံးရှိ စီးပွားရေးလုပ်ငန်းများအတွက် စံပြဖြစ်သည်။
Amazon နားလည်မှု
Amazon Comprehend ၏ကြိုတင်တည်ဆောက်ထားသောကိရိယာများကို ချက်ချင်းလွယ်ကူစွာ ပလပ်ထိုး၍ အသုံးပြုနိုင်ရန် ၎င်းတို့ကို နယ်ပယ်ရာနှင့်ချီ၍ လေ့ကျင့်သင်ကြားပေးထားသည်။
ဤသည်မှာ စောင့်ကြည့်ထားသော ဝန်ဆောင်မှုတစ်ခုဖြစ်သောကြောင့် အိမ်တွင်းဆာဗာများ မလိုအပ်ပါ။ အထူးသဖြင့် သင်သည် လက်ရှိ Amazon ၏ cloud ကို အဆင့်တစ်ခုအထိ အသုံးပြုပါက၊ ၎င်းတို့၏ API များသည် ယခင်ရှိပြီးသားအက်ပ်များနှင့် အလွယ်တကူ ပေါင်းစပ်နိုင်သည်။ အနည်းငယ်ပိုလေ့ကျင့်ခြင်းဖြင့်သာ ထုတ်ယူမှုတိကျမှုကို မြှင့်တင်နိုင်သည်။
ဆေးမှတ်တမ်းများနှင့် လက်တွေ့စမ်းသပ်မှုများမှ ဒေတာရယူခြင်းအတွက် အားကိုးရဆုံးသော စာသားခွဲခြမ်းစိတ်ဖြာမှုနည်းလမ်းများထဲမှ တစ်ခုသည် ဆေးဝါးများ၊ အခြေအနေများ၊ စမ်းသပ်မှုရလဒ်များနှင့် လုပ်ထုံးလုပ်နည်းများဆိုင်ရာ အသေးစိတ်အချက်အလက်များကို ထုတ်ယူနိုင်သည့် Comprehend's Medical Named Entity and Relationship Extraction (NERe) ဖြစ်သည်။
လူနာဒေတာကို အကဲဖြတ်ပြီး သေချာချိန်ညှိစစ်ဆေးသောအခါတွင် အလွန်အကျိုးရှိနိုင်ပါသည်။ ကြိုတင်လေ့ကျင့်ထားသော ကိရိယာများဖြင့် စီမံခန့်ခွဲထားသော ဝန်ဆောင်မှုကို ရှာဖွေနေသည့် စီးပွားရေးလုပ်ငန်းများအတွက် အကောင်းဆုံးရွေးချယ်မှု။
Aylien
ခိုင်မာသောစက်သင်ယူမှုစာသားခွဲခြမ်းစိတ်ဖြာမှုကို လွယ်ကူစွာဝင်ရောက်နိုင်ရန် AYLIEN သည် လူကြိုက်များသောပရိုဂရမ်ဘာသာစကားခုနစ်မျိုးဖြင့် API plug-in သုံးခုကို ပံ့ပိုးပေးပါသည်။
၎င်းတို့၏ News API သည် ကမ္ဘာတစ်ဝှမ်းမှ ထောင်သောင်းချီသော သတင်းရင်းမြစ်များမှ အချိန်နှင့်တစ်ပြေးညီ ရှာဖွေမှုနှင့် အကြောင်းအရာကို ထုတ်ယူမှုကို ပံ့ပိုးပေးပါသည်။
အကြောင်းအရာ ထုတ်ယူခြင်းနှင့် အခြားသော စာသားခွဲခြမ်းစိတ်ဖြာခြင်း လုပ်ငန်းများစွာကို စာရွက်စာတမ်းများတွင် Text Analysis API ကို အသုံးပြု၍ ဆောင်ရွက်နိုင်သည်။ လူမှုမီဒီယာ ပလပ်ဖောင်းများ၊ စားသုံးသူစစ်တမ်းများနှင့် အခြားအရာများ။
နောက်ဆုံးအနေဖြင့်၊ Text Analysis Platform ကိုအသုံးပြု၍ သင်သည် သင်၏ကိုယ်ပိုင် extractors ကိုဖန်တီးနိုင်ပြီး သင်၏ browser (TAP) တွင် ပိုမိုဖြောင့်တန်းစွာလုပ်ဆောင်နိုင်ပါသည်။ အဓိကအားဖြင့် သတ်မှတ်ထားသော API များကို လျင်မြန်စွာ ပေါင်းစပ်လိုသော ကုမ္ပဏီများအတွက် ၎င်းသည် ကောင်းမွန်စွာ အလုပ်လုပ်ပါသည်။
SpaCy
SpaCy သည် Python Natural Language Processing (NLP) ပက်ကေ့ဂျ်ဖြစ်ပြီး open-source၊ အခမဲ့ဖြစ်ပြီး ပါ၀င်သည့်အင်္ဂါရပ်များစွာပါရှိသည်။
ဒါဟာ ပိုပိုပြီး အဖြစ်များလာတယ်။ NLP ဒေတာ လုပ်ဆောင်ခြင်းနှင့် ခွဲခြမ်းစိတ်ဖြာခြင်း။ ဖွဲ့စည်းပုံမရှိသော စာသားဒေတာကို ကြီးမားသောအတိုင်းအတာဖြင့် ဖန်တီးထားသောကြောင့် ၎င်းကိုခွဲခြမ်းစိတ်ဖြာပြီး ထိုးထွင်းသိမြင်မှုများကို ထုတ်ယူရန် အရေးကြီးပါသည်။
အဲဒါကို ပြီးမြောက်ဖို့၊ အချက်အလက်တွေကို ကွန်ပျူတာတွေ နားလည်နိုင်တဲ့ နည်းလမ်းနဲ့ ပုံဖော်ရပါမယ်။ NLP မှတဆင့်သင်ပြုလုပ်နိုင်သည်။ 30ms သာ နောက်ကျကျန်နေသဖြင့် အလွန်လျင်မြန်သော်လည်း အရေးကြီးသည်မှာ HTTPS စာမျက်နှာများကို အသုံးပြုရန်အတွက် မရည်ရွယ်ပါ။
၎င်းသည် ပြည်တွင်းတွင် လုပ်ဆောင်နေသောကြောင့် သင့်ကိုယ်ပိုင်ဆာဗာများ သို့မဟုတ် အင်ထရာနက်ကို စကင်န်ဖတ်ခြင်းအတွက် ကောင်းမွန်သောရွေးချယ်မှုတစ်ခုဖြစ်သော်လည်း ၎င်းသည် အင်တာနက်တစ်ခုလုံးကို လေ့လာရန်အတွက် ကိရိယာတစ်ခုမဟုတ်ပါ။
ကောက်ချက်
အမည်ပေးထားသည့် entity recognition (NER) သည် ဖောက်သည်ပံ့ပိုးမှုတောင်းဆိုမှုများတွင် သက်ဆိုင်ရာအချက်အလက်များကို အညွှန်းတပ်ရန်၊ ဖောက်သည်တုံ့ပြန်ချက်တွင် ကိုးကားထားသည့်အရာများကို ရှာဖွေရန်နှင့် အဆက်အသွယ်အသေးစိတ်၊ တည်နေရာနှင့် ရက်စွဲများကဲ့သို့သော အရေးကြီးသောဒေတာများကို အမြန်ထုတ်ယူနိုင်သည့်စနစ်တစ်ခုဖြစ်သည်။
entity recognition အမည်ပေးခံရခြင်းအတွက် အသုံးအများဆုံးနည်းလမ်းမှာ entity extraction APIs (၎င်းတို့ကို open-source libraries သို့မဟုတ် SaaS ထုတ်ကုန်များမှ ပံ့ပိုးပေးသည်ဖြစ်စေ) မှတဆင့်ဖြစ်သည်။
သို့သော်၊ အကောင်းဆုံးနည်းလမ်းကို ရွေးချယ်ခြင်းသည် သင်၏အချိန်၊ ငွေကြေးနှင့် ကျွမ်းကျင်မှုအပေါ် မူတည်ပါသည်။ မည်သည့်လုပ်ငန်းမျိုးအတွက်မဆို entity ထုတ်ယူခြင်းနှင့် ပိုမိုခေတ်မီသော စာသားခွဲခြမ်းစိတ်ဖြာခြင်းနည်းပညာများသည် အကျိုးကျေးဇူးများစွာရရှိနိုင်ပါသည်။
စက်သင်ယူမှုကိရိယာများကို မှန်ကန်စွာ သင်ကြားပေးသောအခါ ၎င်းတို့သည် တိကျမှန်ကန်ပြီး မည်သည့်ဒေတာကိုမျှ လျစ်လျူမရှုဘဲ သင့်အချိန်နှင့်ငွေကို သက်သာစေပါသည်။ APIs များကို ပေါင်းစပ်ခြင်းဖြင့် အဆက်မပြတ်နှင့် အလိုအလျောက် လုပ်ဆောင်ရန် ဤဖြေရှင်းချက်များကို သင် configure လုပ်နိုင်ပါသည်။
သင့်ကုမ္ပဏီအတွက် အသင့်တော်ဆုံး လုပ်ဆောင်ချက်ကို ရိုးရှင်းစွာရွေးချယ်ပါ။
တစ်ဦးစာပြန်ရန် Leave