فهرست[پټ][ښکاره]
موږ طبیعي وړتیا لرو چې کلمې په اشخاصو، ځایونو، ځایونو، ارزښتونو او نورو کې وپیژنو او طبقه بندي کړو هرکله چې موږ یې واورو یا یې ولولو. انسانان کولی شي په چټکۍ سره د کلمو درجه بندي، پیژندنه او پوه شي.
د مثال په توګه، تاسو کولی شئ یو څیز طبقه بندي کړئ او په چټکۍ سره لږترلږه له دریو څخه تر څلورو ځانګړتیاو سره راشي کله چې تاسو د "سټیو جابز" نوم واورئ.
- سړی: سټیو جابز
- سازمان: "ایپل"
- ځای: "کلیفورنیا"
څرنګه چې کمپیوټرونه دا طبیعي مهارت نلري، موږ باید د کلمو یا متن په پیژندلو او طبقه بندي کولو کې ورسره مرسته وکړو. په دې حالت کې د وجود پیژندنه (NER) نومول کیږي.
پدې مقاله کې، موږ به د NER (نوم شوي وجود پیژندنه) په تفصیل سره وڅیړو، پشمول د دې اهمیت، ګټې، د NER غوره APIs، او نور ډیر څه.
NER (نوم شوی وجود پیژندنه) څه شی دی؟
د طبیعي ژبې پروسس کولو (NLP) طریقه چې د نوم شوي وجود پیژندنې (NER) په نوم پیژندل کیږي، کله ناکله د وجود پیژندنې یا د وجود استخراج په نوم پیژندل کیږي، په اوتومات ډول په متن کې نومول شوي ادارې پیژني او په مخکې ټاکل شوي کټګوریو کې ګروپ کوي.
په ادارو کې د افرادو نومونه، ډلې، ځایونه، نیټې، مقدارونه، د ډالرو اندازه، سلنه، او نور شامل دي. د نوم شوي وجود پیژندنې سره، تاسو کولی شئ دا د ډیټابیس لپاره د پام وړ معلوماتو راټولولو یا د حیاتي معلوماتو استخراج لپاره وکاروئ ترڅو پوه شئ چې سند څه شی دی.
NER هغه بنسټ دی چې د AI سیسټم د اړونده سیمانټیک او احساساتو لپاره متن تحلیل کولو لپاره تکیه کوي، حتی که NLP د متن تحلیلي پروسې کې د پام وړ پرمختګ استازیتوب کوي.
د NER اهمیت څه دی؟
د متن تحلیلي چلند بنسټ NER دی. د ML ماډل باید په پیل کې په ملیونونو نمونې د دمخه ټاکل شوي کټګوریو سره ورکړل شي مخکې لدې چې په انګلیسي پوه شي.
API په متنونو کې د دې اجزاوو په پیژندلو کې د وخت سره وده کوي چې دا د لومړي ځل لپاره لوستل کیږي. د متن تحلیلي انجن ځواک د NER وړتیا وړتیا او ځواک سره وده کوي.
لکه څنګه چې دلته لیدل کیږي، د ML ډیری عملیات د NER لخوا پیل شوي.
سیمالټ لټون
سیمالټ لټون اوس په ګوګل کې شتون لري. تاسو کولی شئ یوه پوښتنه دننه کړئ، او دا به د ځواب سره د ځواب ویلو هڅه وکړي. د معلوماتو موندلو لپاره، یو کاروونکي په لټه کې دي، ډیجیټل معاونین لکه الیکسا، سری، چیټ بوټس، او نور د سیمانټیک لټون ډول کاروي.
دا فنکشن مات یا ورک کیدی شي، مګر د دې لپاره د کارونې مخ په زیاتیدونکي شمیر شتون لري، او د دوی اغیزمنتوب په چټکۍ سره وده کوي.
د ډاټا انټرنېټونه
دا د غیر منظم شوي معلوماتو څخه تحلیل رامینځته کولو لپاره د الګوریتم کارولو لپاره عمومي جمله ده. دا د اړونده معلوماتو موندلو او راټولولو پروسې سره د دې معلوماتو ښودلو لپاره میتودونه مدغم کوي.
دا کیدای شي د پایلو د مستقیم احصایوي توضیحاتو یا د معلوماتو بصری استازیتوب بڼه ونیسي. د یوې ځانګړې موضوع سره د علاقې او ښکیلتیا تحلیل د یوټیوب لیدونو څخه د معلوماتو په کارولو سره ترسره کیدی شي ، پشمول کله چې لیدونکي یو ځانګړي ویډیو کلیک کوي.
د محصول ستوري درجه بندي د ای کامرس سایټونو څخه د ډیټا سکریپینګ په کارولو سره تحلیل کیدی شي ترڅو عمومي نمرې چمتو کړي چې محصول څومره ښه کوي.
د احساس تحلیل
د NER نور سپړنه، جذب تحلیل حتی د ستوري درجې څخه د معلوماتو په نشتوالي کې د ښه او بد بیاکتنې ترمینځ توپیر کولی شي.
دا معلومه ده چې د "زیات شوي"، "چټک" او "احمق" په څیر اصطلاحات منفي مفهوم لري، پداسې حال کې چې د "ګټور"، "چټک" او "اسانه" په څیر اصطلاحات لري. د "اسانه" کلمه د کمپیوټر لوبې کې په منفي ډول تشریح کیدی شي.
پیچلي الګوریتمونه هم کولی شي د شیانو ترمنځ اړیکه وپیژني.
د متن تحلیلونه
د معلوماتو تحلیلونو ته ورته، د متن تحلیل د غیر منظم متن تارونو څخه معلومات استخراجوي او په مهمو معلوماتو کې د صفر څخه NER کاروي.
دا د محصول ذکر، اوسط قیمت، یا هغه شرایط چې پیرودونکي ډیری وختونه د یو ځانګړي برانډ تشریح کولو لپاره کاروي د معلوماتو راټولولو لپاره کارول کیدی شي.
د ویډیو منځپانګې تحلیل
ترټولو پیچلي سیسټمونه هغه دي چې د مخ پیژندنې، آډیو تحلیل، او انځور پیژندنې په کارولو سره د ویډیو معلوماتو څخه ډاټا استخراجوي.
د ویډیو مینځپانګې تحلیل په کارولو سره ، تاسو کولی شئ د یوټیوب "ان باکسینګ" ویډیوګانې ومومئ ، د ټویچ لوبې مظاهرې ، په ریلز کې ستاسو د آډیو موادو د شونډو ترکیب ، او نور ډیر څه.
د دې لپاره چې خلک ستاسو محصول یا خدمت سره څنګه وصل کیږي د مهم معلوماتو له لاسه ورکولو څخه مخنیوي لپاره څنګه چې د آنلاین ویډیو موادو حجم وده کوي ، د NER پراساس ویډیو مینځپانګې تحلیل لپاره ګړندي او ډیر اختراعي تخنیکونه اړین دي.
د NER ریښتیني نړۍ غوښتنلیک
د نوم شوي وجود پیژندنه (NER) په متن کې اړین اړخونه پیژني لکه د خلکو نومونه، موقعیتونه، نښې، پولي ارزښتونه او نور.
په متن کې د لویو ادارو استخراج د غیر منظم ډیټا په ترتیب کولو او د پام وړ معلوماتو موندلو کې مرسته کوي ، کوم چې د لوی ډیټاسیټونو سره معامله کولو کې خورا مهم دی.
دلته د نوم شوي وجود پیژندنې ځینې زړه راښکونکي ریښتیني نړۍ مثالونه دي:
د پیرودونکو نظرونو تحلیل
آنلاین بیاکتنې د پیرودونکو نظرونو یوه ښه سرچینه ده ځکه چې دوی کولی شي تاسو ته د دې په اړه مفصل معلومات درکړي چې پیرودونکي ستاسو د توکو په اړه څه خوښوي او کرکه کوي او همدارنګه ستاسو د شرکت کومې برخې باید وده ومومي.
د دې ټولو مراجعینو آخذه د NER سیسټمونو په کارولو سره تنظیم کیدی شي، کوم چې کولی شي بیا تکراري مسلې هم وپیژني.
د مثال په توګه، د NER په کارولو سره د هغه ځایونو پیژندلو لپاره چې ډیری وختونه د پیرودونکو په ناسمو بیاکتنو کې حواله شوي، تاسو کولی شئ پریکړه وکړئ چې په یو ځانګړي دفتر څانګه تمرکز وکړئ.
د منځپانګې لپاره سپارښتنه
د مقالو یو لیست چې له هغه سره تړلی دی چې تاسو یې لوستلی شئ د BBC او CNN په څیر ویب پاڼو کې موندل کیدی شي کله چې تاسو هلته یو توکي ولولئ.
دا ویب پاڼې د اضافي ویب پاڼو لپاره سپارښتنې وړاندې کوي چې د هغو ادارو په اړه معلومات وړاندې کوي چې دوی د هغه محتوياتو څخه چې تاسو یې د NER په کارولو سره لوستلی وي استخراج کړي.
د پیرودونکي ملاتړ کې ټکټونه تنظیم کړئ
تاسو کولی شئ د نومول شوي ادارې پیژندنې الګوریتمونه وکاروئ ترڅو د پیرودونکي غوښتنو ته ډیر ګړندي ځواب ووایی که تاسو د پیرودونکو څخه د ملاتړ ټیکټونو شمیر کې زیاتوالی اداره کوئ.
د وخت مصرف کونکي پیرودونکي پاملرنې دندې اتومات کړئ ، لکه د پیرودونکو شکایاتو او پوښتنو طبقه بندي کول ، د ځان د پیسو خوندي کولو لپاره ، د پیرودونکي خوښي زیاته کړئ ، او د حل نرخونه لوړ کړئ.
د ادارې استخراج د اړونده معلوماتو استخراج لپاره هم کارول کیدی شي ، لکه د محصول نومونه یا سریال نمبرونه ، ترڅو د دې مسلې د حل لپاره سم اجنټ یا ټیم ته ټکټونه اسانه کړي.
د لټون الګوریتم
ایا تاسو کله هم پوښتنه کړې چې څنګه د ملیونونو ټوټو معلوماتو سره ویب پاڼې کولی شي پایلې تولید کړي چې ستاسو د لټون سره سم وي؟ د ويکيپېډيا ويب پاڼې ته پام وکړئ.
ويکيپېډيا هغه پاڼه ښکاره کوي چې مخکې تعريف شوي ادارې لري چې د لټون اصطلاح ورسره تړاو لري کله چې تاسو د "دندو" لټون کوئ، د دې پر ځای چې ټولې مقالې د "دندو" کلمې سره بیرته راوباسئ.
په دې توګه، ویکیپیډیا د مقالې لپاره یو لینک وړاندې کوي چې "اشغال" تعریفوي، د دندې په نوم د خلکو لپاره یوه برخه، او د رسنیو لپاره بله ساحه لکه فلمونه، ويډيو ګېم، او د تفریح نور ډولونه چیرې چې د "دندو" اصطلاح څرګندیږي.
تاسو به د هغو ځایونو لپاره بله برخه هم وګورئ چې د لټون کلمه لري.
د بیا پیلولو پاملرنه
د مثالي غوښتونکي په لټه کې ، ګمارونکي د دوی د ورځې د پام وړ برخه د بیاکتنې بیاکتنې مصرفوي. هر ریزوم یو شان معلومات لري، مګر دوی ټول وړاندې شوي او په مختلف ډول تنظیم شوي، کوم چې د غیر منظم شوي معلوماتو یوه بیلګه ده.
د کاندیدانو په اړه خورا اړین معلومات د ادارې استخراج کونکو ګمارلو ټیمونو لخوا په چټکۍ سره استخراج کیدی شي، په شمول د شخصي معلوماتو (لکه نوم، پته، د تلیفون شمیره، د زیږون نیټه، او بریښنالیک) او د دوی د زده کړې او تجربې په اړه معلومات (لکه سندونه، درجې) د شرکت نومونه، مهارتونه، او نور).
پست سوداګرۍ
د دوی د محصول لټون الګوریتم په اړه، آنلاین پرچون پلورونکي د سلګونو یا زرګونو توکو سره به د NER څخه ګټه پورته کړي.
د NER پرته، د "تور څرمن بوټانو" لټون به پایلې راوړي چې دواړه چرم او بوټان پکې شامل دي چې تور نه و. که داسې وي، د ای کامرس ویب پاڼې د پیرودونکو له لاسه ورکولو خطر لري.
Iزموږ په قضیه کې، NER به د لټون کلمه د څرمن بوټانو لپاره د محصول ډول او تور رنګ په توګه طبقه بندي کړي.
د غوره ادارې استخراج APIs
د ګوګل کلاوډ NLP
د دمخه روزل شوي وسیلو لپاره ، د ګوګل کلاوډ NLP خپل طبیعي ژبه API چمتو کوي. یا، د AutoML طبیعي ژبې API د متن استخراج او تحلیل ډیری ډولونو لپاره د تطبیق وړ دی که تاسو غواړئ خپل وسایل د خپل صنعت په اصطلاحاتو کې زده کړئ.
APIs په اسانۍ سره د Gmail، ګوګل شیټونو، او نورو ګوګل ایپسونو سره اړیکه لري، مګر د دریمې ډلې برنامو سره کارول کیدی شي ډیر پیچلي کوډ ته اړتیا ولري.
د سوداګرۍ غوره اختیار د ګوګل غوښتنلیکونه او کلاوډ ذخیره د مدیریت شوي خدماتو او APIs په توګه وصل کول دي.
IBM Watson
IBM واټسن یو ملټي کلاوډ پلیټ فارم دی چې په زړه پورې ډول ګړندی فعالیت کوي او دمخه جوړ شوي وړتیاوې چمتو کوي ، لکه د وینا څخه متن ، کوم چې په زړه پوري سافټویر دی چې کولی شي په اتوماتيک ډول ثبت شوي آډیو او تلیفون زنګونه تحلیل کړي.
د CSV ډیټا په کارولو سره، د واټسن طبیعي ژبې پوهه ژوره زده کړې AI کولی شي د استخراج ماډلونه رامینځته کړي ترڅو د ادارو یا کلیمو استخراج کړي.
او د تمرین سره، تاسو کولی شئ ماډلونه جوړ کړئ چې خورا پیچلي دي. د دې ټول فعالیتونه د APIs له لارې د لاسرسي وړ دي، که څه هم د کوډ کولو پراخه پوهه ته اړتیا ده.
دا د لویو سوداګرۍ لپاره ښه کار کوي چې اړتیا لري لوی ډیټاسیټونه معاینه کړي او داخلي تخنیکي سرچینې ولري.
Cortical.io
د سیمانټیک فولډینګ کارول، د نیورولوژي څخه یوه مفکوره، Cortical.io د متن استخراج او NLU حلونه وړاندې کوي.
دا د "سیمنټیک ګوتو نښې" رامینځته کولو لپاره ترسره کیږي ، کوم چې د متن معنی په بشپړ او ځانګړي شرایطو کې دواړه په ګوته کوي. د کلمو کلسترونو ترمنځ د اړیکو د ښودلو لپاره، د سیمانټیک ګوتو نښې د متن ډاټا انځوروي.
د Cortical.io متقابل API اسناد د هر متن تحلیلي حلونو فعالیت پوښي، او دا د جاوا، پایتون، او جاواسکریپټ APIs په کارولو سره د لاسرسي لپاره ساده دی.
د Cortical.io څخه د قرارداد استخباراتو وسیله په ځانګړي ډول د قانوني تحلیل لپاره رامینځته شوې ترڅو سیمانټیک لټونونه وکړي ، سکین شوي اسناد بدل کړي ، او د تشریح سره مرسته او وده وکړي.
دا د سوداګرۍ لپاره مثالی دی چې د ساده کارولو APIs په لټه کې دي چې د AI پوهې ته اړتیا نلري ، په ځانګړي توګه په قانوني سکتور کې.
بندر زده کړه
د کمپیوټر ټولې لویې ژبې د MonkeyLearn's APIs لخوا ملاتړ کیږي او یوازې د کوډ یوازې څو کرښې تنظیموي ترڅو د JSON فایل تولید کړي چې ستاسو استخراج شوي ادارې لري. د مخکینۍ روزنې سره د استخراج کونکو او متن شنونکو لپاره ، انٹرفیس د کارونکي دوستانه دی.
یا، یوازې په یو څو ساده ګامونو کې، تاسو کولی شئ یو ځانګړی استخراج جوړ کړئ. د وخت کمولو او دقت ښه کولو لپاره، د ژورو سره د طبیعي ژبې پرمختللي پروسس کول (NLP). ماشین زده کړه تاسو ته دا توان درکوي چې متن د یو شخص په څیر ارزونه وکړي.
برسیره پردې، SaaS APIs ډاډ ترلاسه کوي چې د ګوګل شیټ، ایکسل، زاپیر، زینډیسک، او نورو سره د وسیلو سره د اړیکو تنظیم کول د کلونو کلونو کمپیوټر ساینس پوهه ته اړتیا نلري.
اوس مهال ستاسو په براوزر کې شتون لري نوم استخراج، شرکت استخراج، او ځای استخراج. د خپل ځان د جوړولو څرنګوالي په اړه د معلوماتو لپاره، د نوم ادارې پیژندنې بلاګ مقاله وګورئ.
دا د ټیکنالوژۍ، پرچون، او ای کامرس کې د ټولو اندازو سوداګرۍ لپاره مثالی دی چې د متن استخراج او متن تحلیل مختلف ډولونو لپاره ساده څخه پلي کولو APIs ته اړتیا لري.
د ایمیزون پرتله کول
د دې لپاره چې سمدلاسه د Amazon Comprehend دمخه جوړ شوي وسیلې پلګ ان او وکاروئ ، دوی په سلګونو مختلف برخو کې روزل شوي.
د کور دننه سرورونو ته اړتیا نشته ځکه چې دا یو څارل شوی خدمت دی. په ځانګړې توګه که تاسو اوس مهال د ایمیزون کلاوډ څخه ځینې کچې کاروئ، د دوی APIs په اسانۍ سره د پخوانیو موجود ایپسونو سره یوځای کیږي. او یوازې د لږ څه نور روزنې سره، د استخراج دقت لوړ کیدی شي.
د طبي ریکارډونو او کلینیکي ازموینو څخه د معلوماتو ترلاسه کولو لپاره یو له خورا معتبر متن تحلیل تخنیکونو څخه د پوهیدو طبي نوم اداره او د اړیکو استخراج (NERE) دی ، کوم چې کولی شي د درملو ، شرایطو ، ازموینې پایلو او پروسیجرونو توضیحات استخراج کړي.
کله چې د ناروغ ډیټا پرتله کول د ارزونې او سم ټون تشخیص لپاره ، خورا ګټور کیدی شي. د سوداګرۍ لپاره غوره اختیار د مخکې روزل شوي وسیلو سره د مدیریت شوي خدمت په لټه کې دی.
آیلین
د قوي ماشین زده کړې متن تحلیلونو ته اسانه لاسرسي چمتو کولو لپاره ، AYLIEN په اوو مشهور پروګرامینګ ژبو کې درې API پلگ ان وړاندیز کوي.
د دوی نیوز API د نړۍ له ګوټ ګوټ څخه د لسګونو زره خبرونو سرچینو څخه ریښتیني وخت لټون او د ادارې استخراج چمتو کوي.
د وجود استخراج او د متن تحلیل ډیری نور کارونه په اسنادو کې د متن تحلیل API په کارولو سره ترسره کیدی شي، د ټولنیزو رسنیو پلیټ فارمونه، د مصرف کونکي سروې، او نور.
په نهایت کې ، د متن تحلیل پلیټ فارم په کارولو سره ، تاسو کولی شئ خپل استخراج کونکي او نور مستقیم په خپل براوزر (TAP) کې رامینځته کړئ. دا د هغو شرکتونو لپاره ښه کار کوي چې اړتیا لري په چټکۍ سره د ابتدايي ثابت شوي APIs مدغم کړي.
SpaCy
SpaCy د Python Natural Language Processing (NLP) کڅوړه ده چې خلاص سرچینه، وړیا ده، او یو ټن جوړ شوي ځانګړتیاوې لري.
لپاره ورځ تر بلې عام کیږي د NLP ډاټا پروسس او تحلیل. غیر ساختماني متن ډیټا په لویه پیمانه رامینځته کیږي ، پدې توګه دا خورا مهم دي چې تحلیل یې کړئ او له هغې څخه بصیرت راوباسئ.
د دې د ترسره کولو لپاره، تاسو باید حقایق په داسې طریقه انځور کړئ چې کمپیوټر یې درک کولی شي. تاسو کولی شئ دا د NLP له لارې ترسره کړئ. دا خورا ګړندی دی، یوازې د 30ms د ځنډ وخت سره، مګر په جدي توګه، دا د HTTPS پاڼو سره د کارولو لپاره نه دی.
دا ستاسو د خپل سرور یا انټرانیټ سکین کولو لپاره یو ښه اختیار دی ځکه چې دا په محلي توګه کار کوي، مګر دا د ټول انټرنیټ مطالعې لپاره وسیله نه ده.
پایله
نومول شوي ادارې پیژندنه (NER) یو سیسټم دی چې سوداګرۍ کولی شي د پیرودونکو ملاتړ غوښتنو کې د اړونده معلوماتو لیبل کولو لپاره وکاروي ، د پیرودونکي فیډبیک کې راجع شوي ادارې ومومي ، او د نورو شیانو په مینځ کې ګړندي مهم ډیټا لکه د اړیکې توضیحات ، موقعیتونه او نیټې راوباسي.
د ادارې پیژندنې په نوم پیژندلو ترټولو عام لاره د ادارې استخراج APIs کارولو له لارې ده (که دوی د خلاصې سرچینې کتابتونونو یا SaaS محصولاتو لخوا چمتو شوي وي).
په هرصورت، د غوره بدیل غوره کول به ستاسو په وخت، مالياتو، او مهارتونو تکیه وکړي. د هر ډول سوداګرۍ لپاره ، د ادارې استخراج او خورا پیچلي متن تحلیل ټیکنالوژي په روښانه ډول ګټور کیدی شي.
کله چې د ماشین زده کړې وسیلې په سمه توګه تدریس شي، دوی دقیق دي او هیڅ ډول ډاټا له پامه غورځوي، ستاسو وخت او پیسې خوندي کوي. تاسو کولی شئ دا حلونه د APIs مدغم کولو سره په دوامداره او اتومات ډول چلولو لپاره تنظیم کړئ.
په ساده ډول د عمل کورس غوره کړئ چې ستاسو د شرکت لپاره غوره وي.
یو ځواب ورکړئ ووځي