නම් කරන ලද ආයතන හඳුනාගැනීම (NER) - සංකල්පය, යෙදුම් සහ API

පටුන[සඟවන්න][පෙන්වන්න]

NER (නම් කරන ලද ආයතන හඳුනාගැනීම) යනු කුමක්ද?
NER හි වැදගත්කම කුමක්ද?+-
NER හි සැබෑ-ලෝක යෙදුම+-
හොඳම ආයතන නිස්සාරණ API+-
නිගමනය

වචන අපට ඇසෙන විට හෝ කියවන සෑම විටම පුද්ගලයන්, ස්ථාන, ස්ථාන, වටිනාකම් සහ තවත් බොහෝ දේ හඳුනා ගැනීමට සහ වර්ග කිරීමට සහජ හැකියාව ඇත. මිනිසුන්ට ඉක්මනින් වචන වර්ග කිරීමට, හඳුනා ගැනීමට සහ තේරුම් ගැනීමට හැකිය.

නිදසුනක් වශයෙන්, ඔබට "Steve Jobs" යන නම ඇසෙන විට ඔබට වස්තුවක් වර්ගීකරණය කළ හැකි අතර අවම වශයෙන් ගුණාංග තුනක් හෝ හතරක් ඉක්මනින් ලබා ගත හැකිය.

පුද්ගලයා: "ස්ටීව් ජොබ්ස්"

සංවිධානය: "ඇපල්"

ස්ථානය: "කැලිෆෝනියා"

පරිගණකයට මෙම සහජ නිපුණතාවය නොමැති බැවින්, වචන හෝ පෙළ හඳුනාගෙන ඒවා වර්ගීකරණය කිරීමේදී අප ඔවුන්ට සහාය විය යුතුය. මෙම අවස්ථාවේ දී Entity Recognition (NER) භාවිතා වේ.

මෙම ලිපියෙන්, අපි එහි වැදගත්කම, ප්‍රතිලාභ, ඉහළම NER API සහ තවත් බොහෝ දේ ඇතුළුව NER (නම් කරන ලද ආයතන හඳුනාගැනීම) විස්තරාත්මකව විමසා බලමු.

NER (නම් කරන ලද ආයතන හඳුනාගැනීම) යනු කුමක්ද?

ස්වාභාවික භාෂා සැකසුම් (NLP) ප්‍රවේශයක් නම් කරන ලද entity recognition (NER) ලෙස හැඳින්වේ, සමහර විට entity identification හෝ entity extract ලෙස හැඳින්වේ, පෙළක නම් කරන ලද ආයතන ස්වයංක්‍රීයව හඳුනාගෙන ඒවා කලින් තීරණය කළ කාණ්ඩවලට කාණ්ඩ කරයි.

ආයතනවලට පුද්ගලයන්ගේ නම්, කණ්ඩායම්, ස්ථාන, දිනයන්, ප්‍රමාණයන්, ඩොලර් ප්‍රමාණයන්, ප්‍රතිශත සහ තවත් දේ ඇතුළත් වේ. නම් කරන ලද ආයතන හඳුනාගැනීම සමඟින්, ඔබට දත්ත සමුදායක් සඳහා සැලකිය යුතු දත්ත රැස් කිරීමට හෝ ලේඛනයක් යනු කුමක්ද යන්න අවබෝධ කර ගැනීම සඳහා වැදගත් තොරතුරු උකහා ගැනීමට එය භාවිතා කළ හැක.

NER යනු පෙළ විශ්ලේෂණ ක්‍රියාවලියේ සැලකිය යුතු දියුණුවක් NLP නියෝජනය කළත්, සාපේක්ෂ අර්ථ ශාස්ත්‍රය සහ හැඟීම් සඳහා පෙළ විශ්ලේෂණය කිරීම සඳහා AI පද්ධතියක් රඳා පවතින මූලික ගල වේ.

NER හි වැදගත්කම කුමක්ද?

පෙළ විශ්ලේෂණ ප්‍රවේශයක පදනම NER වේ. ML ආකෘතියක් ඉංග්‍රීසි තේරුම් ගැනීමට පෙර කලින් නිර්වචනය කළ කාණ්ඩ සහිත සාම්පල මිලියන ගණනක් ලබා දිය යුතුය.

API එය පළමු වරට කියවන පාඨවල මෙම සංරචක හඳුනාගැනීමේදී කාලයත් සමඟ වැඩි දියුණු වේ. NER හැකියාවේ නිපුණතාවය සහ ශක්තිය සමඟ පෙළ විශ්ලේෂණ එන්ජිමේ බලය වැඩි වේ.

මෙහි පෙනෙන පරිදි, ML මෙහෙයුම් කිහිපයක් NER මගින් ක්‍රියාත්මක වේ.

අර්ථකථන සෙවීම

අර්ථකථන සෙවීම දැන් Google හි ඇත. ඔබට ප්‍රශ්නයක් ඇතුළත් කළ හැකි අතර, එය පිළිතුරක් සමඟින් ප්‍රතිචාර දැක්වීමට උපරිම උත්සාහයක් ගනු ඇත. තොරතුරු සොයා ගැනීම සඳහා, පරිශීලකයෙකු සොයන, Alexa, Siri, chatbots, සහ වෙනත් අය වැනි ඩිජිටල් සහායකයින් අර්ථකථන සෙවුම් වර්ගයක් භාවිතා කරයි.

මෙම කාර්යයට පහර දීමට හෝ මග හැරිය හැක, නමුත් එහි භාවිතයන් වැඩි වන අතර ඒවායේ කාර්යක්ෂමතාවය වේගයෙන් ඉහළ යයි.

දත්ත විශ්ලේෂණ

මෙය ව්‍යුහගත නොකළ දත්ත වලින් විශ්ලේෂණයක් නිර්මාණය කිරීම සඳහා ඇල්ගොරිතම භාවිතා කිරීම සඳහා වන සාමාන්‍ය වාක්‍ය ඛණ්ඩයකි. එය අදාළ දත්ත සෙවීමේ සහ එකතු කිරීමේ ක්‍රියාවලිය සමඟ මෙම දත්ත ප්‍රදර්ශනය කිරීමේ ක්‍රම ඒකාබද්ධ කරයි.

මෙය ප්‍රතිඵල පිළිබඳ සෘජු සංඛ්‍යානමය පැහැදිලි කිරීමක් හෝ දත්තවල දෘශ්‍ය නිරූපණයක ස්වරූපයක් ගත හැකිය. නිශ්චිත වීඩියෝවක් නරඹන්නන් ක්ලික් කරන විට ඇතුළුව, YouTube නැරඹීම් වලින් ලැබෙන තොරතුරු භාවිතයෙන් යම් මාතෘකාවක් කෙරෙහි ඇති උනන්දුව සහ නියැලීම විශ්ලේෂණය කළ හැක.

නිෂ්පාදනයේ තරු ශ්‍රේණිගත කිරීම් ඊ-වාණිජ්‍යය වෙබ් අඩවි වලින් දත්ත සීරීම් භාවිතයෙන් විශ්ලේෂණය කළ හැකි අතර එමඟින් නිෂ්පාදනය කෙතරම් හොඳින් ක්‍රියා කරයිද යන්න පිළිබඳ සමස්ත ලකුණු ලබා දේ.

හැඟීම් විශ්ලේෂණය

NER තවදුරටත් ගවේෂණය, මනෝ විශ්ලේෂණයකි තරු ශ්‍රේණිගත කිරීම් වලින් තොරතුරක් නොමැති අවස්ථාවලදී පවා හොඳ සහ නරක සමාලෝචන වෙන්කර හඳුනාගත හැකිය.

"අතිරික්ත", "විකාර" සහ "මෝඩ" වැනි යෙදුම් සෘණාත්මක අර්ථයන් ඇති අතර, "ප්‍රයෝජනවත්," "ඉක්මන්" සහ "පහසු" වැනි යෙදුම් ඇති බව දනී. පරිගණක ක්‍රීඩාවකදී "පහසු" යන වචනය නිෂේධාත්මක ලෙස අර්ථ දැක්විය හැකිය.

සංකීර්ණ ඇල්ගොරිතම වලට දේවල් අතර සම්බන්ධය ද හඳුනාගත හැකිය.

පෙළ විශ්ලේෂණ

දත්ත විශ්ලේෂණවලට සමානව, පෙළ විශ්ලේෂණය ව්‍යුහගත නොකළ පෙළ නූල්වලින් තොරතුරු උපුටා ගන්නා අතර වැදගත් දත්තවල ශුන්‍ය කිරීමට NER භාවිතා කරයි.

භාණ්ඩයක සඳහන් කිරීම්, සාමාන්‍ය මිල හෝ යම් වෙළඳ නාමයක් විස්තර කිරීමට පාරිභෝගිකයන් නිතර භාවිතා කරන නියමයන් පිළිබඳ දත්ත සම්පාදනය කිරීමට එය භාවිතා කළ හැක.

වීඩියෝ අන්තර්ගත විශ්ලේෂණය

වඩාත් සංකීර්ණ පද්ධති වන්නේ මුහුණු හඳුනාගැනීම, ශ්‍රව්‍ය විශ්ලේෂණය සහ පින්තූර හඳුනාගැනීම භාවිතා කරමින් වීඩියෝ තොරතුරු වලින් දත්ත ලබා ගැනීමයි.

වීඩියෝ අන්තර්ගත විශ්ලේෂණය භාවිතයෙන්, ඔබට YouTube “unboxing” වීඩියෝ, Twitch ක්‍රීඩා සංදර්ශන, Reels මත ඔබේ ශ්‍රව්‍ය ද්‍රව්‍යවල තොල් සමමුහුර්ත කිරීම් සහ තවත් දේ සොයා ගත හැක.

සබැඳි වීඩියෝ ද්‍රව්‍යවල පරිමාව වර්ධනය වන විට පුද්ගලයින් ඔබේ නිෂ්පාදනයට හෝ සේවාවට සම්බන්ධ වන ආකාරය පිළිබඳ වැදගත් තොරතුරු මඟ හැරීම වැළැක්වීම සඳහා, NER මත පදනම් වූ වීඩියෝ අන්තර්ගත විශ්ලේෂණය සඳහා වේගවත් සහ නව නිපැයුම් ශිල්පීය ක්‍රම අත්‍යවශ්‍ය වේ.

NER හි සැබෑ-ලෝක යෙදුම

නම් කරන ලද ආයතන හඳුනාගැනීම (NER) පුද්ගලයන්ගේ නම්, ස්ථාන, වෙළඳ නාම, මුදල් වටිනාකම් සහ තවත් බොහෝ දේ වැනි පාඨයක අත්‍යවශ්‍ය අංග හඳුනා ගනී.

පෙළක ඇති ප්‍රධාන ආයතන උපුටා ගැනීම ව්‍යුහගත නොවන දත්ත වර්ග කිරීමට සහ සැලකිය යුතු තොරතුරු අනාවරණය කර ගැනීමට උපකාරී වේ, එය විශාල දත්ත කට්ටල සමඟ ගනුදෙනු කිරීමේදී ඉතා වැදගත් වේ.

නම් කරන ලද ආයතන හඳුනාගැනීමේ ආකර්ෂණීය සැබෑ ලෝක උදාහරණ කිහිපයක් මෙන්න:

පාරිභෝගික ප්‍රතිපෝෂණ විශ්ලේෂණය කිරීම

සබැඳි සමාලෝචන පාරිභෝගික ප්‍රතිපෝෂණවල අපූරු මූලාශ්‍රයක් වන බැවින් පාරිභෝගිකයින් ඔබේ භාණ්ඩවලට කැමති සහ වෛර කරන දේ මෙන්ම ඔබේ සමාගම වැඩිදියුණු කළ යුතු ක්ෂේත්‍ර මොනවාද යන්න පිළිබඳ සවිස්තරාත්මක තොරතුරු ඔබට සැපයිය හැකිය.

මෙම සියලුම සේවාලාභී ආදානය NER පද්ධති භාවිතයෙන් සංවිධානය කළ හැකි අතර, එමඟින් නැවත ඇතිවන ගැටළු හඳුනා ගත හැක.

නිදසුනක් වශයෙන්, අවාසිදායක පාරිභෝගික සමාලෝචනවල නිතර සඳහන් වන ස්ථාන හඳුනා ගැනීමට NER භාවිතා කිරීමෙන්, ඔබට යම් කාර්යාල ශාඛාවක් කෙරෙහි අවධානය යොමු කිරීමට තීරණය කළ හැකිය.

අන්තර්ගතය සඳහා නිර්දේශ

ඔබ කියවන ලිපියට සම්බන්ධ ලිපි ලැයිස්තුවක් ඔබ එහි අයිතමයක් කියවන විට BBC සහ CNN වැනි වෙබ් අඩවිවල සොයා ගත හැක.

මෙම වෙබ් අඩවි ඔබ NER භාවිතයෙන් කියවන අන්තර්ගතයෙන් උපුටා ගත් ආයතන පිළිබඳ තොරතුරු සපයන අමතර වෙබ් අඩවි සඳහා නිර්දේශ ඉදිරිපත් කරයි.

පාරිභෝගික සහාය තුළ ප්‍රවේශපත්‍ර සංවිධානය කරන්න

ඔබ පාරිභෝගිකයින්ගෙන් ආධාරක ප්‍රවේශපත්‍ර සංඛ්‍යාවේ වැඩිවීමක් කළමනාකරණය කරන්නේ නම්, සේවාලාභී ඉල්ලීම්වලට වඩා ඉක්මනින් ප්‍රතිචාර දැක්වීමට නම් කරන ලද ආයතන හඳුනාගැනීමේ ඇල්ගොරිතම භාවිත කළ හැක.

ගනුදෙනුකරුවන්ගේ පැමිණිලි සහ විමසීම් වර්ගීකරණය කිරීම වැනි කාලය ගතවන පාරිභෝගික සේවා කටයුතු ස්වයංක්‍රීය කරන්න, ඔබට මුදල් ඉතිරි කර ගැනීමට, පාරිභෝගික සතුට වැඩි කිරීමට සහ විසඳුම් ගාස්තු වැඩි කරන්න.

එම ගැටලුව විසඳීම සඳහා නිවැරදි නියෝජිතයා හෝ කණ්ඩායම වෙත ප්‍රවේශපත්‍ර යැවීම සරල කිරීම සඳහා නිෂ්පාදන නම් හෝ අනුක්‍රමික අංක වැනි අදාළ දත්ත උකහා ගැනීමට ද ආයතන නිස්සාරණය භාවිතා කළ හැක.

සෙවුම් ඇල්ගොරිතම

මිලියන ගණනක තොරතුරු සහිත වෙබ් අඩවි ඔබේ සෙවුමට අදාළ ප්‍රතිඵල නිපදවන්නේ කෙසේදැයි ඔබ කවදා හෝ ප්‍රශ්න කර තිබේද? Wikipedia වෙබ් අඩවිය සලකා බලන්න.

විකිපීඩියාව "රැකියා" යන වචනයෙන් සියලුම ලිපි ආපසු ලබා දෙනවා වෙනුවට "රැකියා" සඳහා සෙවුම් කරන විට සෙවුම් පදයට අදාළ විය හැකි පූර්ව නිශ්චිත ආයතන අඩංගු පිටුවක් පෙන්වයි.

මේ අනුව, විකිපීඩියාව "රැකියාව" නිර්වචනය කරන ලිපියට සබැඳියක් ඉදිරිපත් කරයි, රැකියා නම් වූ පුද්ගලයින් සඳහා කොටසක් සහ චිත්‍රපට වැනි මාධ්‍ය සඳහා තවත් ක්ෂේත්‍රයක්, වීඩියෝ ක්රීඩා, සහ "රැකියා" යන යෙදුම දිස්වන වෙනත් ආකාරයේ විනෝදාස්වාදය.

සෙවුම් වචනය අඩංගු ස්ථාන සඳහා තවත් කොටසක් ද ඔබට පෙනෙනු ඇත.

ජීව දත්ත පත්‍රිකා ගැන සැලකිලිමත් වීම

පරමාදර්ශී අයදුම්කරු සෙවීමේදී, බඳවා ගන්නන් ඔවුන්ගේ දිනෙන් සැලකිය යුතු කොටසක් ජීව දත්ත සමාලෝචනය සඳහා වැය කරයි. සෑම සාරාංශයක්ම එකම තොරතුරු ඇත, නමුත් ඒවා සියල්ලම ඉදිරිපත් කර විවිධ ආකාරයෙන් සංවිධානය කර ඇත, එය ව්‍යුහගත නොකළ දත්ත සඳහා සාමාන්‍ය උදාහරණයකි.

පුද්ගලික දත්ත (නම, ලිපිනය, දුරකථන අංකය, උපන් දිනය සහ විද්‍යුත් තැපෑල වැනි) සහ ඔවුන්ගේ අධ්‍යාපනය සහ පළපුරුද්ද (සහතික කිරීම්, උපාධිය වැනි) ඇතුළු ආයතන නිස්සාරක භාවිතා කරන කණ්ඩායම් බඳවා ගැනීමෙන් අපේක්ෂකයින් පිළිබඳ වඩාත් අදාළ තොරතුරු ඉක්මනින් උපුටා ගත හැකිය. , සමාගම් නම්, කුසලතා, ආදිය).

ඊ-වාණිජ්‍යය

ඔවුන්ගේ නිෂ්පාදන සෙවුම් ඇල්ගොරිතම සම්බන්ධයෙන්, භාණ්ඩ සිය ගණනක් හෝ දහස් ගණනක් සමඟ සබැඳි සිල්ලර වෙළෙන්දන් NER වෙතින් ප්‍රතිලාභ ලබනු ඇත.

NER නොමැතිව, "කළු සම් සපත්තු" සඳහා සෙවීමක් කළු නොවන සම් සහ පාවහන් යන දෙකම ඇතුළත් ප්‍රතිඵල ලබා දෙනු ඇත. එසේ නම්, ඊ-වාණිජ්‍යය වෙබ් අඩවි සේවාදායකයින් අහිමි වීමේ අවදානමක් ඇත.

Iඅපගේ නඩුවේදී, NER සෙවුම් වචනය සම් බූට් සඳහා නිෂ්පාදන වර්ගයක් ලෙසත් කළු වර්ණය වර්ණය ලෙසත් වර්ග කරයි.

හොඳම ආයතන නිස්සාරණ API

Google Cloud NLP

දැනටමත් පුහුණු කර ඇති මෙවලම් සඳහා, Google Cloud NLP එහි ස්වභාවික භාෂා API සපයයි. එසේත් නැතිනම්, AutoML Natural Language API ඔබට ඔබේ කර්මාන්තයේ පාරිභාෂිතය පිළිබඳව ඔබේ මෙවලම් දැනුවත් කිරීමට අවශ්‍ය නම් බොහෝ ආකාරයේ පෙළ උපුටා ගැනීම් සහ විශ්ලේෂණයන් සඳහා අනුවර්තනය වේ.

APIs Gmail, Google Sheets සහ වෙනත් Google යෙදුම් සමඟ පහසුවෙන් අන්තර්ක්‍රියා කරයි, නමුත් තෙවන පාර්ශවීය වැඩසටහන් සමඟ ඒවා භාවිතා කිරීමට වඩාත් සංකීර්ණ කේතයක් අවශ්‍ය විය හැක.

හොඳම ව්‍යාපාරික විකල්පය වන්නේ Google යෙදුම් සහ Cloud Storage කළමනාකරණය කළ සේවා සහ API ලෙස සම්බන්ධ කිරීමයි.

IBM වොට්සන්

IBM Watson යනු ඇදහිය නොහැකි තරම් ඉක්මනින් ක්‍රියා කරන බහු-වලාකුළු වේදිකාවක් වන අතර, පටිගත කරන ලද ශ්‍රව්‍ය සහ දුරකථන ඇමතුම් ස්වයංක්‍රීයව විශ්ලේෂණය කළ හැකි විස්මිත මෘදුකාංගයක් වන කථනයෙන් පෙළ වැනි පෙර-සාදන ලද හැකියාවන් සපයයි.

CSV දත්ත භාවිතයෙන්, Watson Natural Language Understanding හි ගැඹුරු ඉගෙනුම් AI හට ආයතන හෝ මූල පද උකහා ගැනීම සඳහා නිස්සාරණ ආකෘති නිර්මාණය කළ හැක.

පුහුණුවීම් සමඟ, ඔබට වඩාත් සංකීර්ණ මාදිලි නිර්මාණය කළ හැකිය. පුළුල් කේතීකරණ දැනුමක් අවශ්‍ය වුවද, එහි සියලුම ක්‍රියාකාරීත්වයන් API හරහා ප්‍රවේශ විය හැක.

අතිවිශාල දත්ත කට්ටල පරීක්ෂා කිරීමට සහ අභ්‍යන්තර තාක්ෂණික සම්පත් ඇති විශාල ව්‍යාපාර සඳහා එය හොඳින් ක්‍රියා කරයි.

Cortical.io

ස්නායු විද්‍යාවේ සංකල්පයක් වන Semantic Folding භාවිතා කරමින්, Cortical.io පෙළ නිස්සාරණය සහ NLU විසඳුම් සපයයි.

මෙය සිදු කරනුයේ “අර්ථාර්ථ ඇඟිලි සලකුණු” උත්පාදනය කිරීම සඳහා වන අතර එමඟින් පෙළක සම්පූර්ණ සහ නිශ්චිත නියමයන් යන දෙකම පෙන්නුම් කරයි. වචන පොකුරු අතර සම්බන්ධතා නිරූපණය කිරීම සඳහා, අර්ථකථන ඇඟිලි සලකුණු පෙළ දත්ත නිරූපණය කරයි.

Cortical.io හි අන්තර්ක්‍රියාකාරී API ප්‍රලේඛනය එක් එක් පෙළ විශ්ලේෂණ විසඳුම්වල ක්‍රියාකාරීත්වය ආවරණය කරයි, සහ Java, Python සහ Javascript API භාවිතයෙන් ප්‍රවේශ වීම සරලයි.

Cortical.io වෙතින් වන කොන්ත්‍රාත් බුද්ධි මෙවලම විශේෂයෙන් අර්ථකථන සෙවීම් කිරීමට, ස්කෑන් කරන ලද ලේඛන පරිවර්තනය කිරීමට, සහ විවරණ සමඟ උදව් කිරීමට සහ වැඩි දියුණු කිරීමට නෛතික විශ්ලේෂණය සඳහා නිර්මාණය කරන ලදී.

AI දැනුම අවශ්‍ය නොවන, විශේෂයෙන්ම නීති අංශයේ සරල භාවිතයට API සොයන ව්‍යාපාර සඳහා එය ඉතා සුදුසුය.

වඳුරා ඉගෙන ගන්න

සියලුම ප්‍රධාන පරිගණක භාෂා MonkeyLearn's API මගින් සහය දක්වන අතර ඔබගේ උපුටාගත් ආයතන අඩංගු JSON ගොනුවක් නිපදවීමට සරලව සකසන්නේ කේත පේළි කිහිපයක් පමණි. පූර්ව පුහුණුවක් සහිත නිස්සාරක සහ පෙළ විශ්ලේෂකයින් සඳහා, අතුරු මුහුණත පරිශීලක-හිතකාමී වේ.

නැතහොත්, සරල පියවර කිහිපයකින්, ඔබට අද්විතීය නිස්සාරකයක් නිර්මාණය කළ හැකිය. කාලය අඩු කිරීමට සහ නිරවද්‍යතාවය වැඩි දියුණු කිරීමට, ගැඹුරු සමඟ උසස් ස්වභාවික භාෂා සැකසුම් (NLP). යන්ත්ර ඉගෙනීම පුද්ගලයෙකු මෙන් පෙළ ඇගයීමට ඔබට හැකියාව ලැබේ.

මීට අමතරව, SaaS APIs Google Sheets, Excel, Zapier, Zendesk සහ වෙනත් මෙවලම් සමඟ සම්බන්ධතා පිහිටුවීමට වසර ගණනාවක පරිගණක විද්‍යා දැනුමක් අවශ්‍ය නොවන බව සහතික කරයි.

ඔබගේ බ්‍රවුසරයේ දැනට පවතින නම නිස්සාරකය, සමාගම් නිස්සාරකය සහ ස්ථාන නිස්සාරණය වේ. ඔබේම දෑ සාදා ගන්නේ කෙසේද යන්න පිළිබඳ තොරතුරු සඳහා, නම් කරන ලද ආයතන හඳුනාගැනීමේ බ්ලොග් ලිපිය බලන්න.

විවිධ වර්ගයේ පෙළ නිස්සාරණය සහ පෙළ විශ්ලේෂණ සඳහා සරලව ක්‍රියාත්මක කිරීමට API අවශ්‍ය වන තාක්‍ෂණය, සිල්ලර වෙළඳාම සහ ඊ-වාණිජ්‍යය සම්බන්ධ සියලුම ප්‍රමාණයේ ව්‍යාපාර සඳහා එය ඉතා සුදුසුය.

ඇමේසන් තේරුම් ගන්න

Amazon Comprehend හි පෙර-සාදන ලද මෙවලම් වහාම පේනුගත කිරීම සහ භාවිතා කිරීම සරල කිරීම සඳහා, ඔවුන් විවිධ ක්ෂේත්‍ර සිය ගණනකින් පුහුණු කරනු ලැබේ.

මෙය අධීක්‍ෂණය කරන ලද සේවාවක් බැවින් අභ්‍යන්තර සේවාදායකයන් අවශ්‍ය නොවේ. විශේෂයෙන් ඔබ දැනට Amazon හි වලාකුළු යම් මට්ටමකට භාවිතා කරන්නේ නම්, ඔවුන්ගේ API කලින් පැවති යෙදුම් සමඟ පහසුවෙන් ඒකාබද්ධ වේ. තව ටිකක් වැඩි පුහුණුවක් සමඟින්, නිස්සාරණයේ නිරවද්‍යතාවය ඉහළ නැංවිය හැකිය.

වෛද්‍ය වාර්තා සහ සායනික අත්හදා බැලීම් වලින් දත්ත ලබා ගැනීම සඳහා වඩාත් විශ්වාසදායක පෙළ විශ්ලේෂණ ක්‍රමවලින් එකක් වන්නේ ඖෂධ, කොන්දේසි, පරීක්ෂණ ප්‍රතිඵල සහ ක්‍රියා පටිපාටි පිළිබඳ විස්තර උකහා ගත හැකි Comprehend's Medical Named Entity and Relationship Extract (NERE) ය.

රෝග විනිශ්චය තක්සේරු කිරීම සහ සියුම්ව සකස් කිරීම සඳහා රෝගියාගේ දත්ත සංසන්දනය කිරීමේදී, බෙහෙවින් ප්රයෝජනවත් විය හැකිය. පෙර-පුහුණු මෙවලම් සහිත කළමනාකරණ සේවාවක් සොයන ව්‍යාපාර සඳහා හොඳම විකල්පය.

අයිලියන්

ශක්තිමත් යන්ත්‍ර ඉගෙනීමේ පෙළ විශ්ලේෂණයට පහසු ප්‍රවේශයක් ලබා දීම සඳහා, AYLIEN විසින් ජනප්‍රිය ක්‍රමලේඛන භාෂා හතකින් API ප්ලග් ඉන් තුනක් පිරිනමයි.

ඔවුන්ගේ ප්‍රවෘත්ති API ලොව පුරා දස දහස් ගණනක පුවත් මූලාශ්‍රවලින් තත්‍ය කාලීන සෙවීම් සහ ආයතන උපුටා ගැනීම සපයයි.

Aylien

ලේඛනවල Text Analysis API භාවිතයෙන් ආයතන නිස්සාරණය සහ තවත් පෙළ විශ්ලේෂණ කාර්යයන් කිහිපයක් සිදු කළ හැක, සමාජ මාධ්ය වේදිකා, පාරිභෝගික සමීක්ෂණ, සහ තවත්.

අවසාන වශයෙන්, Text Analysis Platform භාවිතයෙන්, ඔබට ඔබේම නිස්සාරක නිර්මාණය කළ හැකි අතර ඔබේ බ්‍රවුසරයේ (TAP). මූලික වශයෙන් ස්ථාවර API ඉක්මනින් ඒකාබද්ධ කිරීමට අවශ්‍ය සමාගම් සඳහා එය හොඳින් ක්‍රියා කරයි.

ස්පාසි

SpaCy යනු Python Natural Language Processing (NLP) පැකේජයක් වන අතර එය විවෘත මූලාශ්‍ර, නොමිලේ සහ ගොඩනඟන ලද විශේෂාංග රාශියක් ඇත.

එය වඩ වඩාත් පොදු වෙමින් පවතී NLP දත්ත සැකසීම සහ විශ්ලේෂණය. ව්‍යුහගත නොවූ පාඨමය දත්ත විශාල පරිමාණයකින් නිර්මාණය වී ඇත, එබැවින් එය විශ්ලේෂණය කිරීම සහ එයින් තීක්ෂ්ණ බුද්ධිය උකහා ගැනීම ඉතා වැදගත් වේ.

SpaCy

එය ඉටු කිරීම සඳහා, ඔබ පරිගණකයට තේරුම් ගත හැකි ආකාරයෙන් කරුණු නිරූපණය කළ යුතුය. ඔබට එය NLP හරහා කළ හැකිය. එය ඉතා ඉක්මන් වේ, ප්‍රමාද කාලය 30ms පමණි, නමුත් විවේචනාත්මකව, එය HTTPS පිටු සමඟ භාවිතය සඳහා අදහස් නොකෙරේ.

මෙය දේශීයව ක්‍රියාත්මක වන නිසා ඔබේම සර්වර් හෝ ඉන්ට්‍රානෙට් ස්කෑන් කිරීම සඳහා කදිම විකල්පයකි, නමුත් එය මුළු අන්තර්ජාලයම අධ්‍යයනය කිරීමේ මෙවලමක් නොවේ.

නිගමනය

නම් කරන ලද ආයතන හඳුනාගැනීම (NER) යනු පාරිභෝගික සහාය ඉල්ලීම්වල අදාළ තොරතුරු ලේබල් කිරීමට, පාරිභෝගික ප්‍රතිපෝෂණවල සඳහන් ආයතන සොයා ගැනීමට සහ වෙනත් දේ අතර සම්බන්ධතා තොරතුරු, ස්ථාන සහ දින වැනි තීරණාත්මක දත්ත ඉක්මනින් උපුටා ගැනීමට ව්‍යාපාරවලට භාවිත කළ හැකි පද්ධතියකි.

entity recognition ලෙස නම් කිරීම සඳහා වඩාත් පොදු ප්‍රවේශය වන්නේ entity extract API භාවිතා කිරීම (ඒවා විවෘත මූලාශ්‍ර පුස්තකාල හෝ SaaS නිෂ්පාදන මගින් සපයනු ලැබුවද).

කෙසේ වෙතත්, හොඳම විකල්පය තෝරාගැනීම ඔබේ කාලය, මුදල් සහ කුසලතා මත රඳා පවතී. ඕනෑම ආකාරයක ව්‍යාපාරයක් සඳහා, ආයතන නිස්සාරණය සහ වඩාත් සංකීර්ණ පෙළ විශ්ලේෂණ තාක්ෂණයන් පැහැදිලිවම වාසිදායක විය හැකිය.

යන්ත්‍ර ඉගෙනීමේ මෙවලම් නිවැරදිව උගන්වා ඇති විට, ඒවා නිරවද්‍ය වන අතර කිසිදු දත්තයක් නොසලකා හරිනු නොලැබේ, ඔබේ කාලය සහ මුදල් ඉතිරි කරයි. API අනුකලනය කිරීමෙන් ඔබට මෙම විසඳුම් අඛණ්ඩව සහ ස්වයංක්‍රීයව ක්‍රියාත්මක වීමට වින්‍යාසගත කළ හැක.

ඔබේ සමාගමට වඩාත් සුදුසු ක්‍රියා මාර්ගය තෝරාගන්න.

නම් කරන ලද ආයතන හඳුනාගැනීම (NER) - සංකල්පය, යෙදුම් සහ API

NER (නම් කරන ලද ආයතන හඳුනාගැනීම) යනු කුමක්ද?