فهرست[پټ][ښکاره]
نړۍ په چټکۍ سره د مصنوعي استخباراتو، او ماشین زده کړې له امله بدلیږي، کوم چې زموږ د ورځني ژوند په هر اړخ اغیزه لري.
د غږ معاونینو څخه چې د NLP او ماشین زده کړې کاروي ترڅو د ملاقاتونو کتاب وکړي، زموږ په کیلنڈر کې پیښې وګوري، او داسې وسیلو ته میوزیک غږوي چې دومره دقیق دي چې دوی کولی شي زموږ اړتیاوې اټکل کړي مخکې لدې چې موږ یې په پام کې ونیسو.
کمپیوټر کولی شي شطرنج لوبې وکړي، جراحي وکړي، او د ماشین زده کړې الګوریتمونو په مرسته د انسان په څیر په هوښیار ماشینونو کې وده وکړي.
موږ د دوامداره ټیکنالوژیکي پرمختګ په وخت کې یو، او د دې لیدلو سره چې کمپیوټر څنګه د وخت په تیریدو سره وده کړې، موږ کولی شو وړاندوینې وکړو چې په راتلونکي کې به څه پیښ شي.
د کمپیوټري وسیلو او میتودونو ډیموکراتیک کول د دې انقلاب یو له مهمو اړخونو څخه دی چې څرګند دی. د ډیټا ساینس پوهانو په تیرو پنځو کلونو کې په اسانۍ سره د عصري میتودونو پلي کولو له لارې ځواکمن ډیټا کرنچ کولو کمپیوټرونه رامینځته کړي. پایلې حیرانونکې دي.
پدې پوسټ کې ، موږ به له نږدې وګورو ماشین زده کړه الګوریتمونه او د دوی ټول تغیرات.
نو، د ماشین زده کړې الګوریتمونه څه دي؟
هغه طریقه چې د AI سیسټم لخوا د دندې ترسره کولو لپاره کارول کیږي - عموما، د ورکړل شوي ان پټ ډاټا څخه د محصول ارزښتونو اټکل کول - د ماشین زده کړې الګوریتم په نوم پیژندل کیږي.
د ماشین زده کړې الګوریتم یوه پروسه ده چې ډیټا کاروي او د ماشین زده کړې ماډلونو رامینځته کولو لپاره کارول کیږي چې تولید لپاره چمتو وي. که د ماشین زده کړه هغه اورګاډی وي چې دنده ترسره کوي، نو د ماشین زده کړې الګوریتمونه هغه لوکوموټیو دي چې کار سره حرکت کوي.
د کارولو لپاره د ماشین زده کړې غوره طریقه به د سوداګرۍ ستونزې لخوا ټاکل کیږي چې تاسو یې د حل کولو هڅه کوئ، د ډیټاسیټ ډول چې تاسو یې کاروئ، او هغه سرچینې چې تاسو یې لرئ.
د ماشین زده کړې الګوریتمونه هغه دي چې ډیټا سیټ په ماډل بدلوي. د ستونزې په ډول پورې اړه لري چې تاسو یې د ځواب ویلو هڅه کوئ، د پروسس کولو ځواک شتون لري، او د معلوماتو ډول چې تاسو یې لرئ، نظارت شوي، غیر نظارت شوي، یا د پیاوړتیا زده کړې الګوریتم کولی شي ښه کار وکړي.
نو، موږ د نظارت شوي، غیر نظارت شوي، او پیاوړتیا زده کړې په اړه خبرې وکړې، مګر دوی څه دي؟ راځئ چې دوی وپلټو.
نظارت شوی، غیر څارل شوی او تقویه زده کړه
نظارت شوې زده کړې
په نظارت شوي زده کړې کې، د AI ماډل د چمتو شوي ان پټ پراساس رامینځته شوی او هغه لیبل چې وړاندوینه شوې پایلې څرګندوي. د معلوماتو او محصولاتو پراساس، ماډل د نقشه کولو مساوات رامینځته کوي، او د دې نقشه کولو مساوات په کارولو سره، دا په راتلونکي کې د آخذو لیبل وړاندوینه کوي.
راځئ چې ووایو موږ باید داسې ماډل جوړ کړو چې د سپي او پیشو ترمنځ توپیر وکړي. د پیشوګانو او سپیو ډیری عکسونه موډل ته د لیبلونو سره تغذیه شوي چې دا په ګوته کوي چې ایا دوی پیشو دي یا سپي د ماډل روزنې لپاره.
ماډل هڅه کوي چې د ان پټ عکسونو لیبلونو پورې اړوند عکسونو ته یو مساوات رامینځته کړي. حتی که چیرې ماډل مخکې هیڅکله عکس نه وي لیدلی، د روزنې وروسته، دا کولی شي وپیژني چې آیا دا د پیشو یا سپي دی.
نه سپارل شوې زده کړې
غیر څارل شوي زده کړې کې د AI ماډل روزنه شامله ده پرته لدې چې لیبل یې کړئ. ماډل د ان پټ ډیټا د اړوندو ځانګړتیاو سره په ګروپونو ویشي.
د آخذې راتلونکی لیبل بیا وړاندوینه کیږي پدې پورې اړه لري چې د هغې ځانګړتیاوې څومره نږدې د یوې طبقې سره سمون لري. هغه وضعیت ته پام وکړئ چیرې چې موږ باید د سور او نیلي توپونو یوه ډله په دوه کټګوریو وویشو.
راځئ چې فرض کړو چې د بالونو نور ځانګړتیاوې د رنګ استثنا سره یو شان دي. د دې پر بنسټ چې دا څنګه توپونه په دوو ټولګیو ویشلی شي، ماډل هغه ځانګړتیاوې ګوري چې د بالونو ترمنځ توپیر لري.
د توپونو دوه کلسترونه - یو نیلي او یو سور - تولید کیږي کله چې بالونه د دوی د رنګ پراساس په دوه ډلو ویشل کیږي.
د پیاوړتیا زده کړه
د پیاوړتیا زده کړې کې، د AI ماډل هڅه کوي د عمل کولو له لارې ټوله ګټه اعظمي کړي او همدارنګه دا کولی شي په یو ځانګړي حالت کې. د دې د مخکینیو پایلو په اړه فیډبیک د ماډل زده کولو کې مرسته کوي.
د سناریو په اړه فکر وکړئ کله چې روبوټ ته لارښوونه کیږي چې د A او B نقطو ترمنځ لاره غوره کړي. روبوټ لومړی د کورسونو څخه یو غوره کوي ځکه چې مخکې تجربه نلري.
روبوټ د هغې لارې په اړه معلومات ترلاسه کوي او له هغې څخه پوهه ترلاسه کوي. روبوټ کولی شي د ان پټ څخه کار واخلي ترڅو مسله حل کړي بل ځل چې ورته ورته حالت سره مخ شي.
د مثال په توګه، که روبوټ اختیار B غوره کړي او انعام ترلاسه کړي، لکه مثبت نظر، دا دا ځل پوهیږي چې دا باید د B لاره غوره کړي ترڅو خپل انعام زیات کړي.
اوس په پای کې هغه څه چې تاسو ټول یې په تمه یاست، الګوریتم دی.
د ماشین زده کړې لوی الګوریتم
1. خطي ریګریشن
د ماشین زده کړې ترټولو ساده طریقه چې د نظارت شوي زده کړې څخه انحراف کوي خطي ریګریشن دی. د خپلواک متغیرونو څخه د پوهې سره، دا اکثرا د ریګریشن مسلو حل کولو لپاره کارول کیږي او د دوامداره انحصار متغیرونو په اړه وړاندوینې رامینځته کوي.
د غوره فټ کرښې موندنه، کوم چې کولی شي د دوامداره انحصار متغیرونو لپاره د پایلو اټکل کولو کې مرسته وکړي، د خطي ریګریشن موخه ده. د کور قیمتونه، عمر، او معاشونه د دوامداره ارزښتونو ځینې بیلګې دي.
یو ماډل چې د ساده خطي ریګریشن په نوم پیژندل کیږي مستقیم کرښه کاروي ترڅو د یو خپلواک متغیر او یو انحصار متغیر تر مینځ اړیکه محاسبه کړي. په ډیری خطي ریګریشن کې له دوه څخه ډیر خپلواک متغیرونه شتون لري.
د خطي ریګریشن ماډل څلور بنسټیز انګیرنې لري:
- خطيتوب: د X او د Y معنی ترمنځ خطي اړیکه شتون لري.
- Homoscedasticity: د X د هر ارزښت لپاره، د پاتې کیدو توپیر یو شان دی.
- خپلواکي: مشاهدات د خپلواکۍ په شرایطو کې یو له بل څخه خپلواک دي.
- نورمالیت: کله چې X ټاکل کیږي، Y په نورمال ډول ویشل کیږي.
خطي ریګریشن د ډیټا لپاره د پام وړ فعالیت کوي چې د لینونو سره جلا کیدی شي. دا کولی شي د منظم کولو ، کراس - اعتبار ، او ابعاد کمولو تخنیکونو په کارولو سره اضافي فټینګ کنټرول کړي. په هرصورت ، داسې مثالونه شتون لري چیرې چې پراخه فیچر انجینرۍ ته اړتیا ده ، کوم چې کله ناکله د ډیر فټینګ او شور لامل کیدی شي.
2. لوژستیک ریګریشن
لوژستیک ریګریشن د ماشین زده کړې یو بل تخنیک دی چې د نظارت شوي زده کړې څخه تیریږي. د دې لوی کارول طبقه بندي ده، پداسې حال کې چې دا د راجستر ستونزو لپاره هم کارول کیدی شي.
لوژستیک ریګریشن د خپلواک فکتورونو څخه د معلوماتو په کارولو سره د کټګوري انحصار متغیر وړاندوینې لپاره کارول کیږي. موخه د محصولاتو طبقه بندي کول دي، کوم چې یوازې د 0 او 1 ترمنځ راټیټ کیدی شي.
د آخذونو ټول وزن د سیګمایډ فنکشن لخوا پروسس کیږي، د فعالیت فعالیت چې د 0 او 1 ترمنځ ارزښتونه بدلوي.
د لوژستیک ریګریشن اساس د اعظمي احتمال اټکل دی ، د ځانګړي مشاهده شوي ډیټا په پام کې نیولو سره د احتمالي احتمالي توزیع پیرامیټرونو محاسبه کولو میتود.
3. د پریکړې ونې
د ماشین زده کړې بله طریقه چې د نظارت شوي زده کړې څخه جلا کیږي د پریکړې ونه ده. د طبقه بندي او راجع کولو مسلو دواړو لپاره، د پریکړې ونې طریقه کارول کیدی شي.
د تصمیم نیولو دا وسیله، چې د ونې سره ورته ده، د عملونو احتمالي پایلو، لګښتونو، او اغیزو ښودلو لپاره بصری نمایشونه کاروي. د معلوماتو په جلا جلا برخو ویشلو سره، نظر د انسان ذهن سره ورته دی.
معلومات په جلا جلا برخو ویشل شوي څومره چې موږ یې دانه کولی شو. د پریکړې ونې اصلي هدف د روزنې ماډل رامینځته کول دي چې د هدف متغیر ټولګي وړاندوینې لپاره کارول کیدی شي. ورک شوي ارزښتونه د پریکړې ونې په کارولو سره په اتوماتيک ډول اداره کیدی شي.
د یو شاټ کوډ کولو، ډمي تغیراتو، یا د نورو معلوماتو دمخه درملنې مرحلو لپاره هیڅ اړتیا نشته. دا په دې معنی سخت دی چې پدې کې د تازه معلوماتو اضافه کول ستونزمن دي. که تاسو اضافي لیبل شوي ډیټا ترلاسه کړئ ، نو تاسو باید ونه په ټول ډیټا سیټ کې بیا وروزو.
د پایلې په توګه، د پریکړې ونې د هر غوښتنلیک لپاره ضعیف انتخاب دی چې د متحرک ماډل بدلون ته اړتیا لري.
د هدف متغیر د ډول پر بنسټ، د پریکړې ونې په دوه ډوله ویشل شوي دي:
- کټګوري متغیر: د پریکړې ونې چې د هدف متغیر کټګوري دی.
- دوامداره متغیر: د پریکړې ونې په کوم کې چې د هدف متغیر دوامدار دی.
4. تصادفي ځنګل
د بې ترتیب ځنګل میتود د ماشین زده کړې راتلونکی تخنیک دی او د ماشین زده کړې الګوریتم نظارت دی چې په پراخه کچه د طبقه بندي او راجستر کولو مسلو کې کارول کیږي. دا د ونې پر بنسټ میتود هم دی، د پریکړې ونې ته ورته.
د ونو ځنګل، یا ډیری پریکړې ونې، د قضاوت کولو لپاره د تصادفي ځنګل میتود لخوا کارول کیږي. کله چې د ډلبندۍ دندو اداره کول، د ځنګل تصادفي میتود کټګوري متغیرونه کاروي پداسې حال کې چې د ریګریشن دندو اداره کول د ډیټاسیټونو سره چې دوامداره تغیرات لري.
یو جوړه، یا د ډیری موډلونو مخلوط، هغه څه دي چې د تصادفي ځنګل طریقه کوي، پدې معنی چې وړاندوینې یوازې د یوې ډلې پر ځای د ماډلونو د یوې ډلې په کارولو سره ترسره کیږي.
د ډلبندۍ او راجستریشن ستونزو لپاره د کارولو وړتیا، چې د عصري ماشین زده کړې ډیری سیسټمونه جوړوي، د تصادفي ځنګل کلیدي ګټه ده.
دوه مختلف ستراتیژۍ د انسمبل لخوا کارول کیږي:
- بسته بندي: د دې کولو سره، د روزنې ډیټاسیټ لپاره ډیر معلومات تولید کیږي. په وړاندوینو کې د توپیر کمولو لپاره ، دا ترسره کیږي.
- بوسټنګ د پرله پسې موډلونو په جوړولو سره د قوي زده کونکو سره د ضعیف زده کونکو سره یوځای کولو پروسه ده چې پایله یې د اعظمي دقت سره وروستی ماډل دی.
5. Naive Bayes
د بائنری (دوه ټولګي) او څو درجې طبقه بندي مسله د Naive Bayes تخنیک په کارولو سره حل کیدی شي. کله چې میتود د بائنری یا کټګورۍ ان پټ ارزښتونو په کارولو سره توضیح شي ، نو دا د پیژندلو لپاره خورا ساده دی. یوه انګیرنه چې د Naive Bayes طبقه بندي کونکي لخوا رامینځته شوې دا ده چې په ټولګي کې د یوې ځانګړتیا شتون د نورو ځانګړتیاو په شتون کې هیڅ اغیزه نلري.
پورته فورمول په ګوته کوي:
- P(H): احتمال چې فرضیه H سمه وي. مخکینی احتمال دې ته ویل کیږي.
- P(E): د شواهدو احتمال
- P(E|H): هغه احتمال چې فرضیه د شواهدو لخوا ملاتړ کیږي.
- P(H|E): د شواهدو په پام کې نیولو سره، احتمال چې فرضیه ریښتیا وي.
A Naive Bayes کټګوري به د دې ځانګړتیاوو څخه هر یو په انفرادي ډول په پام کې ونیسي کله چې د یوې ټاکلې پایلې احتمال ټاکي، حتی که دا ځانګړتیاوې یو بل سره تړلي وي. A Naive Bayesian ماډل د جوړولو لپاره ساده او د لوی ډیټاسیټونو لپاره اغیزمن دی.
دا پیژندل کیږي چې حتی د خورا پیچلي طبقه بندي تخنیکونو څخه غوره ترسره کړي پداسې حال کې چې بنسټیز وي. دا د الګوریتمونو ټولګه ده چې ټول د یو واحد میتود پرځای د بایس تیورم پراساس دي.
6. K- نږدې ګاونډیان
د K-نږدې ګاونډیان (kNN) تخنیک د نظارت شوي ماشین زده کړې فرعي سیټ دی چې د طبقه بندي او راجسټریشن مسلو حل کولو لپاره کارول کیدی شي. د KNN الګوریتم ګومان کوي چې د پرتلې وړ توکي نږدې موندل کیدی شي.
زه دا د ورته فکر لرونکو اشخاصو د غونډې په توګه یادوم. kNN د نورو ډیټا نقطو ترمینځ د ورته والي مفکورې څخه ګټه پورته کوي چې د نږدېوالي ، نږدې کیدو یا فاصلې په کارولو سره. د نږدې لیبل شوي مشاهدې وړ ډیټا پوائنټونو پراساس د نه لیدل شوي ډیټا لیبل کولو لپاره ، په ګراف کې د نقطو ترمینځ جلا کولو لپاره د ریاضیاتو میتود کارول کیږي.
تاسو باید د ډیټا پوائنټونو ترمینځ فاصله وټاکئ ترڅو د نږدې پرتله کولو ځایونو پیژندلو لپاره. د فاصلې اندازه کول لکه د Euclidean فاصله، د هامینګ فاصله، د منهاټن فاصله، او د مینکوسکي فاصله د دې لپاره کارول کیدی شي. K د نږدې ګاونډی شمیر په توګه پیژندل کیږي، او دا اکثرا یو عجیب شمیر دی.
KNN د طبقه بندي او راجع کولو ستونزو لپاره پلي کیدی شي. هغه وړاندوینه چې کله KNN د ریګریشن مسلو لپاره کارول کیږي د K - ډیری ورته پیښو د اوسط یا میډین پراساس وي.
د KNN پر بنسټ د طبقه بندي الګوریتم پایله کیدای شي د ټولګي په توګه وټاکل شي چې د K ډیری ورته پیښو ترمنځ ترټولو لوړ فریکونسۍ لري. هره بیلګه په لازمي ډول د دوی ټولګي لپاره رایه ورکوي، او وړاندوینه د هغه ټولګي پورې اړه لري چې ډیرې رایې ترلاسه کوي.
7. K- معنی
دا د غیر څارل شوي زده کړې تخنیک دی چې د کلستر کولو مسلې حل کوي. د ډیټا سیټونه په یو ټاکلي شمیر کلسترونو ویشل شوي - راځئ چې ورته K وایو - په دې ډول چې د هر کلستر ډیټا ټکي یو شان وي او د نورو کلسترونو څخه جلا وي.
K - د کلستر کولو میتودولوژي معنی لري:
- د هر کلستر لپاره، د K- معنی الګوریتم k سینټروډونه، یا ټکي غوره کوي.
- د نږدې سینټروډ یا K کلسترونو سره، هر ډیټا ټکی کلستر جوړوي.
- اوس، نوي سینټروایډونه د کلستر غړو پورې اړه لري چې دمخه شتون لري.
- د هر ډیټا پوائنټ لپاره نږدې فاصله د دې تازه شوي سینټروایډونو په کارولو سره محاسبه کیږي. تر هغه وخته پورې چې سینټروایډونه بدل نشي، دا پروسه تکرار کیږي.
دا د پوهیدو لپاره ګړندی ، ډیر باوري او ساده دی. که چیرې مسلې شتون ولري، د k - معنی د تطبیق وړتیا تنظیمات ساده کوي. کله چې ډیټاسیټونه له یو بل څخه جلا یا ښه جلا وي، پایلې غوره وي. دا نشي کولی غلط معلومات یا بهرنیان اداره کړي.
8. د ویکتور ماشینونو ملاتړ
کله چې د ډیټا طبقه بندي کولو لپاره د SVM تخنیک کاروئ، خام ډاټا په n-dimensional ځای کې د نقطو په توګه ښودل کیږي (چیرې چې n د هغه ځانګړتیاو شمیر دی چې تاسو یې لرئ). بیا ډاټا په اسانۍ سره طبقه بندي کیدی شي ځکه چې د هرې ځانګړتیا ارزښت بیا د یو ځانګړي همغږۍ سره تړلی دی.
د معلوماتو د جلا کولو لپاره او په ګراف کې یې واچوئ، د کټګوریو په نوم پیژندل شوي کرښه کاروئ. دا طریقه د هر ډیټا نقطه په n-dimensional ځای کې د یوې نقطې په توګه پلیټ کوي، چیرته چې n د هغه ځانګړتیاو شمیر دی چې تاسو یې لرئ او د هرې ځانګړتیا ارزښت یو ځانګړی همغږي ارزښت دی.
موږ به اوس یوه کرښه پیدا کړو چې ډیټا د ډیټا په دوه سیټونو ویشي چې په مختلف ډول طبقه بندي شوي. په دواړو ګروپونو کې د نږدې نقطو څخه فاصله به د دې کرښې په اوږدو کې تر ټولو لرې وي.
څرنګه چې دوه نږدې ټکي هغه دي چې په پورتنۍ مثال کې د کرښې څخه خورا لیرې دي، هغه کرښه چې ډاټا په دوو ګروپونو ویشي چې په مختلف ډول طبقه بندي شوي منځنۍ کرښه ده. زموږ کټګوري دا کرښه ده.
9. د ابعاد کمول
د ابعاد کمولو طریقې په کارولو سره، د روزنې ډاټا ممکن لږ ان پټ تغیرات ولري. په ساده شرایطو کې، دا ستاسو د فیچر سیټ اندازه کمولو پروسې ته اشاره کوي. راځئ تصور وکړو چې ستاسو ډیټاسیټ 100 کالمونه لري؛ د ابعاد کمول به دا مقدار 20 کالمونو ته راټیټ کړي.
ماډل په اوتومات ډول ډیر پیچلي وده کوي او د ډیر فټینګ لوی خطر لري ځکه چې د ځانګړتیاو شمیر ډیریږي. په لویو ابعادو کې د ډیټا سره کار کولو ترټولو لویه مسله هغه څه دي چې د "د ابعاد لعنت" په نوم پیژندل کیږي ، کوم چې پیښیږي کله چې ستاسو ډیټا ډیر شمیر ځانګړتیاوې ولري.
لاندې عناصر د ابعاد کمولو لپاره کارول کیدی شي:
- د اړونده ځانګړتیاوو موندلو او غوره کولو لپاره، د ځانګړتیاوو انتخاب په کار ګمارل کیږي.
- د پخوانیو موجودو ځانګړتیاو په کارولو سره، د فیچر انجینرۍ په لاسي ډول نوي ځانګړتیاوې رامینځته کوي.
پایله
غیر څارل شوي یا نظارت شوي ماشین زده کړه دواړه ممکن دي. نظارت شوي زده کړې غوره کړئ که ستاسو معلومات لږ وي او د روزنې لپاره ښه نښه شوي وي.
د معلوماتو لوی سیټونه اکثرا د غیر څارل شوي زده کړې په کارولو سره غوره پایلې ترسره کوي او تولیدوي. ژوره زده کړه میتودونه غوره دي که تاسو د پام وړ ډیټا ټولګه ولرئ چې په اسانۍ سره شتون لري.
د ځواک پیاوړتیا زده کړه او ژور تقویت زده کړه ځینې موضوعات دي چې تاسو یې مطالعه کړي. د عصبي شبکو ځانګړتیاوې، کارونې، او خنډونه اوس تاسو ته روښانه دي. وروستی مګر لږترلږه، تاسو د مختلف پروګرامینګ ژبو، IDEs، او پلیټ فارمونو لپاره اختیارونه په پام کې نیولي کله چې دا ستاسو د جوړولو لپاره راځي د ماشین زده کړې موډلونه.
بل شی چې تاسو یې کولو ته اړتیا لرئ د هر یو مطالعه او کارول پیل کړئ ماشین زده کړه لاره حتی که موضوع پراخه وي، هر موضوع په څو ساعتونو کې درک کیدی شي که تاسو د هغې ژورې تمرکز وکړئ. هره موضوع له نورو څخه یوازې ولاړه ده.
تاسو باید په یو وخت کې د یوې مسلې په اړه فکر وکړئ، مطالعه یې کړئ، په عمل کې یې واچوئ، او د الګوریتم پلي کولو لپاره د خپلې خوښې ژبه وکاروئ.
یو ځواب ورکړئ ووځي