موږ د لوی AI انقلاب شاهدان یو!
هره ورځ موږ یو نوی اپلیکیشن ترلاسه کوو چې حیرانونکي وړتیاوې لري. د ډیری ایپسونو او برنامو سره چې د AI او ماشین زده کړې زموږ ژوند ته ننوځي؛ موږ باید د دې په اړه د زده کړې لپاره ډیر وخت ولرو.
پدې پوسټ کې ، موږ به یې وپلټئ ماشین زده کړه په جزئياتو سره. همچنان ، موږ به په ځانګړي توګه د ماشین زده کړې روزنې او انفرنس موضوعاتو تمرکز وکړو.
راځئ چې د اساساتو سره پیل وکړو.
د ماشین زده کړه څه شی ده؟
ډیری وختونه موږ ګورو چې د "ماشین زده کړې" او "مصنوعي استخبارات" اصطلاحات یوځای کارول کیږي. نو، راځئ چې لومړی دا روښانه کړو. ماشین زده کړه د مصنوعي استخباراتو یوه څانګه ده. پدې کې د الګوریتمونو روزنه شامله ده ترڅو د معلوماتو لخوا پرمخ وړل شوي وړاندوینې یا انتخابونه تولید کړي.
سربیره پردې ، دا سیسټمونو ته وړتیا ورکوي چې د تیرو تجربو پراساس په اوتومات ډول خپل فعالیت ته وده ورکړي.
مصنوعي استخباراتله بلې خوا، د انسان د عقل تقلید دی. په دې توګه، کمپیوټر د انسانانو په څیر فکر کولو او عمل کولو لپاره دي. دا ډیری فرعي ساحې لري لکه د ماشین زده کړه، د کمپیوټر لید، او د طبیعي ژبې پروسس کول.
د ماشین زده کړې موډلونو پراختیا
د ماشین زده کړې ماډل یو الګوریتم دی. موږ دا الګوریتمونه رامینځته کوو ترڅو په اتوماتيک ډول د ډیټا زده کړې له لارې فعالیت لوړ کړو. موږ له دوی څخه کار اخلو ترڅو د معلوماتو ډاټا معاینه کړو، د راتلونکو پایلو اټکل وکړو، یا قضاوت وکړو.
راځئ چې یو مثال ورکړو. د دې لپاره چې عکسونه د ګل یا پیشو په توګه طبقه بندي کړي، یو ماډل د انځورونو پیژندلو لپاره روزل کیدی شي.
او، دا کولی شي پریکړه وکړي چې ایا انځور د ګل یا پیشو دی. د ماشین زده کړې اصلي اصل دا دی چې د ماډل فعالیت باید په دوامداره توګه ښه شي. دا باید په ډیټا کې د پیرامیټونو بدلولو لپاره ښه عکس العمل ولري.
ډیری وختونه، موږ د دې ماشین زده کړې روزنه ترسره کوو د Jupyter نوټ بوک، کوم چې د هرې ډیټا اړوند پروژې لپاره په زړه پوری وسیله ده.
د موډل روزنه
د وړاندوینې رامینځته کولو لپاره د الګوریتم درس ورکولو پروسه یا د ان پټ ډیټا پراساس عمل کول د "روزنې" په نوم یادیږي. د روزنې په جریان کې، د سیسټم پیرامیټونه تعدیل شوي ترڅو د کار کولو الګوریتم فعال کړي. په نهایت کې ، موږ هڅه کوو د نوي ډیټا په اړه دقیق وړاندوینې تولید کړو.
نظارت او بې څارنې زده کړه د ماشین زده کړې دوه لومړني کټګورۍ دي.
نظارت شوې زده کړې
یو لیبل شوی ډیټاسیټ د څارنې زده کړې کې د الګوریتم روزلو لپاره کارول کیږي. د ماشین زده کړې په دې ډول کې، تمه شوې پایله د هرې ان پټ لپاره مشخص شوې. الګوریتم د تازه معلوماتو په اړه وړاندوینې کوي. همچنان ، دا د دې معلوماتو په کارولو سره د معلوماتو او محصولاتو ترمینځ اړیکې زده کوي.
ځکه چې ماډل په دې اړه نظارت ترلاسه کوي چې مطلوب پایلې باید څه وي، دا ډول زده کړې ته "څارل شوي" ویل کیږي.
غوښتنلیکونه لکه د وینا پیژندنه، د انځور طبقه بندي، او د طبیعي ژبې پروسس ټول د څارنې زده کړې څخه کار اخلي. په دې غوښتنلیکونو کې، الګوریتم په لوی لیبل شوي ډیټاسیټونو کې روزل کیږي. له همدې امله، موږ کولی شو د تازه، غیر متوقع معلوماتو وړاندوینه وکړو.
همدارنګه، د ان پټ څخه تر محصول نقشه باید د امکان تر حده دقیق وي.
د معلوماتو او محصولاتو تر مینځ خورا دقیق نقشه موندل د نظارت شوي زده کړې هدف دی.
نه سپارل شوې زده کړې
غیر څارل شوي زده کړه د ماشین زده کړې یوه فرعي برخه ده. موږ په بې لیبل شوي ډیټا سیټ کې الګوریتم روزو. له همدې امله، ماډلونه په ډاټا کې نمونې یا ارتباط کشف کوي. موږ اړتیا نلرو چې په ځانګړي ډول تعریف کړو چې محصول باید څه وي. دا ډول زده کړه د "بې څارنې" په توګه ویل کیږي. دا ځکه چې ماډل په دې اړه هیڅ واضح لارښود نه ترلاسه کوي چې محصول باید څه وي.
غوښتنلیکونه لکه د بې نظمۍ کشف کول، کلستر کول، او د ابعاد کمول غیر څارل شوي زده کړې ته اړتیا لري. په دې غوښتنلیکونو کې، الګوریتم باید په ډاټا کې نمونې یا ارتباط پیژني. او، دا د غیر لیبل شوي ډاټا نمونې په اړه روزل شوي وروسته له واضح لارښوونې پرته دی.
د غیر څارل شوي زده کړې هدف د پټو نمونو یا جوړښتونو موندل دي. موږ کولی شو دا په مختلفو دندو کې وکاروو، لکه د ډیټا کمپریشن یا ورته شیانو سره یوځای کول.
د ماشین زده کړې اصلاح کول
د اصلاح کولو پروسه د ماشین زده کړې ماډل په جوړولو کې اړینه ده. د اصلاح کولو هدف د روزنې ډیټا کې د ماډل وړاندوینو او ریښتیني ارزښتونو ترمینځ توپیر کمول دي.
دا پروسه موډل سره مرسته کوي چې د معلوماتو او محصولاتو ترمنځ اړیکې زده کړي. له همدې امله ، موږ کولی شو ترټولو دقیق وړاندوینې ترلاسه کړو.
د غلطۍ په کمولو سره، ماډل ممکن نوي، پخوا نامعلومو معلوماتو ته ښه عمومي کړي. پدې توګه ، دا کولی شي ډیر قوي او د باور وړ وړاندوینې تولید کړي.
د ماشین زده کړې کې، د اصلاح کولو پروسه د الګوریتمونو لکه د تدریجي نزول په کارولو سره ترسره کیږي. نو، زموږ الګوریتم په دوامداره توګه پیرامیټونه تنظیموي تر هغه چې خطا کمه شوې نه وي. د اصلاح کولو کړنلاره د دې لپاره اړینه ده چې د ماډل وړاندوینې سمې وي.
د ماشین زده کړې د روزنې ډیټاسیټ
د روزنې ډیټاسیټ د ډیټا یوه ټولګه ده چې د روزنې لپاره کارول کیږي د ماشین زده کړې ماډل. موږ موډل ته روزنه ورکوو چې څنګه د معلوماتو او پایلو مثالونو ښودلو سره وړاندوینې رامینځته کړو. د دې روزنې معلوماتو پراساس، ماډل خپل پیرامیټر بدلوي.
له همدې امله، د دې وړاندوینو دقت د یو جلا ډیټاسیټ په کارولو سره ارزول کیږي، د اعتبار سیټ.
د روزنې ډیټاسیټ باید د حل کیدو ستونزې منعکس کړي. او، دا باید په کافي اندازه معلومات ولري ترڅو موډل په مناسب ډول وروزل شي. د ماډل وړاندوینې ممکن ناسمې وي که چیرې د روزنې ډیټاسیټ خورا کوچنی وي.
یا، دا ممکن ډیر استازی نه وي. د پایلې په توګه، د روزنې ډیټاسیټ پراخه دمخه پروسس کول یوه اړتیا ده. له همدې امله ، موږ تضمین کولی شو چې ماډل ترټولو لوی بریالیتوب لري.
د روزنې یوه بیلګه:
راځئ چې د روزنې پروسې د پوهیدو لپاره یو مثال ورکړو.
په دې مثال کې، موږ فرض کوو چې موږ د "music.csv" په نوم ډیټاسیټ لرو. دا د جنس، عمر او ژانر ارزښتونه لري. له همدې امله، دا وړاندوینه کوي چې د موسیقۍ کوم ژانر یو سړی د خپل عمر او جنس پراساس اوري.
دا د scikit-learn کتابتون په کارولو سره د ماشین زده کړې ساده روزنې لپاره د Python کوډ دی: په دې کوډ کې د لوژستیک ریګریشن طریقه کارول کیږي ترڅو په ډیټا کې ماډل وروزي او بیا د ازموینې ډیټا کې د هغې دقت ارزونه وکړي.
معلومات په پیل کې د پانډاس ډیټا چوکاټ کې اچول کیږي مخکې لدې چې په ځانګړتیاو (X) او هدفونو (Y) (y) ویشل شي. له هغې وروسته، ډاټا د روزنې او ازموینې سیټونو کې ویشل شوي، د معلوماتو 80٪ د روزنې لپاره او 20٪ د ازموینې لپاره کارول کیږي. بیا موډل د ټیسټ ډیټا کې ازموینې دمخه د روزنې ډیټا باندې روزل کیږي.
د ماشین زده کړې په برخه کې تحلیل
د تازه معلوماتو په اړه وړاندوینې کولو لپاره د روزل شوي ماډل کارولو پروسه د انفرنس په توګه راجع کیږي.
د بل ډول کولو لپاره، دا د روزنې په جریان کې ترلاسه شوي معلوماتو کارول دي. ماډل تازه معلومات ترلاسه کوي او د روزنې معلوماتو کې موندل شوي نمونو پراساس وړاندوینه یا قضاوت رامینځته کوي.
د ماډل وړاندوینې به د روزنې معلوماتو کیفیت پورې اړه ولري. همچنان ، دا به په غوره شوي ماډل جوړښت پورې اړه ولري ، او هغه تخنیکونه چې د ماډل روزنې لپاره کارول کیږي.
په غوښتنلیکونو کې د اټکل اهمیت
په پایله کې، موږ موډل ته وړتیا ورکوو چې د یوې ځانګړې موخې لپاره پایلې چمتو کړي. دا توپیر کولی شي لکه د انځور درجه بندي، د طبیعي ژبې پروسس کول، یا د سپارښتنې سیسټمونه. د استخراج مرحلې دقت د سیسټم په ټول فعالیت مستقیم اغیزه لري.
دا د ریښتیني نړۍ غوښتنلیکونو کې د ماشین زده کړې ماډلونو ریښتیني پلي کولو لپاره خورا مهم دی.
د نوي، نامعلومو معلوماتو داخلول
د ماشین زده کړې کې د انفرنس پروسه موډل ته د تازه معلوماتو اضافه کولو سره پیل کیږي. دا ډاټا باید مخکې له مخکې پروسس شي ترڅو د ان پټ فارمیټ سره سمون ومومي چې د ماډل روزنې لپاره کارول کیږي.
وړاندوینې د زده کړې نمونو پراساس
بیا ماډل د ان پټ ډیټا څخه کار اخلي ترڅو وړاندوینې وکړي د روزنې ډیټا زده شوي نمونو پراساس. د وړاندوینو دقیقیت د روزنې معلوماتو کیفیت او کارول شوي تخنیکونو پورې اړه لري.
د تحلیل یوه بیلګه:
د تیر مثال په څیر؛ موږ به لومړی ډیټا وروزو او بیا به تخمین پلي کړو. پدې حالت کې، موږ د LogisticRegression پرځای RandomForestClassifier کارولی دی.
موږ بیا د sci-kit-learn Toolkit په کارولو سره په Python کې وړاندوینې تولیدوو. فرض کړئ چې موږ یو ماډل روزلی او د ډیټا سیټ لرو چې د X ټیسټ په نوم یادیږي چې موږ یې وړاندوینې غواړو.
دا کوډ د ټیسټ ډیټا سیټ X ټیسټ کې د روزل شوي ماډل وړاندوینې فعالیت په کارولو سره وړاندوینه کوي. وړاندوینې بیا د ډیټا چوکاټ کې خوندي شوي ، د لومړي پنځه ښودل شوي سره.
د انفرنس د فعالیت اغیزې عوامل
ډیری مهم عناصر د ماشین زده کړې کې د انفرنس فعالیت اغیزه کوي.
د ارزونې مرحلې سرعت
د انفرنس سرعت یوه مهمه اندیښنه ده ځکه چې دا مستقیم د سیسټم فعالیت اغیزه کوي. د ګړندي اټکل وختونه کولی شي د ګړندي پریکړې کولو یا وړاندوینې لپاره اجازه ورکړي. همدارنګه، دا د ماډل ګټورتوب لوړوي.
د وړاندوینې دقت
بله کلیدي برخه د وړاندوینو دقت دی چې د تحلیل پرمهال رامینځته شوي. دا ځکه چې د ماډل هدف د محصول چمتو کول دي چې د امکان وړ ریښتیني ارزښتونو ته نږدې وي. د ماډل محصول دقت د روزنې معلوماتو کیفیت پورې اړه لري.
همچنان ، دا د ماډل معمارۍ سره خورا تړاو لري.
د تحلیل مرحلې د اصلاح کولو اهمیت
د سرعت سرعت او دقت اهمیت ته په پام سره، دا مهمه ده چې د اغیزمنو پایلو لپاره د استخراج پروسې اصلاح کړئ. پدې کې کیدای شي ستراتیژۍ شاملې وي لکه د ماډل اندازه کمول. یا، تاسو کولی شئ د هارډویر سرعت څخه ګټه پورته کړئ، یا د ان پټ ډیټا پروسس کولو پروسې ته وده ورکړئ.
پایله
په نهایت کې ، د ماشین زده کړې کې ، روزنه ، او تحلیل مهمې پروسې دي. موږ باید ځانګړې پوهه او وړتیا ولرو ترڅو دوی په اغیزمنه توګه پلي کړو. روزنه موډل ته اجازه ورکوي چې وړاندوینې وکړي، پداسې حال کې چې انفرنس ماډل ته اجازه ورکوي چې د تازه معلوماتو پراساس وړاندوینې وکړي.
دواړه د ماډل بریالیتوب او دقت په ټاکلو کې مهم رول لوبوي. نو، دوی په راتلونکې پروژه کې په ذهن کې وساتئ!
یو ځواب ورکړئ ووځي