ڪنهن به قسم جي ڪارپوريٽ سرگرمي لاءِ بنيادي معيارن مان هڪ آهي معلومات جو مؤثر استعمال. ڪجهه نقطي تي، ڊيٽا جو مقدار پيدا ڪيل بنيادي پروسيسنگ جي گنجائش کان وڌي ٿو.
اهو آهي جتي مشين سکيا الگورتھم راند ۾ اچن ٿا. بهرحال، ان کان اڳ جو ڪو به ٿي سگهي ٿو، معلومات جو مطالعو ۽ تفسير ٿيڻ گهرجي. مختصر ۾، اھو اھو آھي جيڪو غير نگراني ٿيل مشين لرننگ لاءِ استعمال ڪيو ويندو آھي.
هن آرٽيڪل ۾، اسين جانچينداسين غير نگراني ٿيل مشين لرننگ جي کوٽائي، بشمول ان جي الگورتھم، استعمال جا ڪيس، ۽ گهڻو ڪجهه.
غير نگراني ٿيل مشين لرننگ ڇا آهي؟
غير نگراني ٿيل مشين لرننگ الگورٿمس ڊيٽا سيٽ ۾ نمونن جي نشاندهي ڪن ٿا جن کي معلوم يا ليبل ٿيل نتيجو نه آهي. نگران مشيني سکيا جا الگورٿم هڪ ليبل ٿيل پيداوار آهي.
ھن فرق کي ڄاڻڻ توھان کي سمجھڻ ۾ مدد ڪري ٿي ته ڇو غير نگراني ٿيل مشين لرننگ طريقا رجعت يا درجه بندي جي مسئلن کي حل ڪرڻ لاءِ استعمال نٿا ڪري سگھجن، ڇو ته توھان کي خبر ناھي ته ٻاھرين ڊيٽا جو قدر/جواب ڇا ٿي سگھي ٿو. توهان عام طور تي هڪ الگورتھم کي تربيت نه ٿا ڪري سگهو جيڪڏهن توهان قيمت/جواب نه ڄاڻندا آهيو.
ان کان علاوه، غير نگراني ٿيل سکيا ڊيٽا جي بنيادي ڍانچي کي سڃاڻڻ لاء استعمال ڪري سگهجي ٿي. اهي الگورتھم ڳجها نمونا يا ڊيٽا گروپن کي ڳوليندا آهن بغير انساني رابطي جي ضرورت جي.
ان جي معلومات ۾ هڪجهڙائي ۽ تضاد کي ڳولڻ جي صلاحيت ان کي هڪ بهترين انتخاب بڻائي ٿي ڳولا واري ڊيٽا جي تجزيي، ڪراس وڪرو ٽيڪنڪ، صارفين جي ڀاڱيداري، ۽ تصوير جي سڃاڻپ لاءِ.
هيٺ ڏنل منظر تي غور ڪريو: توهان هڪ پسارڪي دڪان ۾ آهيو ۽ هڪ اڻڄاتل ميوو ڏسو جيڪو توهان اڳ ڪڏهن به نه ڏٺو آهي. توهان آساني سان اڻڄاتل ميوو کي ان جي شڪل، سائيز يا رنگ جي توهان جي مشاهدي جي بنياد تي ٻين ميوو کان مختلف فرق ڪري سگهو ٿا.
غير نگراني ٿيل مشين لرننگ الگورتھم
ڪلستر
ڪلسترنگ بغير ڪنهن شڪ جي سڀ کان وڏي پيماني تي استعمال ٿيل غير نگراني ٿيل سکيا وارو طريقو آهي. اهو طريقو لاڳاپيل ڊيٽا شيون رکي ٿو بي ترتيب ٺاهيل ڪلستر ۾.
پاڻ طرفان، هڪ ML ماڊل ڪنهن به نمونن، هڪجهڙائي، ۽/يا اختلافن کي اڻ ڳڻي ڊيٽا جي جوڙجڪ ۾ ڳولي ٿو. هڪ ماڊل ڊيٽا ۾ ڪنهن به قدرتي گروپن يا طبقن کي ڳولڻ جي قابل هوندو.
قسم
ڪلستر جا ڪيترائي روپ آھن جيڪي استعمال ڪري سگھجن ٿيون. اچو ته سڀ کان پهريان سڀ کان اهم شيون ڏسو.
- خاص ڪلسترنگ، ڪڏهن ڪڏهن "سخت" ڪلسترنگ طور سڃاتو وڃي ٿو، هڪ قسم جي گروهه آهي جنهن ۾ ڊيٽا جو هڪ ٽڪرو صرف هڪ ڪلستر سان تعلق رکي ٿو.
- اوورليپنگ ڪلسترنگ، اڪثر ڪري "نرم" ڪلسترنگ طور سڃاتو وڃي ٿو، ڊيٽا جي شين کي مختلف درجي تائين هڪ کان وڌيڪ ڪلستر سان تعلق رکڻ جي اجازت ڏئي ٿو. ان کان علاوه، امڪاني ڪلسترنگ استعمال ڪري سگهجي ٿو "نرم" ڪلسترنگ يا کثافت جي تخميني جي مسئلن کي حل ڪرڻ لاء، ۽ انهي سان گڏ ڪجهه ڪلستر سان تعلق رکندڙ ڊيٽا پوائنٽ جي امڪاني يا امڪان جو جائزو وٺڻ لاء.
- گروهه ٿيل ڊيٽا جي شين جي درجه بندي ٺاهڻ جو مقصد آهي درجه بندي ڪلسترنگ، جيئن نالو اشارو ڪري ٿو. ڊيٽا شيون ٺاهيا ويا آهن يا ڪلستر پيدا ڪرڻ جي درجه بندي جي بنياد تي گڏيل.
ڪيس استعمال ڪريو:
- بي ترتيبي جي چڪاس:
ڊيٽا ۾ ڪنهن به قسم جي آئوٽلير کي ڪلسترنگ استعمال ڪندي ڳولي سگهجي ٿو. نقل و حمل ۽ لوجسٽڪس ۾ ڪمپنيون، مثال طور، استعمال ڪري سگھن ٿيون انوملي جي چڪاس کي ڳولڻ لاءِ لاجسٽڪ رڪاوٽون يا خراب ٿيل ميخانياتي حصن کي ظاهر ڪرڻ (پيش گذار سار سنڀال).
مالي ادارا ٽيڪنالاجي کي استعمال ڪري سگھن ٿا دوکي جي ٽرانزيڪشن کي ڳولڻ ۽ جلدي جواب ڏيڻ، ممڪن طور تي تمام گهڻو پئسو بچائي. اسان جي وڊيو کي ڏسڻ سان غير معمولي ۽ دوکي جي نشاندهي ڪرڻ بابت وڌيڪ سکو.
- گراهڪن ۽ مارڪيٽن جي تقسيم:
ڪلسٽرنگ الگورٿمس ماڻهن کي گروپ ڪرڻ ۾ مدد ڪري سگھن ٿا جيڪي ساڳيا خاصيتون آهن ۽ وڌيڪ موثر مارڪيٽنگ ۽ ٽارگيٽ ڪيل شروعاتن لاءِ صارف شخصيتون ٺاهي سگهن ٿا.
K- مطلب
K- مطلب هڪ ڪلسٽرنگ طريقو آهي جنهن کي پڻ ورهاڱي يا سيگمينٽيشن طور سڃاتو وڃي ٿو. اهو ڊيٽا پوائنٽن کي ورهائي ٿو اڳ ۾ مقرر ڪيل تعداد ۾ ڪلستر جي نالي سان سڃاتو وڃي ٿو K.
K- مطلب جي طريقي ۾، K ان پٽ آھي جڏھن توھان ڪمپيوٽر کي ٻڌايو ته توھان پنھنجي ڊيٽا ۾ ڪيترا ڪلستر سڃاڻڻ چاھيو ٿا. هر ڊيٽا آئٽم کي بعد ۾ ويجھي ڪلستر سينٽر تي لڳايو ويو آهي، جيڪو سينٽروڊ (تصوير ۾ ڪارو نقطو) جي نالي سان سڃاتو وڃي ٿو.
بعد ۾ ڊيٽا اسٽوريج جي جڳهن جي طور تي ڪم ڪري ٿو. ڪلسترنگ ٽيڪنڪ ڪيترائي ڀيرا ٿي سگھي ٿي جيستائين ڪلستر چڱي طرح بيان ڪيا ويا آھن.
فزي K- مطلب
فزي K- مطلب K- مطلب ٽيڪنڪ جو هڪ واڌارو آهي، جيڪو اوورليپنگ ڪلسترنگ ڪرڻ لاءِ استعمال ٿيندو آهي. K-means ٽيڪنڪ جي برعڪس، فزي K- مطلب اهو ظاهر ٿئي ٿو ته ڊيٽا پوائنٽ شايد ڪيترن ئي ڪلسترن سان تعلق رکن ٿيون، هر هڪ جي قربت جي مختلف درجي سان.
ڊيٽا پوائنٽس ۽ ڪلستر جي سينٽروڊ جي وچ ۾ فاصلو قربت کي ڳڻڻ لاء استعمال ڪيو ويندو آهي. نتيجي طور، اهڙا موقعا ٿي سگهن ٿا جڏهن مختلف ڪلستر اوورليپ.
گاسي مرکب جا ماڊل
Gaussian Mixture Models (GMMs) ھڪڙو طريقو آھي جيڪو امڪاني ڪلسترنگ ۾ استعمال ٿيندو آھي. ڇاڪاڻ ته مطلب ۽ فرق اڻڄاتل آهن، ماڊل اهو فرض ڪن ٿا ته گاسين جي تقسيم جو هڪ مقرر ڪيل تعداد آهي، هر هڪ الڳ ڪلستر جي نمائندگي ڪري ٿو.
اهو طئي ڪرڻ لاءِ ته ڪھڙي ڪلستر سان تعلق رکي ٿو مخصوص ڊيٽا پوائنٽ، طريقو لازمي طور استعمال ڪيو ويندو آھي.
درجه بندي ڪلسترنگ
درجه بندي ڪلسٽرنگ حڪمت عملي شروع ٿي سگھي ٿي ھر ڊيٽا پوائنٽ سان مختلف ڪلستر کي لڳايو ويو آھي. اهي ٻه ڪلستر جيڪي هڪ ٻئي جي ويجهو هوندا آهن پوءِ هڪ ئي ڪلستر ۾ ملائي ويندا آهن. ٻيهر ملائڻ جاري آهي جيستائين صرف هڪ ڪلستر مٿي تي رهي ٿو.
اهو طريقو هيٺيون مٿي يا مجموعي طور سڃاتو وڃي ٿو. جيڪڏھن توھان شروع ڪريو سڀني ڊيٽا آئٽمز سان ساڳي ڪلسٽر سان ڳنڍيل آھي ۽ پوءِ ورهايو وڃي جيستائين ھر ڊيٽا آئٽم کي الڳ ڪلستر طور مقرر ڪيو وڃي، طريقي کي مٿي-ڏسڻ يا تقسيم واري درجي بندي ڪلسترنگ طور سڃاتو وڃي ٿو.
Apriori Algorithm
مارڪيٽ ٽوڪري جي تجزيي کي مشهور ڪيو apriori algorithms، جنهن جي نتيجي ۾ موسيقي پليٽ فارمن ۽ آن لائن اسٽورن لاء مختلف سفارش انجڻ.
اهي ٽرانزيڪشنل ڊيٽا سيٽن ۾ استعمال ڪيا ويندا آهن بار بار شيون ڳولڻ لاءِ، يا شين جي گروپن کي ڳولڻ لاءِ، هڪ پراڊڪٽ جي استعمال جي امڪان جي اڳڪٿي ڪرڻ لاءِ ٻئي جي استعمال جي بنياد تي.
مثال طور، جيڪڏهن مان ”ڪائونٽنگ اسٽارز“ سان Spotify تي OneRepublic جي ريڊيو کي هلائڻ شروع ڪريان ٿو، ته هن چينل تي هڪ ٻئي گانا يقيناً هڪ Imagine Dragon گيت هوندو، جهڙوڪ ”Bad Liar“.
اهو منهنجي اڳوڻي ٻڌڻ جي عادتن ۽ ٻين جي ٻڌڻ جي نمونن تي ٻڌل آهي. Apriori طريقا هڪ hash Tree استعمال ڪندي آئٽم سيٽن جي ڳڻپ ڪن ٿا، ڊيٽا سيٽ جي بيڊٿ-پهريون کي ڇڪيندا آهن.
طول و عرض جي گھٽتائي
Dimensionality reduction هڪ قسم جي غير نگراني ٿيل سکيا آهي جيڪا حڪمت عملين جو هڪ مجموعو استعمال ڪري ٿو گھٽ ۾ گھٽ خاصيتن جو تعداد - يا طول و عرض - ڊيٽا سيٽ ۾. اسان کي واضح ڪرڻ جي اجازت ڏيو.
اهو توهان جي ٺاهڻ دوران ممڪن حد کان وڌيڪ ڊيٽا شامل ڪرڻ جي لالچ ٿي سگهي ٿو مشين سکيا لاء ڊيٽا سيٽ. اسان کي غلط نه سمجھو: هي حڪمت عملي سٺي ڪم ڪري ٿي ڇو ته وڌيڪ ڊيٽا عام طور تي وڌيڪ صحيح نتيجا پيدا ڪري ٿي.
فرض ڪريو ته ڊيٽا N-dimensional اسپيس ۾ ذخيرو ٿيل آهي، هر خصوصيت سان مختلف طول و عرض جي نمائندگي ڪري ٿي. اتي ٿي سگھي ٿو سوين طول و عرض جيڪڏھن تمام گھڻو ڊيٽا آھي.
غور ڪريو Excel اسپريڊ شيٽ، ڪالمن سان خاصيتون ۽ قطار جي نمائندگي ڪندڙ ڊيٽا شيون. جڏهن اتي تمام گھڻا طول و عرض آھن، ML الگورتھم شايد خراب ڪارڪردگي ۽ ڊيٽا جي نمائش ڏکيو ٿي سگهي ٿو.
تنهن ڪري اهو ان کي منطقي بڻائي ٿو خاصيتن يا طول و عرض کي محدود ڪرڻ، ۽ صرف مناسب معلومات پهچائڻ. Dimensionality جي گھٽتائي صرف اهو آهي. اهو ڊيٽا سيٽ جي سالميت تي سمجهوتو ڪرڻ کان سواءِ ڊيٽا انپٽس جي منظم مقدار جي اجازت ڏئي ٿو.
پرنسپل جزو جو تجزيو (PCA)
پرنسپل جزو جو تجزيو هڪ طول و عرض گھٽائڻ وارو طريقو آهي. اهو وڏي ڊيٽا سيٽن ۾ خاصيتن جي تعداد کي گھٽائڻ لاءِ استعمال ڪيو ويندو آهي، جنهن جي نتيجي ۾ وڌيڪ ڊيٽا سادگي جي بغير درستگي کي قربان ڪرڻ جي.
Dataset compression هڪ طريقي سان مڪمل ڪيو ويو آهي جنهن کي فيچر ڪڍڻ جي نالي سان سڃاتو وڃي ٿو. اهو ظاهر ڪري ٿو ته اصل سيٽ مان عناصر هڪ نئين، ننڍڙي هڪ ۾ ٺهيل آهن. اهي نوان خاصيتون بنيادي اجزاء طور سڃاتل آهن.
يقينن، اتي اضافي الگورتھم آھن جيڪي توھان استعمال ڪري سگھو ٿا توھان جي غير نگراني ٿيل سکيا واري ايپليڪيشنن ۾. مٿي ڏنل فهرستون صرف سڀ کان وڌيڪ عام آهن، ڇو ته انهن کي وڌيڪ تفصيل سان بحث ڪيو ويو آهي.
غير نگراني ٿيل سکيا جي درخواست
- غير نگراني ٿيل سکيا جا طريقا بصري تصور جي ڪمن لاءِ استعمال ڪيا ويندا آهن جهڙوڪ اعتراض جي سڃاڻپ.
- غير نگراني ٿيل مشين لرننگ طبي اميجنگ سسٽم کي نازڪ پهلو ڏئي ٿي، جهڙوڪ تصوير جي سڃاڻپ، درجه بندي، ۽ ڀاڱيداري، جيڪي ريڊيالوجي ۽ پيٽولوجي ۾ استعمال ڪيا ويندا آهن مريضن جي تيزيءَ سان ۽ معتبر طريقي سان تشخيص ڪرڻ لاءِ.
- غير نگراني ٿيل سکيا ڊيٽا جي رجحانات کي سڃاڻڻ ۾ مدد ڪري سگھي ٿي جيڪي صارف جي رويي تي ماضي جي ڊيٽا کي استعمال ڪندي وڌيڪ موثر ڪراس وڪڻڻ واري حڪمت عمليون ٺاهڻ لاءِ استعمال ڪري سگھجن ٿيون. چيڪ آئوٽ جي عمل دوران، اهو آن لائين ڪاروبار طرفان استعمال ڪيو ويندو آهي گراهڪن کي صحيح اضافو تجويز ڪرڻ لاءِ.
- غير نگراني ٿيل سکيا جا طريقا ڊيٽا جي وڏي مقدار ذريعي ٻاهران ڳولڻ لاءِ ڳولي سگهن ٿا. اهي غير معمولي شيون خراب ٿيڻ واري سامان، انساني غلطي، يا سيڪيورٽي جي ڀڃڪڙي جو نوٽيس وٺي سگھن ٿيون.
غير نگراني ٿيل سکيا سان مسئلا
غير نگراني ٿيل سکيا مختلف طريقن سان اپيل ڪري ٿي، امڪاني طور تي اهم بصيرت ڳولڻ جي صلاحيت کان قيمتي ڊيٽا ليبلنگ کان بچڻ لاء ڊيٽا آپريشن تنهن هوندي، هن حڪمت عملي کي تربيت ڏيڻ لاء استعمال ڪرڻ جا ڪيترائي نقصان آهن مشيني سکيا جا ماڊل جنهن جي توهان کي خبر هجڻ گهرجي. هتي ڪجهه مثال آهن.
- جيئن ته ان پٽ ڊيٽا ۾ ليبل نه آهن جيڪي جوابي ڪنجين جي طور تي ڪم ڪن ٿا، غير نگراني ٿيل سکيا جا ماڊل جا نتيجا گهٽ درست ٿي سگهن ٿا.
- غير نگراني ٿيل سکيا اڪثر ڪري وڏي ڊيٽا سيٽن سان ڪم ڪري ٿي، جيڪا ڪمپيوٽيشنل پيچيدگي کي وڌائي سگھي ٿي.
- طريقه ڪار انسانن طرفان پيداوار جي تصديق جي ضرورت آهي، يا ته اندروني يا بيروني ماهرن انڪوائري جي موضوع ۾.
- Algorithms کي لازمي طور تي هر ممڪن منظر کي جانچڻ ۽ ڳڻڻ گهرجي سڄي تربيت واري مرحلي ۾، جيڪو ڪجهه وقت وٺندو آهي.
ٿڪل
مؤثر ڊيٽا استعمال هڪ خاص مارڪيٽ ۾ مقابلي واري برتري قائم ڪرڻ جي ڪنجي آهي.
توھان پنھنجي ھدف ٿيل سامعين جي ترجيحن کي جانچڻ لاءِ يا اھو طئي ڪرڻ لاءِ ته غير نگراني ٿيل مشين لرننگ الگورتھم استعمال ڪندي ڊيٽا کي ورهائي سگھو ٿا ته ڪھڙي طرح ڪو خاص انفيڪشن ڪنھن خاص علاج جو جواب ڏئي ٿو.
اتي ڪيترائي عملي ايپليڪيشنون آھن، ۽ ڊيٽا سائنسدان، انجنيئر، ۽ معمار توهان جي مقصدن جي وضاحت ڪرڻ ۽ توهان جي ڪمپني لاءِ منفرد ML حل تيار ڪرڻ ۾ توهان جي مدد ڪري سگهن ٿا.
جواب ڇڏي وڃو