فهرست[پټ][ښکاره]
- 1 ټایټانیک
- 2. د آیرش ګلونو طبقه بندي
- 3. د بوسټن کور قیمت وړاندوینه
- 4. د شراب کیفیت ازموینه
- 5. د سټاک بازار وړاندوینه
- 6. د فلم سپارښتنه
- 7. د وړتیا وړاندوینه بار کړئ
- 8. د ټویټر ډیټا په کارولو سره د احساساتو تحلیل
- 9. د راتلونکي پلور وړاندوینه
- 10. د جعلي خبرونو کشف
- 11. د کوپن پیرود وړاندوینه
- 12. د پېرېدونکو د ورتګ وړاندوینه
- 13. د والمارټ خرڅلاو وړاندوینه
- 14. د اوبر ډیټا تحلیل
- 15. د کوویډ-19 تحلیل
- پایله
د ماشین زده کړه یوه ساده مطالعه ده چې څنګه د کمپیوټر پروګرام یا الګوریتم زده کړه وکړي ترڅو په لوړه کچه وړاندې شوي ځانګړي دندې کې ورو ورو وده وکړي. د انځور پیژندنه، د درغلیو کشف، د سپارښتنې سیسټمونه، او د ماشین زده کړې نور غوښتنلیکونه لا دمخه مشهور ثابت شوي.
د ML دندې د انسان کار ساده او مؤثره کوي، وخت خوندي کوي او د لوړ کیفیت پایلې تضمینوي. حتی ګوګل، د نړۍ ترټولو مشهور د لټون انجن، کاروي ماشین زده کړه.
د کارونکي پوښتنې تحلیل کولو او د پایلو پراساس د پایلې بدلولو څخه د پوښتنې په تړاو د رجحاني موضوعاتو او اعلاناتو ښودلو پورې ، مختلف انتخابونه شتون لري.
ټیکنالوژي چې دواړه ادراک او ځان اصلاح کونکی دی په راتلونکي کې لرې نه ده.
د پیل کولو لپاره یوه له غوره لارو څخه دا ده چې لاسونه ترلاسه کړئ او پروژه ډیزاین کړئ. له همدې امله، موږ د پیل کونکو لپاره د 15 غوره ماشین زده کړې پروژو لیست ترتیب کړی ترڅو تاسو پیل کړي.
1. ټايټانيک
دا ډیری وختونه د هر هغه چا لپاره ترټولو لوی او خورا خوندور کار ګڼل کیږي چې د ماشین زده کړې په اړه نور څه زده کولو کې لیوالتیا لري. د ټایټانیک ننګونه د ماشین زده کړې یوه مشهوره پروژه ده چې د کاګل ډیټا ساینس پلیټ فارم سره آشنا کیدو لپاره د یوې ښې لارې په توګه هم کار کوي. د ټایټانیک ډیټاسیټ د بدبخته کښتۍ د ډوبیدو څخه د ریښتیني معلوماتو څخه جوړ شوی.
پدې کې توضیحات شامل دي لکه د شخص عمر، ټولنیز اقتصادي حالت، جندر، د کیبن شمیره، د وتلو بندر، او تر ټولو مهم، ایا دوی ژوندي پاتې دي!
د K-نږدې ګاونډی تخنیک او د پریکړې ونې طبقه بندي ټاکل شوي ترڅو د دې پروژې لپاره غوره پایلې تولید کړي. که تاسو د خپل ښه کولو لپاره د ګړندۍ اونۍ پای ننګونې په لټه کې یاست د ماشین زده کړې وړتیاوې، دا په کاګل کې ستاسو لپاره دی.
2. د آیرش ګلونو طبقه بندي
پیل کونکي د ایرس ګل کټګورۍ پروژه خوښوي، او دا د پیل کولو لپاره خورا ښه ځای دی که تاسو د ماشین زده کړې ته نوي یاست. د سیپلونو او ګلانو اوږدوالی د ایرس ګلونه د نورو ډولونو څخه توپیر کوي. د دې پروژې موخه دا ده چې ګلونه په دریو ډولونو جلا کړي: ویرجینیا، سیټوسا، او ورسیکولر.
د طبقه بندي تمرینونو لپاره، پروژه د ایرس ګل ډیټاسیټ کاروي، کوم چې زده کونکو سره د شمیرو ارزښتونو او ډیټا سره معامله کولو اساساتو زده کولو کې مرسته کوي. د ایرس ګل ډیټاسیټ یو کوچنی دی چې د اندازه کولو اړتیا پرته په حافظه کې زیرمه کیدی شي.
3. د بوسټن هاؤس قیمت وړاندوینه
یو بل پیژندل شوی د ماشین زده کړې کې د نويو لپاره ډیټاسیټ د بوستون هاؤسنګ ډاټا ده. د دې هدف د بوسټن په مختلفو ګاونډیو کې د کور ارزښتونو وړاندوینه ده. پدې کې حیاتي احصایې شاملې دي لکه عمر، د ملکیت مالیې کچه، د جرم کچه، او حتی د کار مرکزونو ته نږدېوالی، دا ټول ممکن د کور قیمت اغیزه وکړي.
ډیټاسیټ ساده او کوچنی دی، دا د نويانو لپاره تجربه کول اسانه کوي. د دې معلومولو لپاره چې کوم فکتورونه په بوستون کې د ملکیت قیمت اغیزه کوي، د راجستر کولو تخنیکونه په پراخه کچه په مختلفو پیرامیټونو کې کارول کیږي. دا یو ښه ځای دی چې د راجستر کولو تخنیکونه تمرین کړئ او ارزونه وکړئ چې دوی څومره ښه کار کوي.
4. د شرابو کیفیت ازموینه
شراب یو غیر معمولي الکولي مشروبات دي چې کلونه خمیر ته اړتیا لري. د پایلې په توګه، د شراب لرغونی بوتل یو قیمتي او لوړ کیفیت لرونکي شراب دي. د شرابو د مثالي بوتل غوره کول د کلونو کلونو د شرابو چک کولو پوهه ته اړتیا لري، او دا کیدای شي د هټ یا له لاسه ورکولو پروسه وي.
د شرابو کیفیت ازموینې پروژه د فزیکو کیمیکل ازموینو لکه د الکول کچه ، ثابت تیزابیت ، کثافت ، pH او نورو فاکتورونو په کارولو سره شراب ارزوي. پروژه د شرابو د کیفیت معیارونه او مقدار هم ټاکي. د پایلې په توګه، د شرابو پیرود یو هوا کیږي.
5. د سټاک بازار وړاندوینه
دا نوښت په زړه پوری دی چې ایا تاسو په مالي سکتور کې کار کوئ یا نه. د سټاک بازار ډاټا په پراخه کچه د اکادمیکانو، سوداګرۍ، او حتی د ثانوي عاید سرچینې په توګه مطالعه کیږي. د ډیټا ساینس پوه وړتیا د وخت لړۍ ډیټا مطالعه او سپړنه هم حیاتي ده. د سټاک بازار څخه ډاټا د پیل کولو لپاره یو ښه ځای دی.
د هڅو جوهر د سټاک راتلونکي ارزښت وړاندوینه کول دي. دا د اوسني بازار فعالیت او همدارنګه د تیرو کلونو احصایو پراساس دی. کیګل د 50 راهیسې د NIFTY-2000 شاخص کې ډاټا راټولوي، او دا اوس په اونۍ کې تازه کیږي. د جنوري 1، 2000 راهیسې، دا د 50 څخه زیاتو سازمانونو لپاره د سټاک قیمتونه لري.
6. د فلم سپارښتنه
زه ډاډه یم چې تاسو د یو ښه فلم لیدو وروسته دا احساس درلود. ایا تاسو کله هم د ورته فلمونو په لیدو سره د خپل حواس د سرغړونې احساس کړی؟
موږ پوهیږو چې د OTT خدماتو لکه Netflix د دوی د سپارښتنې سیسټمونه د پام وړ ښه کړي. د ماشین زده کړې زده کونکي په توګه، تاسو اړتیا لرئ پوه شئ چې دا ډول الګوریتم څنګه پیرودونکي د دوی د غوره توبونو او بیاکتنو پراساس په نښه کوي.
په کاګل کې د IMDB ډیټا ټاکل شوي احتمال یو له خورا بشپړو څخه دی، د سپارښتنې ماډلونو ته اجازه ورکوي چې د فلم سرلیک، پیرودونکي درجه بندي، ژانر، او نورو فکتورونو پراساس اټکل شي. دا د مینځپانګې پراساس فلټر کولو او فیچر انجینرۍ په اړه زده کولو لپاره عالي میتود هم دی.
7. د وړتیا وړاندوینه بار کړئ
نړۍ د پورونو شاوخوا ګرځي. د بانکونو د ګټې لویه سرچینه د پورونو سود څخه راځي. له همدې امله دوی د دوی بنسټیز کاروبار دی.
افراد یا د افرادو ډلې یوازې کولی شي په راتلونکي کې د ارزښت لوړیدو په تمه په یوه شرکت کې د پیسو پانګوونې له لارې اقتصاد پراخه کړي. دا ځینې وختونه مهم دي چې د پور په لټه کې شئ ترڅو وکولی شئ د دې ماهیت خطرونه واخلئ او حتی په ځینې نړۍي خوښیو کې برخه واخلئ.
مخکې له دې چې پور ومنل شي، بانکونه معمولا د تعقیب لپاره خورا سخت بهیر لري. لکه څنګه چې پورونه د ډیری خلکو د ژوند یو مهم اړخ دی، د پور لپاره د وړتیا وړاندوینه چې یو څوک یې غوښتنه کوي خورا ګټور وي، د پور د منلو یا انکار څخه بهر د ښه پالن کولو اجازه ورکوي.
8. د ټویټر ډیټا په کارولو سره د احساساتو تحلیل
څخه مننه د ټولنیزو رسنیو شبکې د ټویټر، فیسبوک، او ریډیټ په څیر، د نظرونو او رجحاناتو پراخول خورا اسانه شوي دي. دا معلومات د پیښو، خلکو، سپورتونو او نورو موضوعاتو په اړه د نظرونو د لرې کولو لپاره کارول کیږي. د نظر کان کیندنې پورې اړوند د ماشین زده کړې نوښتونه په مختلفو ترتیباتو کې پلي کیږي، په شمول د سیاسي کمپاینونو او د ایمیزون محصول ارزونه.
دا پروژه به ستاسو په پورټ فولیو کې په زړه پوري ښکاري! د احساساتو کشف او د اړخ پر بنسټ تحلیل لپاره، تخنیکونه لکه د ملاتړ ویکتور ماشینونه، ریګریشن، او طبقه بندي الګوریتمونه په پراخه توګه کارول کیدی شي (د حقایقو او نظرونو موندل).
9. د راتلونکي پلور وړاندوینه
لوی B2C سوداګرۍ او سوداګر غواړي پوه شي چې د دوی په لیست کې هر محصول به څومره وپلوري. د پلور وړاندوینه د سوداګرۍ مالکینو سره مرسته کوي ترڅو معلومه کړي چې کوم توکي په لوړه غوښتنه کې دي. د پلور دقیق وړاندوینه به د پام وړ ضایعات کم کړي پداسې حال کې چې په راتلونکي بودیجه کې د زیاتیدونکي اغیز ټاکي.
پرچون پلورونکي لکه والمارټ، IKEA، لوی باسکیټ، او لوی بازار د محصول غوښتنې اټکل کولو لپاره د پلور وړاندوینې کاروي. تاسو باید د داسې ML پروژو جوړولو لپاره د خام ډیټا پاکولو مختلف تخنیکونو سره آشنا اوسئ. همچنان ، د ریګریشن تحلیل ښه پوهه ، په ځانګړي توګه ساده خطي ریګریشن ته اړتیا ده.
د دې ډول دندو لپاره، تاسو اړتیا لرئ چې کتابتونونه لکه ډورا، سکروبادب، پانډاس، NumPy، او نور کاروئ.
10. د جعلي خبرونو کشف
دا د ماشین زده کړې یوه بله هڅه ده چې موخه یې د ښوونځي ماشومان دي. جعلي خبرونه د اور په څیر خپریږي، لکه څنګه چې موږ ټول پوهیږو. هر څه په ټولنیزو رسنیو کې شتون لري، د افرادو سره نښلولو څخه د ورځني خبرونو لوستلو پورې.
د پایلې په توګه، د غلطو خبرونو کشف په دې ورځو کې خورا ستونزمن شوی. د ټولنیزو رسنیو ډیری لویې شبکې، لکه فیسبوک او ټویټر، لا دمخه په پوستونو او فیډونو کې د جعلي خبرونو موندلو لپاره الګوریتمونه لري.
د غلطو خبرونو پیژندلو لپاره، دا ډول ML پروژه د ډیری NLP طریقو او طبقه بندي الګوریتمونو بشپړ پوهاوي ته اړتیا لري (PassiveAggressiveClassifier یا Naive Bayes classifier).
11. د کوپن پیرود وړاندوینه
پیرودونکي په زیاتیدونکې توګه د آنلاین پیرود په اړه فکر کوي کله چې په 2020 کې کورونویرس په سیارې برید وکړ. د پایلې په توګه ، د پیرودلو تاسیسات دې ته اړ شوي چې خپل سوداګرۍ آنلاین بدل کړي.
پیرودونکي، له بلې خوا، لاهم د عالي وړاندیزونو په لټه کې دي، لکه څنګه چې دوی په پلورنځیو کې وو، او په زیاتیدونکي توګه د سپر سپمولو کوپنونو په لټه کې دي. حتی داسې ویب پاڼې شتون لري چې د ورته پیرودونکو لپاره کوپنونو جوړولو لپاره وقف شوي. تاسو کولی شئ د ماشین زده کړې کې د ډیټا کان کیندنې په اړه زده کړه وکړئ، د بار ګرافونو تولید، پای چارټ، او هسټوګرامونه د ډیټا لیدلو لپاره، او د دې پروژې سره فیچر انجینرۍ.
د وړاندوینو رامینځته کولو لپاره ، تاسو کولی شئ د NA ارزښتونو اداره کولو او د متغیرونو کوزین ورته والی اداره کولو لپاره د ډیټا تخفیف طریقې هم وګورئ.
12. د پیرودونکی د ورتګ وړاندوینه
مصرف کونکي د شرکت ترټولو مهمه پانګه ده، او د دوی ساتل د هرې سوداګرۍ لپاره حیاتي دي چې هدف یې د عاید وده کول او د دوی سره اوږدمهاله معنی لرونکي اړیکې رامینځته کول دي.
سربیره پردې ، د نوي پیرودونکي ترلاسه کولو لګښت د موجوده پیرودونکي ساتلو لګښت څخه پنځه ځله لوړ دی. د پیرودونکی چرن/تشخیص یوه مشهوره سوداګریزه ستونزه ده په کوم کې چې پیرودونکي یا پیرودونکي د خدماتو یا شرکت سره سوداګرۍ کول بندوي.
دوی به په مثالي توګه نور تادیه کونکي پیرودونکي نه وي. یو پیرودونکی په هغه صورت کې منحل ګڼل کیږي که چیرې دا یو ځانګړی وخت وي کله چې پیرودونکي وروستی ځل له شرکت سره اړیکه ونیسي. دا په ګوته کول چې آیا یو پیرودونکی به منحل شي، او همدارنګه په چټکۍ سره د پیرودونکي ساتلو په هدف اړونده معلومات ورکول، د مبایل کمولو لپاره خورا مهم دي.
زموږ دماغونه د ملیونونو پیرودونکو لپاره د پیرودونکي تبادلې اټکل کولو توان نلري؛ دلته د ماشین زده کړه مرسته کولی شي.
13. د والمارټ پلور وړاندوینه
د ماشین زده کړې یو له خورا مشهور غوښتنلیکونو څخه د پلور وړاندوینه ده ، کوم چې د هغه ځانګړتیاو کشف کول شامل دي چې د محصول پلور اغیزه کوي او د راتلونکي پلور حجم اټکل کوي.
د والمارټ ډیټاسیټ، چې د 45 ځایونو څخه د پلور ډاټا لري، د دې ماشین زده کړې مطالعې کې کارول کیږي. په هر پلورنځي کې پلورل ، د کټګورۍ له مخې ، په اونۍ کې په ډیټاسیټ کې شامل دي. د دې ماشین زده کړې پروژې هدف په هره څانګه کې د هرې څانګې لپاره د پلور وړاندوینه کول دي ترڅو دوی وکولی شي د ډیټا لخوا پرمخ وړل شوي چینل اصلاح او د لیست پلان کولو پریکړې غوره کړي.
د والمارټ ډیټاسیټ سره کار کول ستونزمن دي ځکه چې پدې کې د نښه کولو غوره شوي پیښې شتون لري چې په پلور باندې اغیزه لري او باید په پام کې ونیول شي.
14. د اوبر ډیټا تحلیل
کله چې د دوی په ایپسونو کې د ماشین زده کړې او ژورې زده کړې پلي کولو او ادغام کولو خبره راځي ، د سواری شریکولو مشهور خدمت ډیر شاته نه دی. هر کال، دا په ملیاردونو سفرونه پروسس کوي، مسافرینو ته اجازه ورکوي چې د ورځې یا شپې په هر وخت کې سفر وکړي.
ځکه چې دا د پیرودونکي دومره لوی اساس لري، دا د پیرودونکي غیر معمولي خدماتو ته اړتیا لري ترڅو د پیرودونکو شکایتونه ژر تر ژره حل کړي.
اوبر د ملیونونو پک اپ ډیټاسیټ لري چې دا کولی شي د پیرودونکو سفرونو تحلیل او ښودلو لپاره وکاروي ترڅو بصیرت افشا کړي او د پیرودونکي تجربه ښه کړي.
15. د کوویډ-19 تحلیل
COVID-19 نن ورځ ټوله نړۍ پراخه کړې ، نه یوازې د وبا په معنی. پداسې حال کې چې طبي متخصصین د اغیزمنو واکسینونو رامینځته کولو او نړۍ ته د معافیت ورکولو باندې تمرکز کوي، د ډیټا ساینس پوهان ډیر شاته نه دي.
نوې قضیې، هره ورځ فعاله شمیره، تلفات، او د ازموینې احصایې ټول عامه کیږي. وړاندوینې هره ورځ د تیرې پیړۍ د سارس وبا پراساس کیږي. د دې لپاره ، تاسو کولی شئ د ریګریشن تحلیل وکاروئ او د ویکتور ماشین پراساس وړاندوینې ماډلونو ملاتړ وکړئ.
پایله
د لنډیز کولو لپاره، موږ د ځینو غوره ML پروژو په اړه بحث کړی چې تاسو سره به د ماشین زده کړې برنامه ازموینې کې مرسته وکړي او همدارنګه د دې نظرونو او پلي کولو په پوهیدو کې. د ماشین زده کړې ادغام کولو څرنګوالي پوهیدل کولی شي تاسو سره ستاسو په مسلک کې پرمختګ کې مرسته وکړي ځکه چې ټیکنالوژي په هر صنعت کې کار کوي.
د ماشین زده کړې په وخت کې، موږ وړاندیز کوو چې تاسو خپل مفکورې تمرین کړئ او خپل ټول الګوریتمونه ولیکئ. د زده کړې پرمهال د الګوریتم لیکل د پروژې ترسره کولو څخه خورا مهم دي ، او دا تاسو ته د موضوعاتو په سم ډول درک کولو کې ګټه هم درکوي.
یو ځواب ورکړئ ووځي