სარჩევი[დამალვა][ჩვენება]
- 1 ტიტანიკი
- 2. ირლანდიური ყვავილების კლასიფიკაცია
- 3. ბოსტონის სახლის ფასის პროგნოზი
- 4. ღვინის ხარისხის ტესტირება
- 5. საფონდო ბირჟის პროგნოზი
- 6. ფილმის რეკომენდაცია
- 7. დატვირთვის უფლებამოსილების პროგნოზი
- 8. განწყობის ანალიზი Twitter-ის მონაცემების გამოყენებით
- 9. მომავალი გაყიდვების პროგნოზი
- 10. ყალბი ამბების აღმოჩენა
- 11. კუპონების შესყიდვის პროგნოზი
- 12. მომხმარებელთა ჩაქრობის პროგნოზი
- 13. Wallmart გაყიდვების პროგნოზირება
- 14. Uber მონაცემთა ანალიზი
- 15. Covid-19 ანალიზი
- დასკვნა
მანქანათმცოდნეობა არის მარტივი შესწავლა იმის შესახებ, თუ როგორ უნდა ასწავლოს კომპიუტერული პროგრამა ან ალგორითმი, რათა თანდათან გაუმჯობესდეს მაღალ დონეზე წარმოდგენილი კონკრეტული სამუშაო. გამოსახულების იდენტიფიკაცია, თაღლითობის გამოვლენა, სარეკომენდაციო სისტემები და მანქანური სწავლების სხვა აპლიკაციები უკვე პოპულარულია.
ML სამუშაოები ხდის ადამიანის მუშაობას მარტივ და ეფექტურს, ზოგავს დროს და უზრუნველყოფს მაღალი ხარისხის შედეგს. მსოფლიოში ყველაზე პოპულარული საძიებო სისტემა Google-იც კი იყენებს მანქანა სწავლის.
მომხმარებლის მოთხოვნის ანალიზიდან და შედეგების საფუძველზე შედეგის შეცვლით დამთავრებული მოთხოვნასთან მიმართებაში ტენდენციური თემების და რეკლამების ჩვენებამდე, ხელმისაწვდომია მრავალფეროვანი ვარიანტი.
ტექნოლოგია, რომელიც ერთდროულად არის აღქმადი და თვითშესწორებადი, შორს არ არის მომავალში.
დაწყების ერთ-ერთი საუკეთესო გზაა პრაქტიკული მუშაობა და პროექტის შემუშავება. ამიტომ, ჩვენ შევადგინეთ მანქანური სწავლების 15 საუკეთესო პროექტის სია დამწყებთათვის, რათა დაიწყოთ.
1. Titanic
ეს ხშირად განიხილება ერთ-ერთ ყველაზე დიდ და სასიამოვნო ამოცანად ყველასთვის, ვინც დაინტერესებულია მანქანური სწავლების შესახებ მეტი გაიგოს. Titanic გამოწვევა არის მანქანათმცოდნეობის პოპულარული პროექტი, რომელიც ასევე კარგი გზაა Kaggle მონაცემთა მეცნიერების პლატფორმის გასაცნობად. ტიტანიკის მონაცემთა ბაზა შედგება უბედური გემის ჩაძირვის ნამდვილი მონაცემებისგან.
ის შეიცავს ისეთ დეტალებს, როგორიცაა ადამიანის ასაკი, სოციალურ-ეკონომიკური მდგომარეობა, სქესი, სალონის ნომერი, გამგზავრების პორტი და, რაც მთავარია, გადარჩა თუ არა!
K-უახლოესი მეზობლის ტექნიკა და გადაწყვეტილების ხის კლასიფიკატორი განისაზღვრა ამ პროექტისთვის საუკეთესო შედეგების მისაღებად. თუ თქვენ ეძებთ სწრაფ შაბათ-კვირის გამოწვევას თქვენი გასაუმჯობესებლად მანქანათმცოდნეობის უნარები, ეს Kaggle-ზე თქვენთვისაა.
2. ირლანდიური ყვავილების კლასიფიკაცია
დამწყებთათვის უყვართ ირისის ყვავილების კატეგორიზაციის პროექტი და ეს შესანიშნავი ადგილია დასაწყებად, თუ ახალი ხართ მანქანური სწავლის სფეროში. სეპალებისა და ფურცლების სიგრძე განასხვავებს ირისის ყვავილებს სხვა სახეობებისგან. ამ პროექტის მიზანია ყვავილის გამოყოფა სამ სახეობად: ვირჯინია, სეტოზა და ვერსიკოლორი.
კლასიფიკაციის სავარჯიშოებისთვის პროექტი იყენებს ირისის ყვავილების მონაცემთა ბაზას, რომელიც ეხმარება მოსწავლეებს ისწავლონ რიცხვითი მნიშვნელობებისა და მონაცემების საფუძვლები. ირისის ყვავილების ნაკრები არის პატარა, რომელიც შეიძლება შეინახოს მეხსიერებაში მასშტაბის საჭიროების გარეშე.
3. ბოსტონის სახლის ფასის პროგნოზი
კიდევ ერთი ცნობილი მონაცემთა ნაკრები მანქანური სწავლის დამწყებთათვის არის ბოსტონის საბინაო მონაცემები. მისი მიზანია სახლის ღირებულებების პროგნოზირება ბოსტონის სხვადასხვა უბნებში. ის მოიცავს სასიცოცხლო სტატისტიკას, როგორიცაა ასაკი, ქონების გადასახადის განაკვეთი, დანაშაულის დონე და სამუშაო ცენტრებთან სიახლოვეც კი, რაც შეიძლება გავლენა იქონიოს საცხოვრებლის ფასებზე.
მონაცემთა ნაკრები მარტივი და მცირეა, რაც ახალბედებისთვის ექსპერიმენტებს მარტივს ხდის. იმის გასარკვევად, თუ რა ფაქტორები ახდენს გავლენას ბოსტონში ქონების ფასზე, რეგრესიის ტექნიკა ძლიერად გამოიყენება სხვადასხვა პარამეტრებზე. ეს შესანიშნავი ადგილია რეგრესიის ტექნიკის პრაქტიკაში და შესაფასებლად, რამდენად კარგად მუშაობს ისინი.
4. ღვინის ხარისხის ტესტირება
ღვინო უჩვეულო ალკოჰოლური სასმელია, რომელიც წლობით დუღილს მოითხოვს. შედეგად, ანტიკვარული ღვინის ბოთლი ძვირადღირებული და მაღალი ხარისხის ღვინოა. ღვინის იდეალური ბოთლის არჩევას ღვინის დეგუსტაციის გამოცდილება სჭირდება და ეს შეიძლება იყოს უპრობლემოდ.
ღვინის ხარისხის ტესტის პროექტი აფასებს ღვინოებს ფიზიკოქიმიური ტესტების გამოყენებით, როგორიცაა ალკოჰოლის დონე, ფიქსირებული მჟავიანობა, სიმკვრივე, pH და სხვა ფაქტორები. პროექტი ასევე განსაზღვრავს ღვინის ხარისხის კრიტერიუმებს და რაოდენობას. შედეგად, ღვინის ყიდვა ხდება ნიავი.
5. საფონდო ბაზრის პროგნოზი
ეს ინიციატივა საინტერესოა, მუშაობთ თუ არა ფინანსურ სექტორში. საფონდო ბირჟის მონაცემები ფართოდ არის შესწავლილი აკადემიკოსების, ბიზნესის მიერ და როგორც მეორადი შემოსავლის წყარო. ასევე მნიშვნელოვანია მონაცემთა მეცნიერის უნარი, შეისწავლოს და გამოიკვლიოს დროის სერიების მონაცემები. საფონდო ბირჟის მონაცემები შესანიშნავი ადგილია დასაწყებად.
მცდელობის არსი არის აქციის მომავალი ღირებულების პროგნოზირება. ეს ეფუძნება მიმდინარე ბაზრის შესრულებას, ისევე როგორც წინა წლების სტატისტიკას. Kaggle 50 წლიდან აგროვებს მონაცემებს NIFTY-2000 ინდექსის შესახებ და ის ამჟამად ყოველკვირეულად ახლდება. 1 წლის 2000 იანვრიდან იგი შეიცავს 50-ზე მეტი ორგანიზაციის აქციების ფასებს.
6. ფილმის რეკომენდაცია
დარწმუნებული ვარ, ეს გრძნობა გქონდათ კარგი ფილმის ნახვის შემდეგ. ოდესმე გიგრძვნიათ იმპულსი, რომ დაამშვიდოთ თქვენი გრძნობები მსგავსი ფილმების უზომოდ ყურებით?
ჩვენ ვიცით, რომ OTT სერვისებმა, როგორიცაა Netflix, მნიშვნელოვნად გააუმჯობესეს თავიანთი სარეკომენდაციო სისტემები. როგორც მანქანათმცოდნეობის სტუდენტი, თქვენ უნდა გესმოდეთ, როგორ მიზნად ისახავს ასეთი ალგორითმები კლიენტებს მათი პრეფერენციებისა და მიმოხილვების საფუძველზე.
Kaggle-ზე IMDB მონაცემთა ნაკრები, სავარაუდოდ, ერთ-ერთი ყველაზე სრულყოფილია, რაც საშუალებას აძლევს რეკომენდაციების მოდელების დასკვნას ფილმის სათაურის, მომხმარებლის რეიტინგის, ჟანრის და სხვა ფაქტორების საფუძველზე. ეს ასევე შესანიშნავი მეთოდია კონტენტზე დაფუძნებული ფილტრაციისა და მახასიათებლების ინჟინერიის შესასწავლად.
7. ჩატვირთვის უფლებამოსილების პროგნოზი
სამყარო ტრიალებს სესხების გარშემო. ბანკების მოგების ძირითადი წყარო სესხებზე პროცენტებიდან მოდის. ამიტომ ისინი მათი ფუნდამენტური ბიზნესია.
ინდივიდებს ან ინდივიდთა ჯგუფებს შეუძლიათ ეკონომიკის გაფართოება მხოლოდ ფირმაში ფულის ინვესტიციით, იმ იმედით, რომ მომავალში იხილავენ მისი ღირებულების ზრდას. ხანდახან მნიშვნელოვანია სესხის მოძიება, რათა შეძლოთ ამ ხასიათის რისკების აღება და გარკვეული ამქვეყნიური სიამოვნების მიღებაც კი.
სანამ სესხი მიიღება, ბანკებს ჩვეულებრივ აქვთ საკმაოდ მკაცრი პროცესი. ვინაიდან სესხები მრავალი ადამიანის ცხოვრების ასეთი გადამწყვეტი ასპექტია, სესხის პრეტენზია, რომელზედაც ვინმე განაცხადებს, იქნება ძალიან მომგებიანი, რაც საშუალებას მისცემს უკეთ დაგეგმოს სესხის მიღება ან უარის თქმა.
8. განწყობის ანალიზი Twitter-ის მონაცემების გამოყენებით
მადლობა სოციალური მედიის ქსელები Twitter-ის, Facebook-ისა და Reddit-ის მსგავსად, მოსაზრებებისა და ტენდენციების ექსტრაპოლაცია საკმაოდ მარტივი გახდა. ეს ინფორმაცია გამოიყენება მოვლენების, ადამიანების, სპორტისა და სხვა თემების შესახებ მოსაზრებების აღმოსაფხვრელად. აზრის მოპოვებასთან დაკავშირებული მანქანათმცოდნეობის ინიციატივები გამოიყენება სხვადასხვა გარემოში, მათ შორის პოლიტიკურ კამპანიებსა და ამაზონის პროდუქტების შეფასებებში.
ეს პროექტი თქვენს პორტფოლიოში ფანტასტიურად გამოიყურება! ემოციების გამოვლენისა და ასპექტზე დაფუძნებული ანალიზისთვის, ტექნიკა, როგორიცაა დამხმარე ვექტორული მანქანები, რეგრესია და კლასიფიკაციის ალგორითმები, შეიძლება ფართოდ იქნას გამოყენებული (ფაქტების და მოსაზრებების მოძიება).
9. მომავალი გაყიდვების პროგნოზი
დიდ B2C ბიზნესს და ვაჭრებს სურთ იცოდნენ, რამდენად გაიყიდება თითოეული პროდუქტი მათ ინვენტარში. გაყიდვების პროგნოზირება ეხმარება ბიზნესის მფლობელებს იმის დადგენაში, რომელ საქონელზეა დიდი მოთხოვნა. გაყიდვების ზუსტი პროგნოზირება მნიშვნელოვნად შეამცირებს ხარჯვას და ასევე განსაზღვრავს დამატებით გავლენას მომავალ ბიუჯეტებზე.
საცალო მოვაჭრეები, როგორიცაა Walmart, IKEA, Big Basket და Big Bazaar, იყენებენ გაყიდვების პროგნოზირებას პროდუქტის მოთხოვნის შესაფასებლად. თქვენ უნდა იცნობდეთ ნედლეული მონაცემების გაწმენდის სხვადასხვა ტექნიკას ასეთი ML პროექტების შესაქმნელად. ასევე, საჭიროა რეგრესიული ანალიზის, განსაკუთრებით მარტივი წრფივი რეგრესიის კარგად გააზრება.
ამ ტიპის ამოცანებისთვის, თქვენ უნდა გამოიყენოთ ბიბლიოთეკები, როგორიცაა Dora, Scrubadub, Pandas, NumPy და სხვა.
10. ყალბი ამბების აღმოჩენა
ეს არის კიდევ ერთი უახლესი მანქანური სწავლის მცდელობა, რომელიც მიმართულია სკოლის მოსწავლეებზე. ყალბი ამბები, როგორც ყველამ ვიცით, ცეცხლივით ვრცელდება. ყველაფერი ხელმისაწვდომია სოციალურ მედიაში, დაწყებული პიროვნებების დაკავშირებიდან ყოველდღიური ამბების კითხვამდე.
შედეგად, ყალბი ამბების აღმოჩენა ამ დღეებში სულ უფრო რთული გახდა. ბევრ მსხვილ სოციალურ მედია ქსელს, როგორიცაა Facebook და Twitter, უკვე აქვს ალგორითმები, რათა აღმოაჩინოს ყალბი ამბები პოსტებსა და არხებში.
ყალბი ამბების იდენტიფიცირებისთვის, ამ ტიპის ML პროექტს სჭირდება მრავალი NLP მიდგომისა და კლასიფიკაციის ალგორითმის (PassiveAggressiveClassifier ან Naive Bayes კლასიფიკატორი) საფუძვლიანი გაგება.
11. კუპონების შესყიდვის პროგნოზი
მომხმარებლები სულ უფრო ხშირად ფიქრობენ ონლაინ ყიდვაზე, როდესაც 2020 წელს კორონავირუსი თავს დაესხა პლანეტას. შედეგად, სავაჭრო დაწესებულებები იძულებულნი გახდნენ თავიანთი ბიზნესი ონლაინ გადაიტანონ.
მომხმარებლები, თავის მხრივ, კვლავ ეძებენ დიდ შეთავაზებებს, ისევე როგორც მაღაზიებში, და სულ უფრო მეტად ნადირობენ სუპერ-დაზოგვის კუპონებზე. არსებობს ვებსაიტებიც კი, რომლებიც ეძღვნება ასეთი კლიენტებისთვის კუპონების შექმნას. თქვენ შეგიძლიათ გაეცნოთ მონაცემთა მოპოვების შესახებ მანქანურ სწავლაში, ზოლიანი დიაგრამების, წრიული დიაგრამების და ჰისტოგრამების წარმოებას მონაცემების ვიზუალიზაციისთვის და ფუნქციების ინჟინერიის შესახებ ამ პროექტით.
პროგნოზების გენერირებისთვის, თქვენ ასევე შეგიძლიათ იხილოთ მონაცემთა იმპუტაციის მიდგომები NA მნიშვნელობებისა და ცვლადების კოსინუსური მსგავსების მართვისთვის.
12. მომხმარებელთა ჩაქრობის პროგნოზი
მომხმარებლები კომპანიის ყველაზე მნიშვნელოვანი აქტივია და მათი შენარჩუნება სასიცოცხლოდ მნიშვნელოვანია ნებისმიერი ბიზნესისთვის, რომელიც მიზნად ისახავს შემოსავლების გაზრდას და მათთან გრძელვადიანი მნიშვნელოვანი კავშირების დამყარებას.
გარდა ამისა, ახალი კლიენტის შეძენის ღირებულება ხუთჯერ აღემატება არსებულის შენარჩუნების ღირებულებას. მომხმარებელთა დათრგუნვა/დაქვეითება არის ცნობილი ბიზნეს პრობლემა, რომლის დროსაც მომხმარებლები ან აბონენტები წყვეტენ ბიზნესის კეთებას სერვისთან ან კომპანიასთან.
ისინი იდეალურად აღარ იქნებიან გადამხდელი მომხმარებელი. კლიენტი ჩაითვლება დაქუცმაცებულად, თუ გავიდა გარკვეული დრო მას შემდეგ, რაც მომხმარებელი უკანასკნელად დაუკავშირდა კომპანიას. გადამწყვეტი მნიშვნელობა აქვს თუ არა კლიენტს დათრგუნვას, ისევე როგორც შესაბამისი ინფორმაციის სწრაფად მიწოდებას, რომელიც მიმართულია კლიენტების შეკავებაზე.
ჩვენს ტვინს არ შეუძლია განჭვრიტოს მომხმარებელთა ბრუნვა მილიონობით კლიენტისთვის; აქ არის ის, სადაც მანქანური სწავლება დაგეხმარებათ.
13. Wallmart გაყიდვების პროგნოზირება
მანქანათმცოდნეობის ერთ-ერთი ყველაზე თვალსაჩინო პროგრამაა გაყიდვების პროგნოზირება, რომელიც მოიცავს მახასიათებლების გამოვლენას, რომლებიც გავლენას ახდენენ პროდუქტის გაყიდვებზე და მომავალი გაყიდვების მოცულობის წინასწარ განსაზღვრას.
Walmart-ის მონაცემთა ნაკრები, რომელიც შეიცავს გაყიდვების მონაცემებს 45 ადგილიდან, გამოყენებულია მანქანური სწავლების ამ კვლევაში. გაყიდვები თითო მაღაზიაში, კატეგორიების მიხედვით, ყოველკვირეულად შედის მონაცემთა ბაზაში. მანქანათმცოდნეობის ამ პროექტის მიზანია წინასწარ განსაზღვროს გაყიდვები თითოეული განყოფილებისთვის თითოეულ მაღაზიაში, რათა მათ შეძლონ არხის ოპტიმიზაციისა და ინვენტარის დაგეგმვის უკეთესი გადაწყვეტილებების მიღება.
Walmart მონაცემთა ბაზასთან მუშაობა რთულია, რადგან ის შეიცავს შერჩეულ მოვლენებს, რომლებიც გავლენას ახდენენ გაყიდვებზე და გასათვალისწინებელია.
14. Uber მონაცემთა ანალიზი
რაც შეეხება მათ აპებში მანქანური სწავლისა და ღრმა სწავლების დანერგვასა და ინტეგრირებას, მგზავრობის გაზიარების პოპულარული სერვისი არ ჩამორჩება. ყოველწლიურად ის ამუშავებს მილიარდობით მოგზაურობას, რაც მგზავრებს საშუალებას აძლევს იმოგზაურონ დღის ან ღამის ნებისმიერ დროს.
იმის გამო, რომ მას აქვს ასეთი დიდი კლიენტების ბაზა, მას სჭირდება განსაკუთრებული მომხმარებელთა მომსახურება, რათა მოხდეს მომხმარებელთა საჩივრები რაც შეიძლება სწრაფად.
Uber-ს აქვს მილიონობით ამომრჩევლის მონაცემთა ნაკრები, რომელიც მას შეუძლია გამოიყენოს კლიენტის მოგზაურობის ანალიზისა და ჩვენებისთვის, რათა აღმოაჩინოს ინფორმაცია და გააუმჯობესოს მომხმარებლის გამოცდილება.
15. Covid-19 ანალიზი
COVID-19-მა დღეს მოიცვა მსოფლიო და არა უბრალოდ პანდემიის გაგებით. მიუხედავად იმისა, რომ სამედიცინო ექსპერტები კონცენტრირებულნი არიან ეფექტური ვაქცინაციების შექმნაზე და მსოფლიოს იმუნიზაციაზე, მონაცემთა მეცნიერები არ ჩამორჩებიან.
ახალი შემთხვევები, ყოველდღიური აქტიური რაოდენობა, დაღუპულთა რაოდენობა და ტესტირების სტატისტიკა საჯარო ხდება. პროგნოზები ყოველდღიურად ხდება გასული საუკუნის SARS-ის გავრცელების საფუძველზე. ამისთვის შეგიძლიათ გამოიყენოთ რეგრესიული ანალიზი და მხარდაჭერილი ვექტორული მანქანებზე დაფუძნებული პროგნოზირების მოდელები.
დასკვნა
შეჯამებისთვის, ჩვენ განვიხილეთ რამდენიმე საუკეთესო ML პროექტი, რომელიც დაგეხმარებათ მანქანათმცოდნეობის პროგრამირების ტესტირებაში, ასევე მის იდეებსა და განხორციელებაში. იმის ცოდნა, თუ როგორ უნდა გააერთიანოთ მანქანათმცოდნეობა, დაგეხმარებათ თქვენი პროფესიის წინსვლაში, რადგან ტექნოლოგია იკავებს ყველა ინდუსტრიას.
მანქანათმცოდნეობის სწავლისას, ჩვენ გირჩევთ, ივარჯიშოთ თქვენი კონცეფციებით და დაწეროთ ყველა თქვენი ალგორითმი. სწავლის დროს ალგორითმების დაწერა უფრო მნიშვნელოვანია, ვიდრე პროექტის შესრულება და ის ასევე გაძლევთ უპირატესობას საგნების სწორად გაგებაში.
დატოვე პასუხი