Bab lan Paragraf[Singidaken][Tampilake]
- 1. Titanics
- 2. Klasifikasi Kembang Irlandia
- 3. Boston House Prediksi Price
- 4. Pengujian Kualitas Anggur
- 5. Prediksi Pasar Saham
- 6. Rekomendasi Wayang
- 7. Prediksi Kelayakan Muat
- 8. Analisis Sentimen nggunakake Data Twitter
- 9. Prediksi Sales mangsa
- 10. Deteksi Warta Palsu
- 11. Prediksi Tuku Kupon
- 12. Prediksi Churn Pelanggan
- 13. Wallmart Prakiraan Sales
- 14. Analisis Data Uber
- 15. Analisis Covid-19
- kesimpulan
Machine learning minangka sinau prasaja babagan carane ngajari program komputer utawa algoritma supaya bisa nambah kanthi bertahap ing proyek tartamtu sing ditampilake ing tingkat dhuwur. Identifikasi gambar, deteksi penipuan, sistem rekomendasi, lan aplikasi machine learning liyane wis kabukten populer.
Pakaryan ML nggawe karya manungsa dadi gampang lan efisien, ngirit wektu lan njamin asil sing berkualitas. Malah Google, mesin telusur paling populer ing donya, nggunakake learning machine.
Saka nganalisa pitakon pangguna lan ngowahi asil adhedhasar asil kanggo nuduhake topik lan pariwara sing tren ing hubungane karo pitakon, ana macem-macem pilihan sing kasedhiya.
Teknologi sing bisa ngerteni lan mbenerake dhewe ora adoh banget ing mangsa ngarep.
Salah sawijining cara sing paling apik kanggo miwiti yaiku nggawe tangan lan ngrancang proyek. Mula, kita wis nyusun dhaptar 15 proyek machine learning paling apik kanggo pamula supaya sampeyan bisa miwiti.
1. Titanic
Iki asring dianggep minangka salah sawijining tugas sing paling gedhe lan paling nyenengake kanggo sapa wae sing kepengin sinau babagan machine learning. Tantangan Titanic minangka proyek pembelajaran mesin populer sing uga dadi cara sing apik kanggo kenal karo platform ilmu data Kaggle. Dataset Titanic digawe saka data asli saka tenggelam kapal sing nandhang lara.
Iki kalebu rincian kayata umur wong, status sosial ekonomi, jender, nomer kabin, pelabuhan keberangkatan, lan sing paling penting, apa dheweke slamet!
Teknik K-Nearest Neighbor lan klasifikasi wit keputusan ditemtokake kanggo ngasilake asil sing paling apik kanggo proyek iki. Yen sampeyan nggoleki tantangan akhir minggu sing cepet kanggo nambah kabisan Machine Learning, iki ing Kaggle kanggo sampeyan.
2. Klasifikasi Bunga Irlandia
Pamula seneng karo proyek kategorisasi kembang iris, lan iku panggonan sing apik kanggo miwiti yen sampeyan anyar ing machine learning. Dawane sepal lan kelopak mbedakake kembang iris saka spesies liyane. Tujuan proyek iki yaiku kanggo misahake kembang dadi telung spesies: Virginia, setosa, lan Versicolor.
Kanggo latihan klasifikasi, proyek kasebut nggunakake dataset kembang Iris, sing mbantu para siswa sinau babagan dhasar babagan nilai lan data numerik. Dataset kembang iris minangka data cilik sing bisa disimpen ing memori tanpa perlu skala.
3. Boston House Prediksi Price
Liyane kondhang dataset kanggo wong anyar ing machine learning yaiku data Boston Housing. Tujuane kanggo ramalan nilai omah ing macem-macem tetanggan Boston. Iki kalebu statistik penting kayata umur, tarif pajak properti, tingkat kejahatan, lan uga cedhak karo pusat kerja, kabeh bisa mengaruhi rega omah.
Dataset kasebut prasaja lan cilik, dadi gampang kanggo eksperimen kanggo wong anyar. Kanggo mangerteni apa faktor pengaruhe rega property ing Boston, Techniques kemunduran akeh dipunginaaken ing macem-macem paramèter. Iki minangka papan sing apik kanggo nglatih teknik regresi lan ngevaluasi kepiye cara kerjane.
4. Pengujian Kualitas Anggur
Anggur minangka minuman beralkohol sing ora biasa sing mbutuhake fermentasi pirang-pirang taun. Akibaté, botol anggur antik minangka anggur sing larang lan berkualitas. Milih botol anggur sing cocog mbutuhake kawruh ngicipi anggur pirang-pirang taun, lan bisa dadi proses hit-or-miss.
Proyek tes kualitas anggur ngevaluasi anggur nggunakake tes fisikokimia kayata tingkat alkohol, kaasaman tetep, kapadhetan, pH, lan faktor liyane. Proyek kasebut uga nemtokake kritéria kualitas lan jumlah anggur. Akibaté, tuku anggur dadi gampang.
5. Prediksi Pasar Saham
Inisiatif iki nggumunake manawa sampeyan kerja ing sektor finansial utawa ora. Data pasar saham ditliti sacara ekstensif dening akademisi, bisnis, lan malah minangka sumber penghasilan sekunder. Kemampuan ilmuwan data kanggo sinau lan njelajah data seri wektu uga penting. Data saka pasar saham minangka papan sing apik kanggo miwiti.
Inti saka usaha kasebut yaiku ramalan nilai saham ing mangsa ngarep. Iki adhedhasar kinerja pasar saiki uga statistik saka taun sadurunge. Kaggle wis ngumpulake data ing indeks NIFTY-50 wiwit 2000, lan saiki dianyari saben minggu. Wiwit 1 Januari 2000, wis ngemot rega saham kanggo luwih saka 50 organisasi.
6. Rekomendasi Wayang
Aku yakin sampeyan wis ngalami perasaan kasebut sawise ndeleng film sing apik. Apa sampeyan wis nate ngrasakake rasa seneng karo nonton film sing padha?
Kita ngerti manawa layanan OTT kayata Netflix wis nambah sistem rekomendasi kanthi signifikan. Minangka siswa sinau mesin, sampeyan kudu ngerti kepiye algoritma kasebut target klien adhedhasar pilihan lan ulasan.
Data IMDB ing Kaggle bisa uga salah sawijining sing paling lengkap, ngidini model rekomendasi bisa disimpulake adhedhasar judhul film, rating pelanggan, genre, lan faktor liyane. Iki uga cara sing apik kanggo sinau babagan Filtering Berbasis Konten lan Teknik Fitur.
7. Prediksi Kelayakan Muatan
Donya muter babagan utangan. Sumber bathi utama bank-bank asale saka kapentingan utang. Mula dheweke dadi bisnis dhasar.
Individu utawa klompok individu mung bisa nggedhekake ekonomi kanthi nandur modal dhuwit ing perusahaan kanthi pangarep-arep bisa nambah regane ing mangsa ngarep. Kadhang-kadhang penting kanggo golek utangan kanggo bisa njupuk risiko alam iki lan malah melu ing kasenengan donya tartamtu.
Sadurunge silihan bisa ditampa, bank-bank biasane duwe proses sing cukup ketat. Amarga silihan minangka aspek penting ing urip akeh wong, prédhiksi nduweni hak kanggo utangan sing ditrapake wong bakal migunani banget, ngidini kanggo ngrancang luwih apik ngluwihi utangan sing ditampa utawa ditolak.
8. Analisis Sentimen nggunakake Data Twitter
Thanks kanggo jaringan media sosial kaya Twitter, Facebook, lan Reddit, panemu ekstrapolasi lan tren dadi gampang banget. Informasi iki digunakake kanggo ngilangi pendapat babagan acara, wong, olahraga, lan topik liyane. Inisiatif pembelajaran mesin sing gegandhengan karo pertambangan diterapake ing macem-macem setelan, kalebu kampanye politik lan evaluasi produk Amazon.
Proyek iki bakal katon apik banget ing portofolio sampeyan! Kanggo deteksi emosi lan analisis adhedhasar aspek, teknik kayata mesin vektor dhukungan, regresi, lan algoritma klasifikasi bisa digunakake kanthi ekstensif (nemokake fakta lan panemu).
9. Prediksi Sales Future
Bisnis lan pedagang B2C gedhe pengin ngerti pira saben produk ing inventaris sing bakal didol. Prakiraan penjualan mbantu para pamilik bisnis nemtokake barang sing dikarepake. Prakiraan penjualan sing akurat bakal nyuda pemborosan nalika uga nemtokake pengaruh tambahan ing anggaran mangsa ngarep.
Pengecer kayata Walmart, IKEA, Big Basket, lan Big Bazaar nggunakake prakiraan penjualan kanggo ngira permintaan produk. Sampeyan kudu ngerti macem-macem teknik ngresiki data mentah kanggo nggawe proyek ML kasebut. Uga, pemahaman sing apik babagan analisis regresi, utamane regresi linier sing prasaja, dibutuhake.
Kanggo tugas kaya iki, sampeyan kudu nggunakake perpustakaan kaya Dora, Scrubadub, Pandas, NumPy, lan liya-liyane.
10. Deteksi Warta Palsu
Iki minangka upaya sinau mesin mutakhir liyane sing ditujokake kanggo bocah sekolah. Kabar palsu nyebar kaya geni, kaya sing kita ngerti. Kabeh kasedhiya ing media sosial, saka nyambungake individu nganti maca warta saben dina.
Akibaté, ndeteksi warta palsu dadi saya angel saiki. Akeh jaringan media sosial gedhe, kayata Facebook lan Twitter, wis duwe algoritma kanggo ndeteksi kabar palsu ing postingan lan feed.
Kanggo ngenali warta palsu, proyek ML jinis iki mbutuhake pemahaman sing lengkap babagan macem-macem pendekatan NLP lan algoritma klasifikasi (PassiveAggressiveClassifier utawa Naive Bayes classifier).
11. Prediksi Tuku Kupon
Pelanggan tambah akeh mikir babagan tuku online nalika coronavirus nyerang planet kasebut ing taun 2020. Akibate, perusahaan blanja kepeksa ngalih bisnis kanthi online.
Pelanggan, ing tangan liyane, isih ngupaya tawaran gedhe, kaya ing toko, lan saya mburu kupon super-nyimpen. Malah ana situs web khusus kanggo nggawe kupon kanggo klien kasebut. Sampeyan bisa sinau babagan data mining ing machine learning, ngasilake grafik bar, pie chart, lan histogram kanggo nggambarake data, lan fitur rekayasa karo proyek iki.
Kanggo ngasilake prediksi, sampeyan uga bisa ndeleng pendekatan imputasi data kanggo ngatur nilai NA lan persamaan kosinus variabel.
12. Prediksi Churn Pelanggan
Konsumen minangka aset sing paling penting ing perusahaan, lan tetep penting kanggo bisnis apa wae sing ngarahake nambah penghasilan lan nggawe hubungan sing migunani kanggo jangka panjang.
Salajengipun, biaya ndarbeni klien anyar kaping lima luwih dhuwur tinimbang biaya kanggo njaga klien sing wis ana. Customer Churn/Attrition minangka masalah bisnis sing kondhang ing ngendi pelanggan utawa pelanggan mandheg nindakake bisnis karo layanan utawa perusahaan.
Saenipun, dheweke ora bakal dadi pelanggan sing mbayar maneh. A customer dianggep churned yen wis jumlah tartamtu saka wektu wiwit customer pungkasan sesambungan karo perusahaan. Ngenali manawa klien bakal churn, uga kanthi cepet menehi informasi sing cocog kanggo retensi pelanggan, penting banget kanggo nyuda churn.
Otak kita ora bisa ngantisipasi turnover pelanggan kanggo mayuta-yuta klien; ing kene machine learning bisa mbantu.
13. Wallmart Prakiraan Sales
Salah sawijining aplikasi pembelajaran mesin sing paling misuwur yaiku prakiraan penjualan, sing kalebu ndeteksi karakteristik sing mengaruhi penjualan produk lan ngarepake volume penjualan ing mangsa ngarep.
Dataset Walmart, sing ngemot data dodolan saka 45 lokasi, digunakake ing sinau machine learning iki. Penjualan saben toko, miturut kategori, saben minggu kalebu ing dataset. Tujuan saka project learning machine iki kanggo antisipasi dodolan kanggo saben departemen ing saben outlet supaya padha bisa nggawe optimasi saluran data-driven luwih apik lan kaputusan planning persediaan.
Nggarap dataset Walmart angel amarga ngemot acara markdown sing dipilih sing duwe pengaruh marang dodolan lan kudu dianggep.
14. Analisis Data Uber
Nalika nerangake ngleksanakake lan nggabungake pembelajaran mesin lan sinau jero ing aplikasi, layanan enggo bareng numpak sing populer ora adoh. Saben taun, iki ngolah milyaran lelungan, ngidini para komuter bisa lelungan kapan wae awan utawa wengi.
Amarga duwe basis klien sing akeh, mula butuh layanan pelanggan sing luar biasa kanggo ngatasi keluhan konsumen kanthi cepet.
Uber duwe sekumpulan mayuta-yuta pick-up sing bisa digunakake kanggo nganalisa lan nampilake perjalanan klien kanggo nemokake wawasan lan nambah pengalaman pelanggan.
15. Analisis Covid-19
COVID-19 wis nyapu jagad saiki, lan ora mung minangka pandemi. Nalika ahli medis fokus kanggo ngasilake vaksinasi sing efektif lan ngimunisasi jagad iki, ilmuwan data ora adoh konco.
Kasus anyar, jumlah aktif saben dina, fatalitas, lan statistik tes kabeh diumumake. Prakiraan digawe saben dina adhedhasar wabah SARS ing abad sadurunge. Kanggo iki, sampeyan bisa nggunakake analisis regresi lan ndhukung model prediksi basis mesin vektor.
kesimpulan
Kanggo ngringkes, kita wis ngrembug sawetara proyek ML paling ndhuwur sing bakal mbantu sampeyan nguji pemrograman Machine Learning uga ngerteni ide lan implementasine. Ngerti carane nggabungake Machine Learning bisa mbantu sampeyan maju ing profesi amarga teknologi njupuk alih ing saben industri.
Nalika sinau Machine Learning, disaranake sampeyan praktek konsep lan nulis kabeh algoritma. Nulis algoritma nalika sinau luwih penting tinimbang nindakake proyek, lan uga menehi keuntungan kanggo ngerti subjek kanthi bener.
Ninggalake a Reply