Daftar Isi[Bersembunyi][Menunjukkan]
- 1 Titanic
- 2. Klasifikasi Bunga Irlandia
- 3. Prediksi Harga Rumah Boston
- 4. Pengujian Kualitas Anggur
- 5. Prediksi Pasar Saham
- 6. Rekomendasi Film
- 7. Memuat Prediksi Kelayakan
- 8. Analisis Sentimen menggunakan Data Twitter
- 9. Prediksi Penjualan Masa Depan
- 10. Deteksi Berita Palsu
- 11. Prediksi Pembelian Kupon
- 12. Prediksi Churn Pelanggan
- 13. Perkiraan Penjualan Wallmart
- 14. Analisis Data Uber
- 15. Analisis Covid-19
- Kesimpulan
Pembelajaran mesin adalah studi sederhana tentang bagaimana mendidik program komputer atau algoritma untuk secara bertahap meningkatkan pekerjaan tertentu yang disajikan pada tingkat tinggi. Identifikasi gambar, deteksi penipuan, sistem rekomendasi, dan aplikasi pembelajaran mesin lainnya telah terbukti populer.
Pekerjaan ML membuat pekerjaan manusia menjadi sederhana dan efisien, menghemat waktu dan memastikan hasil berkualitas tinggi. Bahkan Google, mesin pencari paling populer di dunia, menggunakan Mesin belajar.
Dari menganalisis kueri pengguna dan mengubah hasil berdasarkan hasil hingga menampilkan topik dan iklan yang sedang tren sehubungan dengan kueri, ada berbagai opsi yang tersedia.
Teknologi yang perseptif dan mengoreksi diri tidak jauh di masa depan.
Salah satu cara terbaik untuk memulai adalah dengan langsung dan merancang sebuah proyek. Oleh karena itu, kami telah menyusun daftar 15 proyek pembelajaran mesin teratas untuk pemula untuk membantu Anda memulai.
1. Raksasa
Ini sering dianggap sebagai salah satu tugas terbesar dan paling menyenangkan bagi siapa pun yang tertarik untuk mempelajari lebih lanjut tentang pembelajaran mesin. Tantangan Titanic adalah proyek pembelajaran mesin populer yang juga berfungsi sebagai cara yang baik untuk mengenal platform ilmu data Kaggle. Dataset Titanic terdiri dari data asli dari tenggelamnya kapal naas itu.
Ini mencakup rincian seperti usia orang tersebut, status sosial ekonomi, jenis kelamin, nomor kabin, pelabuhan keberangkatan, dan yang paling penting, apakah mereka selamat!
Teknik K-Nearest Neighbor dan pengklasifikasi pohon keputusan ditentukan untuk menghasilkan hasil terbaik untuk proyek ini. Jika Anda mencari tantangan akhir pekan yang cepat untuk meningkatkan kemampuan Anda Kemampuan Pembelajaran Mesin, ini di Kaggle untuk Anda.
2. Klasifikasi Bunga Irlandia
Pemula menyukai proyek kategorisasi bunga iris, dan ini adalah tempat yang bagus untuk memulai jika Anda baru dalam pembelajaran mesin. Panjang sepal dan kelopak membedakan bunga iris dari spesies lain. Tujuan proyek ini adalah untuk memisahkan bunga mekar menjadi tiga spesies: Virginia, setosa, dan Versicolor.
Untuk latihan klasifikasi, proyek ini menggunakan kumpulan data bunga Iris, yang membantu pelajar dalam mempelajari dasar-dasar berurusan dengan nilai dan data numerik. Dataset bunga iris adalah yang kecil yang dapat disimpan dalam memori tanpa perlu penskalaan.
3. Prediksi Harga Rumah Boston
Satu lagi yang terkenal kumpulan data untuk pemula dalam pembelajaran mesin adalah data Perumahan Boston. Tujuannya adalah untuk memperkirakan nilai rumah di berbagai lingkungan Boston. Ini mencakup statistik penting seperti usia, tarif pajak properti, tingkat kejahatan, dan bahkan kedekatan dengan pusat pekerjaan, yang semuanya dapat mempengaruhi harga perumahan.
Datasetnya sederhana dan kecil, sehingga mudah untuk bereksperimen bagi pemula. Untuk mengetahui faktor apa yang mempengaruhi harga properti di Boston, teknik regresi banyak digunakan pada berbagai parameter. Ini adalah tempat yang bagus untuk berlatih teknik regresi dan menilai seberapa baik mereka bekerja.
4. Pengujian Kualitas Anggur
Anggur adalah minuman beralkohol yang tidak biasa yang membutuhkan fermentasi bertahun-tahun. Akibatnya, sebotol anggur antik adalah anggur yang mahal dan berkualitas tinggi. Memilih sebotol anggur yang ideal membutuhkan pengetahuan mencicipi anggur selama bertahun-tahun, dan itu bisa menjadi proses untung-untungan.
Proyek uji kualitas anggur mengevaluasi anggur menggunakan tes fisikokimia seperti tingkat alkohol, keasaman tetap, kepadatan, pH, dan faktor lainnya. Proyek ini juga menentukan kriteria kualitas dan kuantitas anggur. Akibatnya, pembelian anggur menjadi mudah.
5. Prediksi Pasar Saham
Inisiatif ini menarik apakah Anda bekerja di sektor keuangan atau tidak. Data pasar saham dipelajari secara ekstensif oleh akademisi, bisnis, dan bahkan sebagai sumber pendapatan sekunder. Kemampuan seorang ilmuwan data untuk mempelajari dan mengeksplorasi data deret waktu juga penting. Data dari pasar saham adalah tempat yang bagus untuk memulai.
Inti dari usaha ini adalah untuk meramalkan nilai masa depan suatu saham. Ini didasarkan pada kinerja pasar saat ini serta statistik dari tahun-tahun sebelumnya. Kaggle telah mengumpulkan data pada indeks NIFTY-50 sejak tahun 2000, dan saat ini diperbarui setiap minggu. Sejak 1 Januari 2000, telah berisi harga saham untuk lebih dari 50 organisasi.
6. Rekomendasi Film
Saya yakin Anda memiliki perasaan itu setelah menonton film yang bagus. Pernahkah Anda merasakan dorongan untuk merangsang indra Anda dengan menonton film serupa?
Kami tahu bahwa layanan OTT seperti Netflix telah meningkatkan sistem rekomendasi mereka secara signifikan. Sebagai siswa pembelajaran mesin, Anda harus memahami bagaimana algoritme tersebut menargetkan klien berdasarkan preferensi dan ulasan mereka.
Kumpulan data IMDB di Kaggle kemungkinan adalah salah satu yang paling lengkap, memungkinkan model rekomendasi disimpulkan berdasarkan judul film, peringkat pelanggan, genre, dan faktor lainnya. Ini juga merupakan metode yang sangat baik untuk mempelajari tentang Penyaringan Berbasis Konten dan Rekayasa Fitur.
7. Memuat Prediksi Kelayakan
Dunia berputar di sekitar pinjaman. Sumber utama keuntungan bank berasal dari bunga pinjaman. Oleh karena itu mereka adalah bisnis fundamental mereka.
Individu atau kelompok individu hanya dapat memperluas ekonomi dengan menginvestasikan uang di perusahaan dengan harapan melihatnya meningkat nilainya di masa depan. Kadang-kadang penting untuk mencari pinjaman untuk dapat mengambil risiko alam ini dan bahkan mengambil bagian dalam kesenangan duniawi tertentu.
Sebelum pinjaman dapat diterima, bank biasanya memiliki proses yang cukup ketat untuk diikuti. Karena pinjaman adalah aspek yang sangat penting dalam kehidupan banyak orang, memprediksi kelayakan pinjaman yang diajukan seseorang akan sangat bermanfaat, memungkinkan perencanaan yang lebih baik selain pinjaman yang diterima atau ditolak.
8. Analisis Sentimen menggunakan Data Twitter
Berkat jaringan media sosial seperti Twitter, Facebook, dan Reddit, mengekstrapolasi opini dan tren menjadi sangat mudah. Informasi ini digunakan untuk menghilangkan opini tentang peristiwa, orang, olahraga, dan topik lainnya. Inisiatif pembelajaran mesin terkait penambangan opini sedang diterapkan di berbagai pengaturan, termasuk kampanye politik dan evaluasi produk Amazon.
Proyek ini akan terlihat fantastis dalam portofolio Anda! Untuk deteksi emosi dan analisis berbasis aspek, teknik seperti mesin vektor pendukung, regresi, dan algoritma klasifikasi dapat digunakan secara luas (menemukan fakta dan opini).
9. Prediksi Penjualan Masa Depan
Bisnis dan pedagang B2C besar ingin tahu berapa banyak setiap produk dalam inventaris mereka akan terjual. Peramalan penjualan membantu pemilik bisnis dalam menentukan item mana yang banyak diminati. Peramalan penjualan yang akurat akan secara signifikan mengurangi pemborosan sementara juga menentukan dampak tambahan pada anggaran masa depan.
Pengecer seperti Walmart, IKEA, Big Basket, dan Big Bazaar menggunakan perkiraan penjualan untuk memperkirakan permintaan produk. Anda harus terbiasa dengan berbagai teknik pembersihan data mentah untuk membangun proyek ML tersebut. Juga, pemahaman yang baik tentang analisis regresi, khususnya regresi linier sederhana, diperlukan.
Untuk tugas semacam ini, Anda harus menggunakan pustaka seperti Dora, Scrubadub, Pandas, NumPy, dan lainnya.
10. Deteksi Berita Palsu
Ini adalah upaya pembelajaran mesin mutakhir lainnya yang ditujukan untuk anak sekolah. Berita palsu menyebar seperti api, seperti yang kita semua tahu. Semuanya tersedia di media sosial, mulai dari menghubungkan individu hingga membaca berita harian.
Akibatnya, mendeteksi berita palsu menjadi semakin sulit akhir-akhir ini. Banyak jaringan media sosial besar, seperti Facebook dan Twitter, sudah memiliki algoritme untuk mendeteksi berita palsu di postingan dan feed.
Untuk mengidentifikasi berita palsu, jenis proyek ML ini membutuhkan pemahaman menyeluruh tentang beberapa pendekatan NLP dan algoritma klasifikasi (PassiveAggressiveClassifier atau Naive Bayes classifier).
11. Prediksi Pembelian Kupon
Pelanggan semakin mempertimbangkan untuk membeli secara online ketika virus corona menyerang planet ini pada tahun 2020. Akibatnya, tempat perbelanjaan terpaksa mengalihkan bisnis mereka secara online.
Pelanggan, di sisi lain, masih mencari penawaran hebat, sama seperti mereka di toko, dan semakin berburu kupon super hemat. Bahkan ada situs web yang didedikasikan untuk membuat kupon untuk klien tersebut. Anda dapat mempelajari tentang penambangan data dalam pembelajaran mesin, menghasilkan grafik batang, diagram lingkaran, dan histogram untuk memvisualisasikan data, dan rekayasa fitur dengan proyek ini.
Untuk menghasilkan prediksi, Anda juga dapat melihat pendekatan imputasi data untuk mengelola nilai NA dan kesamaan kosinus variabel.
12. Prediksi Churn Pelanggan
Konsumen adalah aset perusahaan yang paling penting, dan menjaga mereka sangat penting untuk bisnis apa pun yang bertujuan untuk meningkatkan pendapatan dan membangun hubungan jangka panjang yang bermakna dengan mereka.
Selain itu, biaya untuk mendapatkan klien baru lima kali lebih tinggi daripada biaya mempertahankan klien yang sudah ada. Churn/Atrisi Pelanggan adalah masalah bisnis yang terkenal di mana pelanggan atau pelanggan berhenti melakukan bisnis dengan layanan atau perusahaan.
Mereka idealnya tidak lagi menjadi pelanggan yang membayar. Pelanggan dianggap churn jika sudah dalam jangka waktu tertentu sejak pelanggan terakhir kali berinteraksi dengan perusahaan. Mengidentifikasi apakah klien akan churn, serta dengan cepat memberikan informasi relevan yang ditujukan untuk retensi pelanggan, sangat penting untuk menurunkan churn.
Otak kita tidak mampu mengantisipasi pergantian pelanggan untuk jutaan klien; di sinilah pembelajaran mesin dapat membantu.
13. Prakiraan Penjualan Wallmart
Salah satu aplikasi pembelajaran mesin yang paling menonjol adalah peramalan penjualan, yang melibatkan pendeteksian karakteristik yang memengaruhi penjualan produk dan mengantisipasi volume penjualan di masa mendatang.
Kumpulan data Walmart, yang berisi data penjualan dari 45 lokasi, digunakan dalam studi pembelajaran mesin ini. Penjualan per toko, menurut kategori, setiap minggu disertakan dalam kumpulan data. Tujuan dari proyek pembelajaran mesin ini adalah untuk mengantisipasi penjualan untuk setiap departemen di setiap outlet sehingga mereka dapat membuat keputusan pengoptimalan saluran dan perencanaan inventaris berbasis data yang lebih baik.
Bekerja dengan dataset Walmart sulit karena berisi peristiwa penurunan harga yang dipilih yang berdampak pada penjualan dan harus dipertimbangkan.
14. Analisis Data Uber
Dalam hal menerapkan dan mengintegrasikan pembelajaran mesin dan pembelajaran mendalam di aplikasi mereka, layanan berbagi perjalanan yang populer tidak jauh ketinggalan. Setiap tahun, ia memproses miliaran perjalanan, memungkinkan komuter melakukan perjalanan kapan saja, siang atau malam.
Karena memiliki basis klien yang begitu besar, dibutuhkan layanan pelanggan yang luar biasa untuk mengatasi keluhan konsumen secepat mungkin.
Uber memiliki kumpulan data jutaan penjemputan yang dapat digunakan untuk menganalisis dan menampilkan perjalanan klien guna mengungkap wawasan dan meningkatkan pengalaman pelanggan.
15. Analisis Covid-19
COVID-19 telah melanda dunia saat ini, dan tidak hanya dalam arti pandemi. Sementara para ahli medis berkonsentrasi untuk menghasilkan vaksinasi yang efektif dan mengimunisasi dunia, ilmuwan data tidak jauh di belakang.
Kasus baru, jumlah aktif harian, kematian, dan statistik pengujian semuanya dipublikasikan. Prakiraan dibuat setiap hari berdasarkan wabah SARS pada abad sebelumnya. Untuk ini, Anda dapat menggunakan analisis regresi dan mendukung model prediksi berbasis mesin vektor.
Kesimpulan
Untuk meringkas, kami telah membahas beberapa proyek ML teratas yang akan membantu Anda dalam menguji pemrograman Machine Learning serta memahami ide dan implementasinya. Mengetahui cara mengintegrasikan Pembelajaran Mesin dapat membantu Anda maju dalam profesi Anda saat teknologi mengambil alih di setiap industri.
Saat mempelajari Machine Learning, kami menyarankan Anda untuk mempraktikkan konsep Anda dan menulis semua algoritme Anda. Menulis algoritme sambil belajar lebih penting daripada melakukan proyek, dan juga memberi Anda keuntungan dalam memahami mata pelajaran dengan benar.
Tinggalkan Balasan