Jadual Kandungan[Sembunyi][Tunjukkan]
- 1 Titanic
- 2. Klasifikasi Bunga Ireland
- 3. Ramalan Harga Rumah Boston
- 4. Ujian Kualiti Wain
- 5. Ramalan Pasaran Saham
- 6. Syor Filem
- 7. Ramalan Kelayakan Muatan
- 8. Analisis Sentimen menggunakan Data Twitter
- 9. Ramalan Jualan Masa Depan
- 10. Pengesanan Berita Palsu
- 11. Ramalan Pembelian Kupon
- 12. Ramalan Churn Pelanggan
- 13. Ramalan Jualan Wallmart
- 14. Analisis Data Uber
- 15. Analisis Covid-19
- Kesimpulan
Pembelajaran mesin ialah kajian mudah tentang cara mendidik program atau algoritma komputer untuk menambah baik secara beransur-ansur pada tugas tertentu yang dibentangkan pada tahap tinggi. Pengenalan imej, pengesanan penipuan, sistem pengesyoran dan aplikasi pembelajaran mesin lain telah terbukti popular.
Pekerjaan ML menjadikan kerja manusia mudah dan cekap, menjimatkan masa dan memastikan hasil yang berkualiti tinggi. Malah Google, enjin carian paling popular di dunia, menggunakan pembelajaran mesin.
Daripada menganalisis pertanyaan pengguna dan mengubah keputusan berdasarkan keputusan kepada memaparkan topik dan iklan yang menjadi arah aliran berhubung dengan pertanyaan, terdapat pelbagai pilihan yang tersedia.
Teknologi yang bersifat persepsi dan pembetulan diri tidak jauh dari masa hadapan.
Salah satu cara terbaik untuk bermula adalah dengan menggunakan tangan dan mereka bentuk projek. Oleh itu, kami telah menyusun senarai 15 projek pembelajaran mesin teratas untuk pemula untuk memulakan anda.
1. Titanic
Ini sering dianggap sebagai salah satu tugas yang paling hebat dan paling menyeronokkan untuk sesiapa sahaja yang berminat untuk mempelajari lebih lanjut tentang pembelajaran mesin. Cabaran Titanic ialah projek pembelajaran mesin popular yang juga berfungsi sebagai cara yang baik untuk membiasakan diri dengan platform sains data Kaggle. Dataset Titanic terdiri daripada data tulen daripada karam kapal malang itu.
Ia termasuk butiran seperti umur seseorang, status sosioekonomi, jantina, nombor kabin, pelabuhan berlepas dan, yang paling penting, sama ada mereka terselamat!
Teknik K-Nearest Neighbor dan pengelas pokok keputusan telah ditentukan untuk menghasilkan hasil terbaik untuk projek ini. Jika anda sedang mencari cabaran hujung minggu yang pantas untuk meningkatkan anda Kebolehan Pembelajaran Mesin, yang ini di Kaggle adalah untuk anda.
2. Klasifikasi Bunga Ireland
Pemula menyukai projek pengkategorian bunga iris, dan ia adalah tempat yang bagus untuk bermula jika anda baru dalam pembelajaran mesin. Panjang sepal dan kelopak membezakan bunga iris daripada spesies lain. Tujuan projek ini adalah untuk memisahkan bunga kepada tiga spesies: Virginia, setosa, dan Versicolor.
Untuk latihan klasifikasi, projek ini menggunakan set data bunga Iris, yang membantu pelajar mempelajari asas menangani nilai dan data berangka. Dataset bunga iris ialah set kecil yang boleh disimpan dalam ingatan tanpa memerlukan penskalaan.
3. Ramalan Harga Rumah Boston
Satu lagi yang terkenal set data untuk pemula dalam pembelajaran mesin ialah data Perumahan Boston. Matlamatnya adalah untuk meramalkan nilai rumah di pelbagai kejiranan Boston. Ia termasuk statistik penting seperti umur, kadar cukai hartanah, kadar jenayah, dan juga kedekatan dengan pusat pekerjaan, yang kesemuanya mungkin menjejaskan harga perumahan.
Set data adalah ringkas dan kecil, menjadikannya mudah untuk bereksperimen untuk orang baru. Untuk mengetahui faktor yang mempengaruhi harga hartanah di Boston, teknik regresi banyak digunakan pada pelbagai parameter. Ia adalah tempat yang bagus untuk mengamalkan teknik regresi dan menilai sejauh mana teknik tersebut berfungsi.
4. Ujian Kualiti Wain
Wain adalah minuman beralkohol yang luar biasa yang memerlukan penapaian bertahun-tahun. Akibatnya, botol antik wain adalah wain yang mahal dan berkualiti tinggi. Memilih sebotol wain yang ideal memerlukan pengetahuan merasa wain selama bertahun-tahun, dan ia boleh menjadi proses yang sukar atau tidak.
Projek ujian kualiti wain menilai wain menggunakan ujian fizikokimia seperti tahap alkohol, keasidan tetap, ketumpatan, pH dan faktor lain. Projek ini juga menentukan kriteria kualiti dan kuantiti wain. Akibatnya, pembelian wain menjadi mudah.
5. Ramalan Pasaran Saham
Inisiatif ini menarik minat sama ada anda bekerja dalam sektor kewangan atau tidak. Data pasaran saham dikaji secara meluas oleh ahli akademik, perniagaan, dan juga sebagai sumber pendapatan sekunder. Keupayaan saintis data untuk mengkaji dan meneroka data siri masa juga penting. Data daripada pasaran saham adalah tempat yang bagus untuk bermula.
Intipati usaha adalah untuk meramalkan nilai masa depan sesuatu saham. Ini adalah berdasarkan prestasi pasaran semasa serta statistik dari tahun-tahun sebelumnya. Kaggle telah mengumpul data pada indeks NIFTY-50 sejak tahun 2000, dan ia kini dikemas kini setiap minggu. Sejak 1 Januari 2000, ia telah mengandungi harga saham untuk lebih 50 organisasi.
6. Syor Filem
Saya pasti anda pernah mengalami perasaan itu selepas menonton filem yang bagus. Pernahkah anda merasakan dorongan untuk menggegarkan deria anda dengan menonton filem yang serupa?
Kami tahu bahawa perkhidmatan OTT seperti Netflix telah meningkatkan sistem pengesyoran mereka dengan ketara. Sebagai pelajar pembelajaran mesin, anda perlu memahami cara algoritma tersebut menyasarkan pelanggan berdasarkan keutamaan dan ulasan mereka.
Set data IMDB pada Kaggle berkemungkinan salah satu yang paling lengkap, membolehkan model pengesyoran disimpulkan berdasarkan tajuk filem, penilaian pelanggan, genre dan faktor lain. Ia juga merupakan kaedah terbaik untuk mempelajari tentang Penapisan Berasaskan Kandungan dan Kejuruteraan Ciri.
7. Ramalan Kelayakan Muatan
Dunia berkisar tentang pinjaman. Sumber utama keuntungan bank adalah daripada faedah ke atas pinjaman. Oleh itu mereka adalah perniagaan asas mereka.
Individu atau kumpulan individu hanya boleh mengembangkan ekonomi dengan melaburkan wang dalam firma dengan harapan untuk melihat nilainya meningkat pada masa hadapan. Kadang-kadang penting untuk mendapatkan pinjaman untuk dapat mengambil risiko sifat ini dan juga mengambil bahagian dalam kesenangan duniawi tertentu.
Sebelum pinjaman boleh diterima, bank biasanya mempunyai proses yang agak ketat untuk diikuti. Memandangkan pinjaman adalah aspek yang sangat penting dalam kehidupan ramai orang, meramalkan kelayakan untuk pinjaman yang dipohon seseorang akan sangat bermanfaat, membolehkan perancangan yang lebih baik di luar pinjaman diterima atau ditolak.
8. Analisis Sentimen menggunakan Data Twitter
Terima kasih kepada rangkaian media sosial seperti Twitter, Facebook dan Reddit, mengekstrapolasi pendapat dan arah aliran telah menjadi agak mudah. Maklumat ini digunakan untuk menghapuskan pendapat tentang acara, orang, sukan dan topik lain. Inisiatif pembelajaran mesin berkaitan perlombongan pendapat sedang digunakan dalam pelbagai tetapan, termasuk kempen politik dan penilaian produk Amazon.
Projek ini akan kelihatan hebat dalam portfolio anda! Untuk pengesanan emosi dan analisis berasaskan aspek, teknik seperti mesin vektor sokongan, regresi dan algoritma klasifikasi boleh digunakan secara meluas (mencari fakta dan pendapat).
9. Ramalan Jualan Masa Depan
Perniagaan dan peniaga B2C yang besar ingin mengetahui jumlah jualan setiap produk dalam inventori mereka. Ramalan jualan membantu pemilik perniagaan dalam menentukan item mana yang mendapat permintaan tinggi. Ramalan jualan yang tepat akan mengurangkan pembaziran dengan ketara sambil turut menentukan kesan tambahan pada belanjawan masa hadapan.
Peruncit seperti Walmart, IKEA, Big Basket dan Big Bazaar menggunakan ramalan jualan untuk menganggarkan permintaan produk. Anda mesti biasa dengan pelbagai teknik pembersihan data mentah untuk membina projek ML tersebut. Juga, pemahaman yang baik tentang analisis regresi, terutamanya regresi linear mudah, diperlukan.
Untuk jenis tugasan ini, anda perlu menggunakan perpustakaan seperti Dora, Scrubadub, Pandas, NumPy dan lain-lain.
10. Pengesanan Berita Palsu
Ia merupakan satu lagi usaha pembelajaran mesin canggih yang ditujukan kepada pelajar sekolah. Berita palsu merebak seperti api, seperti yang kita semua tahu. Segala-galanya tersedia di media sosial, daripada menghubungkan individu hingga membaca berita harian.
Akibatnya, pengesanan berita palsu menjadi semakin sukar pada hari ini. Banyak rangkaian media sosial yang besar, seperti Facebook dan Twitter, sudah mempunyai algoritma untuk mengesan berita palsu dalam siaran dan suapan.
Untuk mengenal pasti berita palsu, projek ML jenis ini memerlukan pemahaman yang menyeluruh tentang pelbagai pendekatan NLP dan algoritma pengelasan (PassiveAggressiveClassifier atau Naive Bayes pengelas).
11. Ramalan Pembelian Kupon
Pelanggan semakin memikirkan pembelian dalam talian apabila coronavirus menyerang planet ini pada tahun 2020. Akibatnya, pertubuhan membeli-belah telah terpaksa mengalihkan perniagaan mereka dalam talian.
Pelanggan, sebaliknya, masih mencari tawaran hebat, sama seperti mereka berada di kedai, dan semakin memburu kupon yang sangat menjimatkan. Malah terdapat laman web khusus untuk membuat kupon untuk pelanggan tersebut. Anda boleh belajar tentang perlombongan data dalam pembelajaran mesin, menghasilkan graf bar, carta pai dan histogram untuk menggambarkan data dan kejuruteraan ciri dengan projek ini.
Untuk menjana ramalan, anda juga boleh melihat pendekatan imputasi data untuk mengurus nilai NA dan persamaan kosinus pembolehubah.
12. Ramalan Churn Pelanggan
Pengguna ialah aset syarikat yang paling penting, dan mengekalkannya adalah penting untuk mana-mana perniagaan yang bertujuan untuk meningkatkan hasil dan membina hubungan bermakna jangka panjang dengan mereka.
Tambahan pula, kos untuk mendapatkan pelanggan baharu adalah lima kali lebih tinggi daripada kos mengekalkan pelanggan sedia ada. Customer Churn/Attrition ialah masalah perniagaan yang terkenal di mana pelanggan atau pelanggan berhenti menjalankan perniagaan dengan perkhidmatan atau syarikat.
Mereka sepatutnya tidak lagi menjadi pelanggan yang membayar. Pelanggan disifatkan bergolak jika ia telah menjadi jumlah masa tertentu sejak pelanggan terakhir berinteraksi dengan syarikat itu. Mengenal pasti sama ada pelanggan akan bergolak, serta memberikan maklumat yang relevan dengan pantas bertujuan untuk pengekalan pelanggan, adalah penting untuk mengurangkan churn.
Otak kita tidak mampu menjangka perolehan pelanggan untuk berjuta-juta pelanggan; di sinilah pembelajaran mesin boleh membantu.
13. Ramalan Jualan Wallmart
Salah satu aplikasi pembelajaran mesin yang paling menonjol ialah ramalan jualan, yang melibatkan pengesanan ciri yang mempengaruhi jualan produk dan menjangkakan volum jualan masa hadapan.
Dataset Walmart, yang mengandungi data jualan dari 45 lokasi, digunakan dalam kajian pembelajaran mesin ini. Jualan setiap kedai, mengikut kategori, setiap minggu disertakan dalam set data. Tujuan projek pembelajaran mesin ini adalah untuk menjangkakan jualan bagi setiap jabatan di setiap cawangan supaya mereka boleh membuat keputusan pengoptimuman saluran dan perancangan inventori yang dipacu data yang lebih baik.
Bekerja dengan set data Walmart adalah sukar kerana ia mengandungi peristiwa penurunan harga terpilih yang mempunyai kesan ke atas jualan dan harus dipertimbangkan.
14. Analisis Data Uber
Apabila ia datang untuk melaksanakan dan menyepadukan pembelajaran mesin dan pembelajaran mendalam dalam apl mereka, perkhidmatan perkongsian perjalanan yang popular tidak ketinggalan. Setiap tahun, ia memproses berbilion perjalanan, membolehkan penumpang melakukan perjalanan pada bila-bila masa siang atau malam.
Oleh kerana ia mempunyai pangkalan pelanggan yang begitu besar, ia memerlukan perkhidmatan pelanggan yang luar biasa untuk menangani aduan pengguna secepat mungkin.
Uber mempunyai set data berjuta-juta pick-up yang boleh digunakan untuk menganalisis dan memaparkan perjalanan pelanggan untuk menemui cerapan dan meningkatkan pengalaman pelanggan.
15. Analisis Covid-19
COVID-19 telah melanda dunia hari ini, dan bukan hanya dalam erti kata pandemik. Walaupun pakar perubatan menumpukan pada menghasilkan vaksinasi yang berkesan dan mengimunkan dunia, saintis data tidak jauh ketinggalan.
Kes baharu, kiraan aktif harian, kematian dan statistik ujian semuanya didedahkan kepada umum. Ramalan dibuat setiap hari berdasarkan wabak SARS pada abad sebelumnya. Untuk ini, anda boleh menggunakan analisis regresi dan menyokong model ramalan berasaskan mesin vektor.
Kesimpulan
Sebagai ringkasan, kami telah membincangkan beberapa projek ML teratas yang akan membantu anda dalam menguji pengaturcaraan Pembelajaran Mesin serta memahami idea dan pelaksanaannya. Mengetahui cara mengintegrasikan Pembelajaran Mesin boleh membantu anda maju dalam profesion anda apabila teknologi mengambil alih dalam setiap industri.
Semasa mempelajari Pembelajaran Mesin, kami mengesyorkan agar anda mempraktikkan konsep anda dan menulis semua algoritma anda. Menulis algoritma semasa belajar adalah lebih penting daripada melaksanakan projek, dan ia juga memberi anda kelebihan dalam memahami subjek dengan betul.
Sila tinggalkan balasan anda