Karena semakin banyak industri menggunakan kekuatan algoritme untuk mengotomatiskan operasi dan membuat pilihan, pembelajaran mesin menjadi komponen penting tentang cara dunia kontemporer beroperasi.
Masalah bias dalam pembelajaran mesin sangat penting untuk diperhitungkan ketika model pembelajaran mesin diintegrasikan ke dalam berbagai proses pengambilan keputusan organisasi.
Untuk menjamin bahwa pilihan yang dihasilkan oleh algoritme tidak memihak dan tanpa bias harus menjadi tujuan organisasi mana pun yang menggunakan model pembelajaran mesin. Untuk memastikan bahwa keluaran model dapat diandalkan dan dipandang adil, sangat penting untuk mengenali dan menangani Mesin belajar bias.
Ini terkait dengan pertanyaan tentang keterjelasan model, atau seberapa mudah seseorang memahami bagaimana model pembelajaran mesin sampai pada suatu kesimpulan. Tren dan pola yang dipetakan dan dipelajari oleh model pembelajaran mesin berasal dari data itu sendiri, bukan melalui pengembangan manusia secara langsung.
Bias dalam pembelajaran mesin dapat muncul karena berbagai alasan jika tidak dikontrol dan diperiksa. Ketika sebuah model di-deploy, ia sering menghadapi situasi yang tidak secara tepat direfleksikan dalam sampel data pelatihan.
Modelnya mungkin terlalu pas untuk kumpulan data pelatihan yang tidak representatif ini. Terlepas dari kualitas data pelatihan yang sangat baik, model tersebut mungkin masih terpengaruh oleh bias historis yang dihasilkan dari pengaruh budaya yang lebih luas.
Setelah diterapkan, model bias dapat mendukung kelompok tertentu atau kehilangan akurasi dengan himpunan bagian data tertentu. Hal ini dapat mengakibatkan penilaian yang tidak adil menghukum sekelompok individu tertentu, yang dapat memiliki efek negatif pada dunia nyata.
Artikel ini membahas bias pembelajaran mesin, termasuk apa itu, cara mengenalinya, bahaya yang ditimbulkannya, dan banyak lagi.
Jadi, Apa itu Bias Pembelajaran Mesin?
Sebuah algoritma yang menghasilkan output yang bias secara sistematis sebagai akibat dari asumsi yang salah yang dibuat selama proses pembelajaran mesin dikenal sebagai bias pembelajaran mesin, juga dikenal sebagai bias algoritma atau dikenal sebagai bias AI.
Bias pembelajaran mesin adalah kecenderungan model untuk mendukung kumpulan data atau subset data tertentu; hal ini sering disebabkan oleh kumpulan data pelatihan yang tidak representatif. Dengan kumpulan data tertentu, model yang bias akan berkinerja buruk, yang akan merusak akurasinya.
Dalam pengaturan dunia nyata, ini dapat menyiratkan bahwa data pelatihan yang bias menghasilkan keluaran model yang mendukung ras, demografi, atau jenis kelamin tertentu.
Akibatnya, hasil pembelajaran mesin bisa tidak adil atau diskriminatif. Pelatihan non-perwakilan kumpulan data dapat berkontribusi pada bias dalam pembelajaran mesin.
Model yang dihasilkan dapat menjadi bias terhadap kategori lain yang kurang terwakili jika data pelatihan kurang atau terlalu mewakili pengelompokan data tertentu. Hal ini dapat terjadi jika sampel data pelatihan tidak sama persis dengan lingkungan penerapan dunia nyata.
Pembelajaran mesin di industri perawatan kesehatan, yang dapat digunakan untuk memeriksa data pasien terhadap penyakit atau penyakit yang diketahui, adalah contoh utama. Model dapat mempercepat intervensi praktisi medis ketika digunakan dengan tepat.
Namun, prasangka adalah mungkin. Ketika diminta untuk memprediksi kemungkinan penyakit pada pasien yang lebih tua, model tidak dapat bekerja dengan baik jika data pelatihan yang digunakan untuk menyusunnya sebagian besar terdiri dari data pasien dari rentang usia yang lebih kecil.
Selain itu, statistik historis dapat miring. Misalnya, karena secara historis, mayoritas karyawan adalah laki-laki, model yang dilatih untuk menyaring kandidat pekerjaan akan lebih menyukai pelamar laki-laki.
Bias pembelajaran mesin akan memengaruhi keakuratan model di kedua skenario, dan dalam keadaan terburuk, bahkan dapat menghasilkan kesimpulan yang diskriminatif dan tidak adil.
Keputusan harus ditinjau dengan hati-hati untuk memastikan tidak ada bias karena model pembelajaran mesin mengganti lebih banyak dan lebih banyak operasi manual. Akibatnya, praktik tata kelola model di organisasi mana pun harus mencakup pemantauan untuk bias pembelajaran mesin.
Banyak jenis pekerjaan yang berbeda di banyak industri yang berbeda sedang diselesaikan oleh model pembelajaran mesin. Saat ini, model digunakan untuk mengotomatisasi proses yang semakin sulit dan menghasilkan saran. Dalam proses pengambilan keputusan ini, bias berarti bahwa suatu model dapat mendukung satu kelompok tertentu di atas kelompok lain berdasarkan bias yang dipelajari.
Ketika digunakan untuk membuat penilaian yang tidak aman dengan konsekuensi yang sebenarnya, ini dapat memiliki dampak yang parah. Ketika digunakan untuk menyetujui aplikasi pinjaman secara otomatis, misalnya, model yang bias dapat merugikan populasi tertentu. Dalam bisnis yang diatur di mana tindakan apa pun dapat diperiksa atau diteliti, ini adalah faktor yang sangat penting untuk diperhitungkan.
Jenis Bias Pembelajaran Mesin
- Bias Algoritma – Ini terjadi ketika ada bug dalam algoritme yang melakukan penghitungan yang mendorong komputasi pembelajaran mesin.
- Contoh Bias – Ketika data digunakan untuk melatih pembelajaran mesin model memiliki masalah, hal ini terjadi. Dalam kasus bias semacam ini, jumlah atau kualitas data yang digunakan untuk melatih sistem tidak mencukupi. Algoritme akan dilatih untuk meyakini bahwa semua guru adalah perempuan jika, misalnya, data pelatihan seluruhnya terdiri dari guru perempuan.
- Bias pengecualian – Ini terjadi ketika titik data penting tidak ada dari kumpulan data yang digunakan, yang mungkin terjadi jika pemodel gagal menyadari pentingnya titik data yang hilang.
- Bias prasangka – Dalam hal ini, pembelajaran mesin itu sendiri bias karena data yang digunakan untuk melatih sistem mencerminkan bias dunia nyata seperti prasangka, stereotip, dan asumsi sosial yang salah. Misalnya, jika data tentang profesional medis dimasukkan ke dalam sistem komputer yang hanya mencakup dokter pria dan perawat wanita, stereotip gender dunia nyata tentang petugas kesehatan akan diabadikan.
- Bias Pengukuran – Seperti namanya, bias ini dihasilkan dari masalah mendasar dengan kualitas data dan metode yang digunakan untuk mengumpulkan atau mengevaluasinya. Sistem yang dilatih untuk menilai bobot secara tepat akan menjadi bias jika bobot yang terkandung dalam data pelatihan dibulatkan secara konsisten, dan menggunakan gambar karyawan yang puas untuk melatih sistem yang dimaksudkan untuk menilai lingkungan tempat kerja dapat menjadi bias jika karyawan dalam gambar mengetahui mereka sedang diukur untuk kebahagiaan.
Faktor apa yang berkontribusi terhadap bias dalam pembelajaran mesin?
Meskipun ada banyak alasan untuk bias pembelajaran mesin, sering kali muncul dari bias dalam data pelatihan itu sendiri. Ada beberapa penyebab potensial yang mendasari bias dalam data pelatihan.
Ilustrasi yang paling jelas adalah data pelatihan, yang merupakan subset dari kondisi yang terlihat dalam sistem yang disebarkan yang tidak khas. Ini mungkin data pelatihan dengan representasi yang kurang dari satu kategori atau kuantitas yang tidak proporsional dari yang lain.
Ini dikenal sebagai bias sampel, dan dapat dihasilkan dari pengumpulan data pelatihan non-acak. Metode yang digunakan untuk mengumpulkan, menganalisis, atau mengklasifikasikan data, serta akar historis data, semuanya dapat menyebabkan bias pada data itu sendiri.
Informasi tersebut bahkan mungkin bias secara historis dalam budaya yang lebih besar di mana informasi itu dikumpulkan.
Bias pembelajaran mesin sebagian besar disebabkan oleh:
- Bias yang disebabkan oleh manusia atau masyarakat dalam data historis digunakan untuk melatih algoritma.
- Data pelatihan yang tidak mencerminkan keadaan dunia nyata.
- Bias saat memberi label atau menyiapkan data untuk machine learning yang diawasi.
Misalnya, kurangnya keragaman dalam data pelatihan dapat menyebabkan bias representasi. Keakuratan model pembelajaran mesin sering dipengaruhi oleh bias historis dalam budaya yang lebih luas.
Ini kadang-kadang disebut sebagai bias sosial atau manusia. Menemukan kumpulan besar data yang tidak rentan terhadap bias sosial dapat menjadi tantangan. Tahap pemrosesan data dari siklus hidup pembelajaran mesin sama-sama rentan terhadap bias manusia.
Data yang telah diberi label dan diproses oleh ilmuwan data atau pakar lainnya diperlukan untuk pembelajaran mesin yang diawasi. Apakah itu berasal dari berbagai data yang dibersihkan, cara titik data diberi label, atau pilihan fitur, bias dalam proses pelabelan ini dapat menyebabkan bias dalam pembelajaran mesin.
Risiko Bias Pembelajaran Mesin
Karena model adalah alat pengambilan keputusan berbasis data, diasumsikan bahwa model memberikan penilaian yang tidak memihak. Model pembelajaran mesin sering kali mengandung bias, yang dapat memengaruhi hasil.
Semakin banyak industri yang menerapkan pembelajaran mesin menggantikan perangkat lunak dan prosedur yang sudah ketinggalan zaman. Model bias dapat memiliki efek negatif di dunia nyata ketika pekerjaan yang lebih rumit diotomatisasi menggunakan model.
Pembelajaran mesin tidak berbeda dengan proses pengambilan keputusan lainnya di mana organisasi dan individu mengharapkannya transparan dan adil. Karena pembelajaran mesin adalah proses otomatis, penilaian yang dibuat dengan menggunakannya kadang-kadang bahkan diperiksa lebih dekat.
Sangat penting bagi organisasi untuk proaktif dalam mengatasi bahaya karena bias dalam pembelajaran mesin sering kali dapat memiliki efek diskriminatif atau negatif pada beberapa populasi. Untuk konteks yang diatur, khususnya, kemungkinan bias dalam pembelajaran mesin harus diperhitungkan.
Misalnya, pembelajaran mesin di perbankan dapat digunakan untuk secara otomatis menerima atau menolak pemohon hipotek setelah penyaringan awal. Sebuah model yang bias terhadap sekelompok kandidat tertentu mungkin memiliki efek merugikan baik pada kandidat maupun organisasi.
Bias apa pun yang ditemukan di lingkungan penerapan di mana tindakan dapat diteliti dapat menyebabkan masalah besar. Model itu mungkin tidak berfungsi dan, dalam skenario terburuk, bahkan mungkin menjadi diskriminatif dengan sengaja.
Bias harus dievaluasi dan dipersiapkan dengan hati-hati karena dapat mengakibatkan model dihapus sepenuhnya dari penerapan. Mendapatkan kepercayaan diri dalam keputusan model memerlukan pemahaman dan penanganan bias pembelajaran mesin.
Tingkat kepercayaan di dalam organisasi dan di antara konsumen layanan eksternal dapat dipengaruhi oleh bias yang dirasakan dalam pengambilan keputusan model. Jika model tidak dipercaya, terutama saat memandu pilihan berisiko tinggi, model tersebut tidak akan digunakan secara maksimal di dalam organisasi.
Saat mengevaluasi keterjelasan model, akuntansi untuk bias harus menjadi faktor yang harus diperhitungkan. Validitas dan keakuratan pilihan model dapat sangat dipengaruhi oleh bias pembelajaran mesin yang tidak terkendali.
Kadang-kadang dapat mengakibatkan tindakan diskriminatif yang dapat mempengaruhi orang atau kelompok tertentu. Ada banyak aplikasi untuk berbagai jenis model pembelajaran mesin, dan masing-masing rentan terhadap bias pembelajaran mesin sampai batas tertentu.
Bias pembelajaran mesin diilustrasikan oleh:
- Karena tidak adanya variasi dalam data pelatihan, algoritma pengenalan wajah dapat menjadi kurang akurat untuk beberapa kelompok ras.
- Program ini dapat mendeteksi bias rasial dan gender dalam data karena prasangka manusia atau sejarah.
- Dengan dialek atau aksen tertentu, pemrosesan bahasa alami bisa lebih akurat, dan mungkin tidak dapat memproses aksen yang kurang terwakili dalam data pelatihan.
Memecahkan Bias dalam Pembelajaran Mesin
Memantau dan melatih kembali model ketika bias ditemukan adalah dua cara untuk mengatasi bias pembelajaran mesin. Dalam kebanyakan kasus, bias model merupakan indikasi bias dalam data pelatihan, atau setidaknya bias dapat dikaitkan dengan tahap pelatihan siklus hidup machine learning.
Setiap tahap siklus hidup model harus memiliki prosedur untuk menangkap bias atau penyimpangan model. Proses untuk memantau pembelajaran mesin setelah penerapan juga disertakan. Penting untuk sering memeriksa model dan kumpulan data untuk bias.
Ini mungkin melibatkan pemeriksaan set data pelatihan untuk melihat bagaimana grup didistribusikan dan direpresentasikan di sana. Dimungkinkan untuk memodifikasi dan/atau meningkatkan kumpulan data yang tidak sepenuhnya representatif.
Selain itu, bias harus dipertimbangkan saat menilai kinerja model. Menguji kinerja model pada subset data yang berbeda dapat menunjukkan apakah model tersebut bias atau kelebihan dalam kaitannya dengan kelompok tertentu.
Dimungkinkan untuk mengevaluasi kinerja model pembelajaran mesin pada himpunan bagian data tertentu dengan menggunakan teknik validasi silang. Prosedur ini melibatkan pembagian data ke dalam kumpulan data pelatihan dan pengujian yang berbeda.
Anda dapat menghilangkan bias dalam pembelajaran mesin dengan:
- Bila perlu, latih ulang model menggunakan set pelatihan yang lebih besar dan lebih representatif.
- Menetapkan prosedur untuk secara proaktif mencari hasil yang bias dan penilaian yang tidak biasa.
- Membobot ulang fitur dan menyesuaikan hyperparameter seperlunya dapat membantu memperhitungkan bias.
- Mendorong resolusi bias yang ditemukan melalui siklus deteksi dan optimasi yang berkelanjutan.
Kesimpulan
Sangat menggoda untuk percaya bahwa setelah dilatih, model pembelajaran mesin akan berfungsi secara mandiri. Faktanya, lingkungan operasional model selalu berubah, dan manajer harus melatih kembali model menggunakan kumpulan data baru secara teratur.
Pembelajaran mesin saat ini merupakan salah satu kemampuan teknologi paling menarik dengan manfaat ekonomi dunia nyata. Pembelajaran mesin, ketika dipasangkan dengan teknologi data besar dan kekuatan komputasi besar yang tersedia melalui cloud publik, memiliki potensi untuk mengubah cara individu berinteraksi dengan teknologi, dan mungkin seluruh industri.
Namun, sama menjanjikannya dengan teknologi pembelajaran mesin, itu harus direncanakan dengan hati-hati untuk menghindari bias yang tidak disengaja. Efektivitas penilaian yang dibuat oleh mesin dapat sangat dipengaruhi oleh bias, yang merupakan sesuatu yang harus diperhitungkan oleh pengembang model pembelajaran mesin.
Tinggalkan Balasan