Ṣe o fẹ lati bẹrẹ pẹlu imudani ẹrọ?
Mo ti ṣẹda ikẹkọ ti o rọrun ati irọrun fun awọn olubere pipe. Papọ, a yoo lọ lori awọn igbesẹ ipilẹ ti ikẹkọ awoṣe ikẹkọ ẹrọ kan.
Lakoko ti o n ṣalaye awọn igbesẹ ti ikẹkọ awoṣe ni ọkọọkan, Emi yoo tun funni ni apẹẹrẹ ipilẹ pupọ ti iṣoro ikẹkọ ẹrọ bi daradara. Nitorinaa, ti o ba fẹ tẹle pẹlu, o le ṣe igbasilẹ eto data ayẹwo yii lati inu eyi asopọ.
Eyi jẹ apẹrẹ data ti o kan lati ṣe iranlọwọ fun ọ lati bẹrẹ pẹlu kikọ ẹrọ.
A ni awọn iye 18 ti awọn eniyan ti o yatọ si ọjọ-ori ati awọn akọ-abo ti o ni asọye orin ayanfẹ wọn. Nipa lilo, awọn ẹya ti "ọjọ ori" ati "abo" a yoo gbiyanju lati gboju le won iru orin ti o jẹ ayanfẹ wọn.
Akiyesi: 1 ati 0 ni a yàn si awọn akọ-abo bi obinrin ati akọ ninu akopọ data yii.
Sibẹsibẹ, ti o ko ba fẹ tẹle apẹẹrẹ, o tun dara daradara. Emi yoo ṣe alaye gbogbo awọn igbesẹ wọnyi ni awọn alaye. Nítorí náà, jẹ ki ká besomi ni!
Ohun akọkọ lati Mọ
Ṣaaju ki o to lọ sinu awọn igbesẹ ti ikẹkọ awoṣe, jẹ ki a ṣalaye diẹ ninu awọn aaye. Ẹkọ ẹrọ jẹ ẹya oye atọwọda ibawi ti o fojusi lori idagbasoke awọn algoridimu ti o le kọ ẹkọ lati data.
Lati ṣe eyi, awọn awoṣe ikẹkọ ẹrọ jẹ ikẹkọ lori dataset ti o kọ awoṣe bi o ṣe le ṣe awọn asọtẹlẹ to pe tabi awọn ipin lori alabapade, data aimọ tẹlẹ.
Nitorina, kini awọn awoṣe wọnyi? A awoṣe ẹkọ ẹrọ jẹ iru si ohunelo ti kọnputa nlo lati ṣe ipilẹṣẹ awọn asọtẹlẹ data tabi awọn yiyan.
Awoṣe, bii ohunelo kan, tẹle ilana ilana kan lati ṣe iṣiro data ati ṣe ipilẹṣẹ awọn asọtẹlẹ tabi awọn idajọ ti o da lori awọn ilana ti a rii ninu data naa. Awọn data diẹ sii ti awoṣe naa ti ni ikẹkọ lori, deede diẹ sii awọn asọtẹlẹ rẹ di.
Iru Awọn awoṣe A Le Kọni?
Jẹ ki a wo kini awọn awoṣe ikẹkọ ẹrọ ipilẹ.
- Ipadasẹyin Linear: awoṣe ti o ṣe asọtẹlẹ oniyipada ibi-afẹde lemọlemọfún lati ọkan tabi diẹ ẹ sii awọn oniyipada igbewọle.
- Awọn nẹtiwọki Neural: Nẹtiwọọki ti awọn apa asopọ ti o le kọ ẹkọ lati ṣawari awọn ilana idiju ninu data.
- Awọn igi Ipinnu: ọna ṣiṣe ipinnu ti a ṣe lori pq ti ẹka ti awọn alaye miiran.
- Iṣjọpọ: akojọpọ awọn awoṣe ti o ṣe akojọpọ awọn aaye data afiwera ti o da lori ibajọra.
- Ipadabọ Logistic: awoṣe fun awọn iṣoro ipinya alakomeji ninu eyiti oniyipada ibi-afẹde ni awọn iye agbara meji.
- Awọn igi Ipinnu: ọna ṣiṣe ipinnu ti a ṣe lori pq ti ẹka ti awọn alaye miiran.
- Igbo ID: awoṣe akojọpọ ti o ni ọpọlọpọ awọn igi ipinnu. Wọn nlo nigbagbogbo fun isọdi ati awọn ohun elo ipadasẹhin.
- Awọn aladugbo K-Nitosi: awoṣe ti o ṣe asọtẹlẹ oniyipada ibi-afẹde nipa lilo awọn aaye data k-sunmọ ni eto ikẹkọ.
Ti o da lori iṣoro wa ati ipilẹ data, a pinnu iru awoṣe ikẹkọ ẹrọ ti o baamu ipo wa julọ. Sibẹsibẹ, a yoo pada si eyi nigbamii. Bayi, jẹ ki a bẹrẹ ikẹkọ awoṣe wa. Mo nireti pe o ti gba lati ayelujara tẹlẹ iwe data ti o ba fẹ tẹle apẹẹrẹ wa.
Bakannaa, Mo ṣe iṣeduro nini Iwe Jupyter Jupyter fi sori ẹrọ lori ẹrọ agbegbe rẹ ati lilo rẹ fun awọn iṣẹ ikẹkọ ẹrọ rẹ.
1: Setumo awọn isoro
Ipele akọkọ ni ikẹkọ ẹrọ ikẹkọ awoṣe ti wa ni asọye oro lati wa ni re. Eyi pẹlu yiyan awọn oniyipada ti o fẹ lati sọtẹlẹ (ti a mọ si oniyipada ibi-afẹde) ati awọn oniyipada ti yoo ṣee lo lati ṣe ipilẹṣẹ awọn asọtẹlẹ wọnyẹn (ti a mọ si awọn ẹya tabi awọn asọtẹlẹ).
O yẹ ki o tun pinnu iru iṣoro ikẹkọ ẹrọ-ẹrọ ti o ngbiyanju lati koju (ipinsi, ipadasẹhin, iṣupọ, ati bẹbẹ lọ) ati iru data ti iwọ yoo nilo lati ṣajọ tabi gba lati kọ awoṣe rẹ.
Iru awoṣe ti o gba ni yoo pinnu nipasẹ iru iṣoro ikẹkọ ẹrọ ti o n pinnu lati yanju. Ipinsi, ipadasẹhin, ati ikojọpọ jẹ awọn ẹka akọkọ mẹta ti ẹrọ eko italaya. Nigbati o ba fẹ ṣe asọtẹlẹ oniyipada isori kan, gẹgẹbi boya imeeli jẹ àwúrúju tabi rara, o lo isọdi.
Nigbati o ba fẹ ṣe asọtẹlẹ oniyipada lemọlemọfún, bii idiyele ile kan, o lo ipadasẹhin. Iṣirojọpọ jẹ lilo lati ṣajọpọ awọn nkan data afiwera ti o da lori awọn ohun ti o wọpọ.
Ti a ba wo apẹẹrẹ wa; Ipenija wa ni lati pinnu aṣa orin ti eniyan fẹ lati akọ ati ọjọ-ori wọn. A yoo lo data ti eniyan 18 fun apẹẹrẹ yii ati alaye lori ọjọ ori wọn, akọ-abo, ati aṣa orin ayanfẹ wọn.
2. Mura awọn data
Lẹhin ti o ti ṣalaye iṣoro naa, iwọ yoo nilo lati ṣeto data fun ikẹkọ awoṣe. Eyi pẹlu ṣiṣe mimọ ati sisẹ data naa. Nitorina, ti a le rii daju wipe o wa ni a kika ti awọn ẹrọ eko alugoridimu le lo.
Eyi le pẹlu awọn iṣẹ ṣiṣe bii piparẹ awọn iye ti o padanu, yiyi data isori pada si data nọmba, ati iwọn tabi ṣe deede data lati rii daju pe gbogbo awọn abuda wa ni iwọn kanna.
Fun apẹẹrẹ, eyi ni bii o ṣe paarẹ awọn iye ti o padanu:
import pandas as pd
# Load the data into a pandas DataFrame
data = pd.read_csv('data.csv')
# Check for missing values
print(data.isnull().sum())
# Drop rows with missing values
data.dropna(inplace=True)
# Check that all missing values have been removed
print(data.isnull().sum())
Akọsilẹ kekere: Ninu laini o "import pandas as pd",
a gbe ile-ikawe Pandas wọle ati fi si orukọ inagijẹ “pd” lati jẹ ki o rọrun lati tọka awọn iṣẹ rẹ ati awọn nkan nigbamii ni koodu naa.
Pandas jẹ module ti a mọ daradara fun Python fun ifọwọyi data ati itupalẹ, ni pataki nigbati o ba n ṣiṣẹ pẹlu eto tabi data tabular.
Ninu apẹẹrẹ wa ti ipinnu awọn oriṣi orin. A yoo kọkọ gbe iwe-ipamọ wọle wọle. Mo ti lorukọ rẹ music.csv, sibẹsibẹ, o le lorukọ o bi o ba fẹ.
Lati ṣeto data naa fun ikẹkọ awoṣe ikẹkọ ẹrọ, a pin si awọn abuda (ọjọ ori ati abo) ati awọn ibi-afẹde (oriṣi orin).
A yoo tun pin data naa si 80:20 ikẹkọ ati awọn eto idanwo lati ṣe ayẹwo iṣẹ ṣiṣe ti awoṣe wa ati yago fun mimuju.
# Import necessary libraries
import pandas as pd
from sklearn.model_selection import train_test_split
# Load data from CSV file/code>
music_data = pd.read_csv('music.csv')
# Split data into features and target
X = music_data.drop(columns=['genre'])
y = music_data['genre']
# Split data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
3. Yan awoṣe ẹkọ ẹrọ.
Lẹhin ti o ti pese data naa, o gbọdọ yan awoṣe ikẹkọ ẹrọ ti o baamu si iṣẹ-ṣiṣe rẹ.
Awọn algoridimu pupọ lo wa lati mu lati, gẹgẹbi awọn igi ipinnu, ipadasẹhin logistic, awọn ẹrọ fekito atilẹyin, awọn nẹtiwọọki nkankikan, ati awọn miiran. Algoridimu ti o yan yoo jẹ ipinnu nipasẹ iru ọran ti o ngbiyanju lati dahun, iru data ti o ni, ati awọn iwulo iṣẹ ṣiṣe rẹ.
A yoo lo olupilẹṣẹ igi ipinnu fun apẹẹrẹ yii nitori pe a n ṣiṣẹ pẹlu iṣoro isọdi (awọn asọtẹlẹ isọri data).
# Import necessary libraries
from sklearn.tree import DecisionTreeClassifier
Eyi ni iwoye ti bii Ipinnu Igi Ipinu n ṣiṣẹ:
4. Irin awoṣe
O le bẹrẹ ikẹkọ awoṣe nigba ti o ti yan algorithm ti ẹkọ ẹrọ itẹwọgba. Eyi pẹlu lilo data ti ipilẹṣẹ tẹlẹ lati kọ ẹkọ algoridimu lori bii o ṣe le ṣe awọn asọtẹlẹ lori tuntun, data ti a ko rii tẹlẹ.
Algoridimu yoo ṣe atunṣe awọn aye inu inu rẹ lakoko ikẹkọ lati dinku iyatọ laarin awọn iye asọtẹlẹ rẹ ati awọn iye gangan ninu data ikẹkọ. Iwọn data ti a lo fun ikẹkọ, bakanna bi awọn ayeraye kan pato ti algorithm, gbogbo wọn le ni ipa lori deede ti awoṣe abajade.
Ninu apẹẹrẹ wa pato, ni bayi ti a ti pinnu lori ọna kan, a le ṣe ikẹkọ awoṣe wa pẹlu data ikẹkọ.
# Train the decision tree classifier
model = DecisionTreeClassifier()
model.fit(X_train, y_train)
5. Ṣe ayẹwo awoṣe
Lẹhin ti awoṣe ti ni ikẹkọ, o gbọdọ ṣe ayẹwo lori data tuntun lati rii daju pe o jẹ deede ati igbẹkẹle. Eyi pẹlu idanwo awoṣe pẹlu data ti a ko lo lakoko ikẹkọ ati ifiwera awọn iye akanṣe rẹ si awọn iye gangan ninu data idanwo naa.
Atunwo yii le ṣe iranlọwọ ni idamo awọn abawọn awoṣe eyikeyi, gẹgẹbi fifin tabi aibikita, ati pe o le ja si eyikeyi atunṣe-itanran ti o le nilo.
Lilo data idanwo, a yoo ṣe ayẹwo deede ti awoṣe wa.
# Import necessary libraries
from sklearn.metrics import accuracy_score
# Predict the music genre for the test data
predictions = model.predict(X_test)
# Evaluate the model's accuracy
accuracy = accuracy_score(y_test, predictions)
print("Accuracy: ", accuracy)
Dimegilio deede ko buru bẹ fun bayi. 🙂 Lati ṣe ilọsiwaju Dimegilio deede rẹ, o le nu data nigbagbogbo diẹ sii tabi gbiyanju awọn awoṣe ikẹkọ ẹrọ oriṣiriṣi lati rii iru eyi ti o funni ni Dimegilio ti o ga julọ.
6. Fine-tune awoṣe
Ti imunadoko awoṣe ko ba to, o le ṣe atunṣe daradara nipa yiyipada ọpọlọpọ awọn paramita algorithm tabi nipa ṣiṣe idanwo pẹlu awọn algoridimu tuntun patapata.
Ilana yii le pẹlu ṣiṣe idanwo pẹlu awọn oṣuwọn ikẹkọ miiran, iyipada awọn eto isọdọtun, tabi yiyipada nọmba tabi iwọn awọn fẹlẹfẹlẹ ti o farapamọ ni nẹtiwọọki nkankikan.
7. Lo awoṣe
Ni kete ti o ba ni itẹlọrun pẹlu iṣẹ awoṣe, o le bẹrẹ lilo rẹ lati ṣe agbekalẹ awọn asọtẹlẹ lori data tuntun.
Eyi le fa kikọ sii data tuntun sinu awoṣe ati lilo awọn aye ẹkọ awoṣe lati ṣe agbekalẹ awọn asọtẹlẹ lori data yẹn, tabi ṣepọ awoṣe sinu ohun elo tabi eto to gbooro.
A le lo awoṣe wa lati ṣe agbekalẹ awọn asọtẹlẹ lori data tuntun lẹhin ti a ni itẹlọrun pẹlu deede rẹ. O le gbiyanju orisirisi awọn iye ti iwa ati ọjọ ori.
# Test the model with new data
new_data = [[25, 1], [30, 0]]
predictions = model.predict(new_data)
print("Predictions: ", predictions)
Pale mo
A ti pari ikẹkọ awoṣe ikẹkọ ẹrọ akọkọ wa.
Mo nireti pe o ti rii pe o wulo. O le gbiyanju bayi ni lilo awọn awoṣe ikẹkọ ẹrọ oriṣiriṣi bii Ipadasẹyin Linear tabi Igbo ID.
Ọpọlọpọ awọn ipilẹ data ati awọn italaya wa ninu Kaggle ti o ba fẹ lati ni ilọsiwaju ifaminsi rẹ ati oye ti ẹkọ ẹrọ.
Fi a Reply