Ar mhaith leat tosú leis foghlaim meaisín?
Tá rang teagaisc simplí agus éasca cruthaithe agam do thosaitheoirí iomlána. Le chéile, rachaidh muid thar na céimeanna bunúsacha a bhaineann le hoiliúint a chur ar mhúnla meaisínfhoghlama.
Agus mé ag míniú na gcéimeanna a bhaineann le hoiliúint a chur ar mhúnla ceann ar cheann, tabharfaidh mé sampla an-bhunúsach d'fhadhb meaisínfhoghlama freisin. Mar sin, más mian leat leanúint ar aghaidh, is féidir leat an tacar sonraí samplach seo a íoslódáil uaidh seo nasc.
Níl anseo ach tacar sonraí samplach chun cabhrú leat tosú leis an meaisínfhoghlaim.
Tá 18 luach againn maidir le daoine d’aoiseanna agus d’inscne éagsúla a bhfuil an ceol is fearr leo sainithe. Trí úsáid a bhaint as na gnéithe “aois” agus “inscne” déanfaimid iarracht buille faoi thuairim a dhéanamh ar an seánra ceoil is fearr leo.
Nóta: Sanntar 1 agus 0 d’inscne mar baineann agus fireann sa tacar sonraí seo.
Mar sin féin, mura bhfuil tú ag iarraidh an sampla a leanúint, tá sé breá breá freisin. Beidh mé ag míniú na céimeanna seo go léir go mion. Mar sin, déanaimis tumadh isteach!
Na Chéad Rudaí ar Eolas
Sula dtéann tú isteach i gcéimeanna oiliúna múnla, déanaimis soiléiriú ar roinnt pointí. Tá foghlaim meaisín ina hintleachta saorga smacht a dhíríonn ar algartaim a fhorbairt ar féidir leo foghlaim ó shonraí.
Chun seo a dhéanamh, cuirtear oiliúint ar mhúnlaí meaisínfhoghlama ar thacar sonraí a mhúineann don mhúnla conas tuartha cearta a dhéanamh nó aicmithe ar shonraí úra nach raibh ar eolas cheana.
Mar sin, cad iad na samhlacha seo? A samhail foghlama meaisín cosúil le hoideas a úsáideann ríomhaire chun tuar sonraí nó roghanna a ghiniúint.
Leanann samhail, cosúil le hoideas, sraith treoracha chun sonraí a mheas agus chun tuartha nó breithiúnais a ghiniúint bunaithe ar phatrúin a aimsítear sna sonraí. Dá mhéad sonraí a chuirtear oiliúint ar an tsamhail is amhlaidh is cruinne a bheidh a thuar.
Cén Cineál Múnlaí Is Féidir Linn a Thraenáil?
Feicfimid cad iad na samhlacha bunúsacha meaisínfhoghlama.
- Aischéimniú Líneach: múnla a thuar athróg leanúnach sprice ó athróg ionchuir amháin nó níos mó.
- Líonraí Néaracha: líonra de nóid nasctha atá in ann foghlaim conas patrúin casta i sonraí a bhrath.
- Crainn Cinnidh: cur chuige cinnteoireachta bunaithe ar shlabhra ráiteas branchánach más rud é-eile.
- Cnuasú: tacar samhlacha a ghrúpálann pointí sonraí inchomparáide bunaithe ar chosúlacht.
- Aischéimniú Lóistíochta: samhail d'fhadhbanna aicmithe dénártha ina bhfuil dhá luach féideartha ag an sprioc-athróg.
- Crainn Cinnidh: cur chuige cinnteoireachta bunaithe ar shlabhra ráiteas branchánach más rud é-eile.
- Random Forest: samhail ensemble comhdhéanta de go leor crann cinnteoireachta. Is minic a úsáidtear iad le haghaidh feidhmeanna aicmithe agus aischéimnithe.
- K-Na Comharsana is cóngaraí: múnla a thuar an sprioc-athróg ag baint úsáide as na k-pointí sonraí is gaire sa tacar oiliúna.
Ag brath ar ár bhfadhb agus ar ár dtacar sonraí, socraímid cén samhail meaisínfhoghlama is mó a oireann dár gcás. Mar sin féin, tiocfaimid ar ais chuige seo níos déanaí. Anois, a ligean ar tús a oiliúint ár múnla. Tá súil agam go bhfuil tú íoslódáilte cheana féin an tacar sonraí más mian leat ár sampla a leanúint.
Chomh maith leis sin, molaim go bhfuil Leabhar Nótaí Iúpatar suiteáilte ar do mheaisín áitiúil agus é a úsáid le haghaidh do thionscadail meaisínfhoghlama.
1: Sainmhínigh an fhadhb
An chéad chéim i oiliúint meaisín foghlama Tá an tsamhail ag sainmhíniú na saincheiste atá le réiteach. Is éard atá i gceist leis seo ná na hathróga is mian leat a thuar a roghnú (ar a dtugtar an sprioc-athróg) agus na hathróga a úsáidfear chun na tuartha sin a ghiniúint (ar a dtugtar gnéithe nó réamhaisnéiseoirí).
Ba cheart duit cinneadh a dhéanamh freisin ar an gcineál fadhb foghlama meaisín a bhfuil tú ag iarraidh aghaidh a thabhairt uirthi (aicmiú, aischéimniú, cnuasach, agus mar sin de) agus cén cineál sonraí a bheidh uait le bailiú nó le fáil chun do mhúnla a thraenáil.
Is de réir an chineáil faidhbe meaisínfhoghlama a bhfuil sé d’aidhm agat réiteach a fháil ar an saghas eiseamláir a fhostóidh tú. Is iad aicmiú, aischéimniú, agus cnuasú na trí phríomhchatagóir de dúshláin mheaisínfhoghlama. Nuair is mian leat athróg chatagóireach a thuar, mar shampla an turscar é ríomhphost nó nach ea, úsáideann tú rangú.
Nuair is mian leat athróg leanúnach a thuar, cosúil le praghas tí, úsáideann tú aischéimniú. Úsáidtear braisliú chun míreanna sonraí inchomparáide a chur le chéile bunaithe ar a gcomhchosúlachtaí.
Má fhéachaimid ar ár sampla; Is é an dúshlán atá romhainn ná an stíl cheoil is fearr le duine a chinneadh óna inscne agus óna aois. Bainfimid úsáid as tacar sonraí de 18 duine don sampla seo agus faisnéis maidir lena n-aois, inscne agus an stíl cheoil is fearr leo.
2. Ullmhaigh na sonraí
Tar éis duit an fhadhb a shonrú, beidh ort na sonraí a ullmhú chun an tsamhail a oiliúint. Is éard atá i gceist leis seo na sonraí a ghlanadh agus a phróiseáil. Mar sin, gur féidir linn a chinntiú gur i bhformáid a bheidh an algartam foghlama meaisín féidir a úsáid.
D’fhéadfadh go n-áireofaí leis seo gníomhaíochtaí ar nós luachanna atá in easnamh a scriosadh, sonraí catagóiriúla a chlaochlú go sonraí uimhriúla, agus scálú nó normalú na sonraí chun a chinntiú go bhfuil na saintréithe go léir ar an scála céanna.
Mar shampla, seo mar a scriosann tú na luachanna atá in easnamh:
import pandas as pd
# Load the data into a pandas DataFrame
data = pd.read_csv('data.csv')
# Check for missing values
print(data.isnull().sum())
# Drop rows with missing values
data.dropna(inplace=True)
# Check that all missing values have been removed
print(data.isnull().sum())
Nóta beag: Sa líne o “import pandas as pd",
allmhairímid leabharlann na bPandas agus sannaimid an ailias “pd” di chun é a dhéanamh níos éasca tagairt a dhéanamh dá feidhmeanna agus cuspóirí níos déanaí sa chód.
Is modúl aitheanta Python é Pandas le haghaidh ionramhála agus anailíse sonraí, go háirithe agus iad ag obair le sonraí struchtúrtha nó tábla.
Inár sampla de seánraí ceoil a chinneadh. Déanfaimid an tacar sonraí a iompórtáil ar dtús. D'ainmnigh mé music.csv é, ach is féidir leat é a ainmniú mar is mian leat.
Chun na sonraí a ullmhú le haghaidh samhail meaisínfhoghlama a oiliúint, roinneamar é ina thréithe (aois agus inscne) agus cuspóirí (seánra ceoil).
Ina theannta sin roinnfimid na sonraí i dtacair oiliúna agus tástála 80:20 chun feidhmíocht ár múnla a mheas agus rófheisteas a sheachaint.
# Import necessary libraries
import pandas as pd
from sklearn.model_selection import train_test_split
# Load data from CSV file/code>
music_data = pd.read_csv('music.csv')
# Split data into features and target
X = music_data.drop(columns=['genre'])
y = music_data['genre']
# Split data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
3. Roghnaigh múnla meaisínfhoghlama.
Tar éis duit na sonraí a ullmhú, ní mór duit múnla meaisínfhoghlama a roghnú a oireann do do thasc.
Tá roinnt halgartaim le roghnú astu, mar shampla crainn chinnidh, aischéimniú lóistíochta, meaisíní veicteora tacaíochta, líonraí néaracha, agus cinn eile. Cinnfidh an t-algartam a roghnaíonn tú an cineál saincheiste a bhfuil tú ag iarraidh a fhreagairt, an cineál sonraí atá agat, agus na riachtanais feidhmíochta atá agat.
Úsáidfimid aicmitheoir crann cinntí don sampla seo toisc go bhfuilimid ag obair le fadhb aicmithe (sonraí catagóiriúla a thuar).
# Import necessary libraries
from sklearn.tree import DecisionTreeClassifier
Seo léirshamhlú ar conas a oibríonn an Aicmitheoir Crann Cinnidh:
4. Déan an múnla a oiliúint
Féadfaidh tú tosú ar an tsamhail a thraenáil nuair a bheidh algartam meaisínfhoghlama inghlactha roghnaithe agat. Is éard atá i gceist leis seo úsáid a bhaint as na sonraí a gineadh roimhe seo chun oideachas a chur ar an algartam maidir le conas tuar a dhéanamh ar shonraí úra nach bhfacthas cheana.
Déanfaidh an t-algartam a pharaiméadair inmheánacha a mhodhnú le linn na hoiliúna chun an difríocht idir a luachanna tuartha agus na luachanna iarbhír sna sonraí oiliúna a íoslaghdú. Is féidir le cainníocht na sonraí a úsáidtear le haghaidh oiliúna, chomh maith le paraiméadair shonracha an algartam, tionchar a bheith acu ar chruinneas na samhla dá bharr.
Inár sampla sonrach, anois go bhfuil modh socraithe againn, is féidir linn ár múnla a oiliúint leis na sonraí oiliúna.
# Train the decision tree classifier
model = DecisionTreeClassifier()
model.fit(X_train, y_train)
5. Déan an tsamhail a mheas
Tar éis don mhúnla a bheith oilte, ní mór é a mheas ar shonraí nua chun a chinntiú go bhfuil sé cruinn agus iontaofa. Is éard atá i gceist leis sin an tsamhail a thástáil le sonraí nár úsáideadh le linn na hoiliúna agus a luachanna réamh-mheasta a chur i gcomparáid leis na luachanna iarbhír sna sonraí tástála.
Is féidir leis an athbhreithniú seo cabhrú le haon lochtanna sa tsamhail a aithint, mar rófheisteas nó gannfheistiú, agus d’fhéadfadh aon mhionchoigeartú a bheith ag teastáil mar thoradh air.
Agus na sonraí tástála á n-úsáid againn, déanfaimid measúnú ar chruinneas ár múnla.
# Import necessary libraries
from sklearn.metrics import accuracy_score
# Predict the music genre for the test data
predictions = model.predict(X_test)
# Evaluate the model's accuracy
accuracy = accuracy_score(y_test, predictions)
print("Accuracy: ", accuracy)
Níl an scór cruinnis chomh dona faoi láthair. 🙂 Chun do scór cruinnis a fheabhsú, is féidir leat na sonraí a ghlanadh níos mó i gcónaí nó triail a bhaint as múnlaí éagsúla meaisínfhoghlama féachaint cé acu ceann a thugann an scór is airde.
6. Déan an tsamhail a mhionchoigeartú
Mura leor éifeachtacht an mhúnla, is féidir leat é a mhionchoigeartú trí pharaiméadair algartam éagsúla a athrú nó trí halgartaim nua a thástáil go hiomlán.
D’fhéadfadh go n-áireofaí leis an nós imeachta seo triail a bhaint as rátaí foghlama malartacha, socruithe rialtachta a mhodhnú, nó líon nó méid na sraitheanna folaithe i líonra néarúil a athrú.
7. Bain úsáid as an múnla
Nuair a bheidh tú sásta le feidhmíocht an mhúnla, is féidir leat é a úsáid chun tuartha a ghiniúint ar shonraí nua.
D’fhéadfadh go mbeadh i gceist leis sin sonraí úra a thabhairt isteach sa mhúnla agus úsáid a bhaint as paraiméadair fhoghlamtha na samhla chun tuartha a dhéanamh ar na sonraí sin, nó an tsamhail a chomhtháthú i bhfeidhmchlár nó i gcóras níos leithne.
Is féidir linn ár múnla a úsáid chun tuar a dhéanamh ar shonraí nua tar éis dúinn a bheith sásta lena cruinneas. Is féidir leat triail a bhaint as luachanna difriúla inscne agus aoise.
# Test the model with new data
new_data = [[25, 1], [30, 0]]
predictions = model.predict(new_data)
print("Predictions: ", predictions)
Clóscríobh
Tá ár gcéad mhúnla meaisínfhoghlama críochnaithe againn.
Tá súil agam go raibh sé úsáideach duit. Is féidir leat triail a bhaint as samhlacha meaisínfhoghlama difriúla anois mar aischéimniú Líneach nó Foraoise Randamach.
Tá go leor tacair sonraí agus dúshláin i Kaggle más mian leat do chódú agus do thuiscint ar mheaisín-fhoghlaim a fheabhsú.
Leave a Reply