Ọ ga-amasị gị ibido ya ngwa igwe?
Emepụtala m nkuzi dị mfe ma dị mfe maka ndị mbido zuru oke. Ọnụ, anyị ga-agafe usoro ndị bụ isi nke ịzụ ụdị mmụta igwe.
Mgbe m na-akọwa usoro nke ịzụ ihe nlereanya otu otu, m ga-enyekwa ezigbo ihe atụ nke nsogbu mmụta igwe. Yabụ, ọ bụrụ na ịchọrọ iso, ị nwere ike budata ihe nlele data setịpụrụ na nke a njikọ.
Nke a bụ naanị ihe atụ dataset ga-enyere gị aka ibido mmụta igwe.
Anyị nwere ụkpụrụ 18 nke ndị dị afọ na okike dị iche iche nke akọwara egwu kachasị amasị ha. Site n'iji, njirimara nke "afọ" na "nwoke" anyị ga-agbalị ịkọ ụdị egwu kachasị amasị ha.
Mara: 1 na 0 ka ekenyere nwoke na nwanyị dịka nwanyị na nwoke n'ime dataset a.
Agbanyeghị, ọ bụrụ na ịchọghị ịgbaso ihe atụ ahụ, ọ dịkwa mma nke ukwuu. Aga m akọwa usoro ndị a niile n'ụzọ zuru ezu. Yabụ, ka anyị banye n'ime!
Ihe mbụ ị ga-amata
Tupu ịbanye na usoro nke ịzụ ihe nlereanya, ka anyị dokwuo anya isi ihe ụfọdụ. Ịmụ igwe bụ ihe Amamịghe echiche ọzụzụ nke na-elekwasị anya n'ịzụlite algọridim nke nwere ike ịmụta site na data.
Iji mee nke a, a na-azụ ụdị mmụta igwe na ihe ndekọ data na-akụziri ihe nlereanya ka esi eme amụma ziri ezi ma ọ bụ nhazi ọkwa na data ọhụrụ amabeghị na mbụ.
Yabụ, kedu ihe ụdị ndị a? A igwe ihe omumu ihe omuma yiri ntụzịaka nke kọmputa na-eji ewepụta amụma data ma ọ bụ nhọrọ.
Nlereanya, dị ka ntụzịaka, na-agbaso usoro ntuziaka iji nyochaa data wee mepụta amụma ma ọ bụ ikpe dabere na ụkpụrụ dị na data ahụ. Ka a na-azụkwu data ihe nlereanya ahụ, ka amụma ya na-adịkwu nke ọma.
Kedu ụdị ụdị anyị nwere ike ịzụ?
Ka anyị hụ ihe bụ isi igwe mmụta ụdị.
- Linear Regression: ihe nlereanya na-ebu amụma mgbanwe ebumnuche na-aga n'ihu site na otu mgbanwe ntinye ma ọ bụ karịa.
- Netwọk akwara ozi: netwọk nke ọnụ ọnụ nwere ike ịmụta ịchọpụta usoro mgbagwoju anya na data.
- Osisi Mkpebi: ụzọ ime mkpebi wuru n'usoro nke alaka ma ọ bụrụ na-ekwu okwu ọzọ.
- Ịchịkọta: otu ụdị nke na-achịkọta isi data atụnyere dabere na myirịta.
- Logistic Regression: ihe nlere maka nsogbu nhazi ọnụọgụ abụọ nke mgbanwe ebumnuche nwere ụkpụrụ abụọ nwere ike ime.
- Osisi Mkpebi: ụzọ ime mkpebi wuru n'usoro nke alaka ma ọ bụrụ na-ekwu okwu ọzọ.
- Ohia Random: ihe nlere nke nwere ọtụtụ osisi mkpebi mejupụtara. A na-ejikarị ha eme ihe maka nhazi ọkwa na ngwa mgbagha.
- K-Ndị agbata obi kacha nso: ihe nlere na-ebu amụma mgbanwe ebumnuche site na iji isi data k- kacha nso na nhazi ọzụzụ.
Dabere na nsogbu anyị yana dataset, anyị na-ekpebi ụdị mmụta igwe dabara adaba maka ọnọdụ anyị. Ma, anyị ga-alaghachi na nke a ma emechaa. Ugbu a, ka anyị malite ịzụ ihe nlereanya anyị. Enwere m olileanya na ị budatalarị ya ihe omuma ọ bụrụ na ị ga-achọ ịgbaso ihe nlereanya anyị.
Ọzọkwa, m na-akwado inwe Akwụkwọ Jupyter arụnyere na igwe mpaghara gị ma jiri ya rụọ ọrụ mmụta igwe gị.
1: Kọwaa nsogbu ahụ
Nke mbụ ogbo na ịzụ igwe mmụta ihe nlereanya na-akọwa nsogbu a ga-edozi. Nke a gụnyere ịhọrọ mgbanwe ndị ịchọrọ ibu amụma (mara dị ka mgbanwe ebumnuche) yana mgbanwe ndị a ga-eji wepụta amụma ndị ahụ (amara dị ka atụmatụ ma ọ bụ amụma).
I kwesịkwara ikpebi ụdị nsogbu mmụta igwe ị na-achọ ileba anya (nhazi, nlọghachi azụ, nchịkọta, na ihe ndị ọzọ) yana ụdị data ị ga-achọ ikpokọta ma ọ bụ nweta ịzụ ihe nlereanya gị.
A ga-ekpebi ụdị ụdị ị na-arụ n'ọrụ site n'ụdị nsogbu mmụta igwe ị na-achọ idozi. Nhazi, nlọghachi azụ, na nchịkọta bụ isi atọ nke nsogbu mmụta igwe. Mgbe ịchọrọ ịkọ mgbanwe categorical, dị ka ma email ọ bụ spam ma ọ bụ na ọ bụghị, ị na-eji nhazi ọkwa.
Mgbe ịchọrọ ịkọ amụma mgbanwe na-aga n'ihu, dịka ọnụ ahịa ụlọ, ị na-eji nlọghachi azụ. A na-eji ụyọkọ ejikọta ihe data atụnyere dabere na ihe jikọrọ ha.
Ọ bụrụ na anyị elee ihe atụ anyị anya; Ihe ịma aka anyị bụ ịchọpụta ụdị egwu mmadụ masịrị ya site na okike na afọ ya. Anyị ga-eji ihe ndekọ data nke mmadụ 18 maka ihe atụ a na ozi gbasara afọ ha, okike na ụdị egwu kachasị amasị ha.
2. Kwadebe data
Mgbe ị kọwachara nsogbu ahụ, ị ga-achọ ịkwado data maka ịzụ ihe nlereanya. Nke a gụnyere ihicha na nhazi data. Ya mere, na anyị nwere ike hụ na ọ bụ na a format na igwe na-amụ algorithm nwere ike iji.
Nke a nwere ike ịgụnye mmemme dị ka ihichapụ ụkpụrụ efu, ịgbanwe data categorical ka ọ bụrụ data ọnụọgụ, na ịkacha ma ọ bụ ịhazi data ahụ iji hụ na njirimara niile dị n'otu nha.
Dịka ọmụmaatụ, otu a bụ otu esi ehichapụ ụkpụrụ efu:
import pandas as pd
# Load the data into a pandas DataFrame
data = pd.read_csv('data.csv')
# Check for missing values
print(data.isnull().sum())
# Drop rows with missing values
data.dropna(inplace=True)
# Check that all missing values have been removed
print(data.isnull().sum())
Obere ndetu: n'ahịrị o "import pandas as pd",
anyị na-ebubata ọba akwụkwọ Pandas wee kenye ya utu aha "pd" iji mee ka ọ dịkwuo mfe ịkọwa ọrụ ya na ihe ndị ọzọ na koodu.
Pandas bụ modul amara ama maka Python maka njikwa data na nyocha, ọkachasị mgbe ejiri data ahaziri ma ọ bụ taabụ arụ ọrụ.
N'ihe atụ anyị nke ikpebi ụdị egwu. Anyị ga-ebu ụzọ bubata dataset. Akpọrọ m ya aha music.csv, mana ị nwere ike ịkpọ ya otu ịchọrọ.
Iji kwado data maka ịzụ ụdị mmụta igwe, anyị kewara ya na njiri mara (afọ na okike) na ebumnobi (ụdị egwu).
Anyị ga-ekekwa data ahụ n'ime 80:20 ọzụzụ na usoro nnwale iji nyochaa arụmọrụ nke ihe nlereanya anyị wee zere imebiga ihe ókè.
# Import necessary libraries
import pandas as pd
from sklearn.model_selection import train_test_split
# Load data from CSV file/code>
music_data = pd.read_csv('music.csv')
# Split data into features and target
X = music_data.drop(columns=['genre'])
y = music_data['genre']
# Split data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
3. Họrọ ụdị mmụta igwe.
Mgbe ị kwadochara data ahụ, ị ga-ahọrọrịrị ụdị mmụta igwe dabara adaba maka ọrụ gị.
Enwere ọtụtụ algọridim ị ga-esi na ya pụta, dị ka osisi mkpebi, mgbagha mgbagha, igwe na-akwado vector, netwọkụ akwara, na ndị ọzọ. A ga-ekpebi algọridim ị họọrọ site n'ụdị okwu ị na-achọ ịza, ụdị data ị nwere, yana mkpa arụmọrụ gị.
Anyị ga-eji nkewa osisi mkpebi maka ihe atụ a n'ihi na anyị na-arụ ọrụ na nsogbu nhazi (ịkọ amụma categorical data).
# Import necessary libraries
from sklearn.tree import DecisionTreeClassifier
Nke a bụ ọhụhụ ka otu Mkpebi Osisi Classifier si arụ ọrụ:
4. Zụlite ihe nlereanya
Ị nwere ike ịmalite ịzụ ihe nlereanya mgbe ị họrọla algọridim mmụta igwe na-anabata. Nke a gụnyere iji data ewepụtara na mbụ iji kuzie algọridim maka otu esi eme amụma maka data ọhụrụ, nke a na-ahụbeghị na mbụ.
Algọridim ga-agbanwe ihe dị n'ime ya n'oge ọzụzụ iji belata ọdịiche dị n'etiti ụkpụrụ amụma ya na ụkpụrụ n'ezie na data ọzụzụ. Ọnụọgụ data ejiri mee ihe maka ọzụzụ, yana usoro algọridim akọwapụtara, nwere ike inwe mmetụta na izi ezi nke ụdị nsonaazụ ahụ.
N'ihe atụ anyị akọwapụtara, ugbu a anyị kpebiri na usoro, anyị nwere ike iji data ọzụzụ zụọ ihe nlereanya anyị.
# Train the decision tree classifier
model = DecisionTreeClassifier()
model.fit(X_train, y_train)
5. Nyochaa ihe nlereanya
Mgbe a zụrụ ihe nlereanya ahụ, a ga-enyocha ya na data ọhụrụ iji hụ na ọ bụ eziokwu na a pụrụ ịdabere na ya. Nke a gụnyere ịnwale ihe nlereanya ahụ na data nke ejighị n'aka n'oge ọzụzụ yana atụnyere ụkpụrụ atụmatụ ya na ụkpụrụ n'ezie na data ule.
Nlebanya a nwere ike inye aka n'ịchọpụta ntụpọ ụdị ọ bụla, dị ka imebiga ihe ókè ma ọ bụ nke na-adịghị mma, ma nwee ike iduga ngbanwe ọ bụla a chọrọ.
Iji data nnwale, anyị ga-enyocha izi ezi nke ihe nlereanya anyị.
# Import necessary libraries
from sklearn.metrics import accuracy_score
# Predict the music genre for the test data
predictions = model.predict(X_test)
# Evaluate the model's accuracy
accuracy = accuracy_score(y_test, predictions)
print("Accuracy: ", accuracy)
Akara ziri ezi adịghị njọ ugbu a. 🙂 Iji meziwanye akara gị ziri ezi, ị nwere ike ihicha data ahụ karịa ma ọ bụ nwalee ụdị mmụta igwe dị iche iche iji hụ nke na-enye akara kacha elu.
6. Meziwanye ihe nlereanya ahụ nke ọma
Ọ bụrụ na arụmọrụ ihe nlereanya ahụ ezughi oke, ị nwere ike mezie ya site n'ịgbanwe usoro algọridim dị iche iche ma ọ bụ site na ịnwale algọridim ọhụrụ kpamkpam.
Usoro a nwere ike ịgụnye ịnwale ọnụego mmụta ọzọ, gbanwee ntọala nhazigharị, ma ọ bụ ịgbanwe ọnụọgụ ma ọ bụ nha nke ọkwa zoro ezo na netwọkụ akwara.
7. Jiri ihe nlereanya
Ozugbo ị nwere mmasị na arụmọrụ ihe nlereanya a, ị nwere ike ịmalite iji ya mepụta amụma na data ọhụrụ.
Nke a nwere ike ịgụnye ịnye data ọhụrụ n'ime ihe nlereanya na iji usoro mmụta ihe nlereanya ahụ ewepụta amụma na data ahụ, ma ọ bụ itinye ihe nlereanya ahụ n'ime ngwa ma ọ bụ sistemụ sara mbara.
Anyị nwere ike iji ihe nlereanya anyị wepụta amụma na data ọhụrụ mgbe anyị nwere mmasị na izi ezi ya. Ị nwere ike ịnwale ụkpụrụ dị iche iche nke okike na afọ.
# Test the model with new data
new_data = [[25, 1], [30, 0]]
predictions = model.predict(new_data)
print("Predictions: ", predictions)
Kechie
Anyị emechaala ọzụzụ ụdị mmụta igwe mbụ anyị.
Enwere m olileanya na ịchọtala ya bara uru. Ị nwere ike ịnwale ugbu a iji ụdị mmụta igwe dị iche iche dị ka Linear Regression ma ọ bụ Random Forest.
Enwere ọtụtụ datasets na ihe ịma aka na Kaggle ọ bụrụ na ị ga-achọ imelite koodu nzuzo gị na nghọta nke mmụta igwe.
Nkume a-aza