നിങ്ങൾക്ക് ആരംഭിക്കാൻ താൽപ്പര്യമുണ്ടോ മെഷീൻ ലേണിംഗ്?
സമ്പൂർണ്ണ തുടക്കക്കാർക്കായി ഞാൻ ലളിതവും ലളിതവുമായ ഒരു ട്യൂട്ടോറിയൽ സൃഷ്ടിച്ചു. ഒരു മെഷീൻ ലേണിംഗ് മോഡൽ പരിശീലിപ്പിക്കുന്നതിനുള്ള അടിസ്ഥാന ഘട്ടങ്ങൾ ഞങ്ങൾ ഒരുമിച്ച് പരിശോധിക്കും.
ഒരു മാതൃകയെ പരിശീലിപ്പിക്കുന്ന ഘട്ടങ്ങൾ ഓരോന്നായി വിശദീകരിക്കുമ്പോൾ, ഒരു മെഷീൻ ലേണിംഗ് പ്രശ്നത്തിന്റെ അടിസ്ഥാനപരമായ ഒരു ഉദാഹരണവും ഞാൻ നൽകും. അതിനാൽ, നിങ്ങൾ പിന്തുടരാൻ ആഗ്രഹിക്കുന്നുവെങ്കിൽ, ഇതിൽ നിന്ന് ഈ സാമ്പിൾ ഡാറ്റ സെറ്റ് ഡൗൺലോഡ് ചെയ്യാം ബന്ധം.
മെഷീൻ ലേണിംഗ് ആരംഭിക്കാൻ നിങ്ങളെ സഹായിക്കുന്ന ഒരു സാമ്പിൾ ഡാറ്റാസെറ്റ് മാത്രമാണിത്.
വ്യത്യസ്ത പ്രായത്തിലും ലിംഗഭേദത്തിലും ഉള്ള ആളുകളുടെ പ്രിയപ്പെട്ട സംഗീതം നിർവചിക്കപ്പെട്ടിട്ടുള്ള 18 മൂല്യങ്ങൾ ഞങ്ങൾക്കുണ്ട്. "പ്രായം", "ലിംഗം" എന്നിവയുടെ സവിശേഷതകൾ ഉപയോഗിക്കുന്നതിലൂടെ, ഏത് സംഗീത വിഭാഗമാണ് അവരുടെ പ്രിയപ്പെട്ടതെന്ന് ഞങ്ങൾ ഊഹിക്കാൻ ശ്രമിക്കും.
ശ്രദ്ധിക്കുക: ഈ ഡാറ്റാസെറ്റിൽ സ്ത്രീയും പുരുഷനും എന്ന നിലയിൽ 1, 0 എന്നിവ ലിംഗഭേദങ്ങൾക്ക് നൽകിയിരിക്കുന്നു.
എന്നിരുന്നാലും, നിങ്ങൾക്ക് മാതൃക പിന്തുടരാൻ താൽപ്പര്യമില്ലെങ്കിൽ, അത് തികച്ചും നല്ലതാണ്. ഈ ഘട്ടങ്ങളെല്ലാം ഞാൻ വിശദമായി വിവരിക്കും. അതിനാൽ, നമുക്ക് മുങ്ങാം!
ആദ്യം അറിയേണ്ട കാര്യങ്ങൾ
ഒരു മോഡലിനെ പരിശീലിപ്പിക്കുന്നതിനുള്ള ഘട്ടങ്ങളിലേക്ക് പോകുന്നതിനുമുമ്പ്, നമുക്ക് ചില പോയിന്റുകൾ വ്യക്തമാക്കാം. മെഷീൻ ലേണിംഗ് ആണ് നിർമ്മിത ബുദ്ധി ഡാറ്റയിൽ നിന്ന് പഠിക്കാൻ കഴിയുന്ന അൽഗോരിതങ്ങൾ വികസിപ്പിക്കുന്നതിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്ന അച്ചടക്കം.
ഇത് ചെയ്യുന്നതിന്, മെഷീൻ ലേണിംഗ് മോഡലുകൾ ഒരു ഡാറ്റാസെറ്റിൽ പരിശീലിപ്പിക്കപ്പെടുന്നു, അത് എങ്ങനെ ശരിയായ പ്രവചനങ്ങൾ നടത്താമെന്ന് മോഡലിനെ പഠിപ്പിക്കുന്നു. ക്ലാസിഫിക്കേഷനുകളും പുതിയതും മുമ്പ് അറിയാത്തതുമായ ഡാറ്റയിൽ.
അപ്പോൾ, ഈ മോഡലുകൾ എന്തൊക്കെയാണ്? എ മെഷീൻ ലേണിംഗ് മോഡൽ ഡാറ്റ പ്രവചനങ്ങൾ അല്ലെങ്കിൽ ചോയ്സുകൾ സൃഷ്ടിക്കാൻ കമ്പ്യൂട്ടർ ഉപയോഗിക്കുന്ന ഒരു പാചകക്കുറിപ്പിന് സമാനമാണ്.
ഒരു പാചകക്കുറിപ്പ് പോലെ ഒരു മോഡൽ, ഡാറ്റ വിലയിരുത്തുന്നതിനും ഡാറ്റയിൽ കാണുന്ന പാറ്റേണുകളെ അടിസ്ഥാനമാക്കി പ്രവചനങ്ങളോ വിധിന്യായങ്ങളോ സൃഷ്ടിക്കുന്നതിനുള്ള നിർദ്ദേശങ്ങളുടെ ഒരു കൂട്ടം പിന്തുടരുന്നു. മോഡൽ പരിശീലിപ്പിക്കുന്ന കൂടുതൽ ഡാറ്റ, അതിന്റെ പ്രവചനങ്ങൾ കൂടുതൽ കൃത്യമാകും.
ഏത് തരത്തിലുള്ള മോഡലുകളാണ് നമുക്ക് പരിശീലിപ്പിക്കാൻ കഴിയുക?
അടിസ്ഥാന മെഷീൻ ലേണിംഗ് മോഡലുകൾ എന്തൊക്കെയാണെന്ന് നോക്കാം.
- ലീനിയർ റിഗ്രഷൻ: ഒന്നോ അതിലധികമോ ഇൻപുട്ട് വേരിയബിളുകളിൽ നിന്ന് തുടർച്ചയായ ടാർഗെറ്റ് വേരിയബിൾ പ്രവചിക്കുന്ന ഒരു മോഡൽ.
- ന്യൂറൽ നെറ്റ്വർക്കുകൾ: ഡാറ്റയിലെ സങ്കീർണ്ണമായ പാറ്റേണുകൾ കണ്ടെത്താൻ പഠിക്കാൻ കഴിയുന്ന ലിങ്ക്ഡ് നോഡുകളുടെ ഒരു ശൃംഖല.
- ഡിസിഷൻ ട്രീകൾ: ഇഫ്-എൾസ് സ്റ്റേറ്റ്മെന്റുകളുടെ ഒരു ശൃംഖലയിൽ നിർമ്മിച്ച ഒരു തീരുമാനമെടുക്കൽ സമീപനം.
- ക്ലസ്റ്ററിംഗ്: സമാനതയെ അടിസ്ഥാനമാക്കി താരതമ്യപ്പെടുത്താവുന്ന ഡാറ്റാ പോയിന്റുകൾ ഗ്രൂപ്പുചെയ്യുന്ന മോഡലുകളുടെ ഒരു കൂട്ടം.
- ലോജിസ്റ്റിക് റിഗ്രഷൻ: ടാർഗെറ്റ് വേരിയബിളിന് രണ്ട് സാധ്യതയുള്ള മൂല്യങ്ങളുള്ള ബൈനറി വർഗ്ഗീകരണ പ്രശ്നങ്ങൾക്കുള്ള ഒരു മാതൃക.
- ഡിസിഷൻ ട്രീകൾ: ഇഫ്-എൾസ് സ്റ്റേറ്റ്മെന്റുകളുടെ ഒരു ശൃംഖലയിൽ നിർമ്മിച്ച ഒരു തീരുമാനമെടുക്കൽ സമീപനം.
- റാൻഡം ഫോറസ്റ്റ്: നിരവധി തീരുമാന മരങ്ങൾ ചേർന്ന ഒരു സമന്വയ മാതൃക. വർഗ്ഗീകരണത്തിനും റിഗ്രഷൻ ആപ്ലിക്കേഷനുകൾക്കുമായി അവ പതിവായി ഉപയോഗിക്കുന്നു.
- കെ-അടുത്ത അയൽക്കാർ: പരിശീലന സെറ്റിലെ കെ-അടുത്തുള്ള ഡാറ്റ പോയിന്റുകൾ ഉപയോഗിച്ച് ടാർഗെറ്റ് വേരിയബിൾ പ്രവചിക്കുന്ന ഒരു മോഡൽ.
ഞങ്ങളുടെ പ്രശ്നത്തെയും ഡാറ്റാസെറ്റിനെയും ആശ്രയിച്ച്, ഏത് മെഷീൻ ലേണിംഗ് മോഡലാണ് ഞങ്ങളുടെ സാഹചര്യത്തിന് ഏറ്റവും അനുയോജ്യമെന്ന് ഞങ്ങൾ തീരുമാനിക്കുന്നു. എന്നിരുന്നാലും, ഞങ്ങൾ പിന്നീട് ഇതിലേക്ക് മടങ്ങും. ഇപ്പോൾ, നമുക്ക് നമ്മുടെ മാതൃകയെ പരിശീലിപ്പിക്കാൻ തുടങ്ങാം. നിങ്ങൾ ഇതിനകം ഡൗൺലോഡ് ചെയ്തിട്ടുണ്ടെന്ന് ഞാൻ പ്രതീക്ഷിക്കുന്നു ഡാറ്റാസെറ്റ് ഞങ്ങളുടെ മാതൃക പിന്തുടരാൻ നിങ്ങൾ ആഗ്രഹിക്കുന്നുവെങ്കിൽ.
കൂടാതെ, ഉണ്ടായിരിക്കാൻ ഞാൻ ശുപാർശ ചെയ്യുന്നു ജൂപ്പിറ്റർ നോട്ട്ബുക്ക് നിങ്ങളുടെ പ്രാദേശിക മെഷീനിൽ ഇൻസ്റ്റാൾ ചെയ്യുകയും നിങ്ങളുടെ മെഷീൻ ലേണിംഗ് പ്രോജക്റ്റുകൾക്കായി ഇത് ഉപയോഗിക്കുകയും ചെയ്യുന്നു.
1: പ്രശ്നം നിർവചിക്കുക
ആദ്യ ഘട്ടത്തിൽ ഒരു മെഷീൻ ലേണിംഗ് പരിശീലിപ്പിക്കുന്നു പരിഹരിക്കേണ്ട പ്രശ്നം മോഡൽ നിർവചിക്കുന്നു. നിങ്ങൾ പ്രവചിക്കാൻ ആഗ്രഹിക്കുന്ന വേരിയബിളുകളും (ടാർഗെറ്റ് വേരിയബിൾ എന്നറിയപ്പെടുന്നത്) ആ പ്രവചനങ്ങൾ സൃഷ്ടിക്കാൻ ഉപയോഗിക്കുന്ന വേരിയബിളുകളും (സവിശേഷതകൾ അല്ലെങ്കിൽ പ്രവചനങ്ങൾ എന്നറിയപ്പെടുന്നു) തിരഞ്ഞെടുക്കുന്നത് ഇത് ഉൾക്കൊള്ളുന്നു.
ഏത് തരത്തിലുള്ള മെഷീൻ ലേണിംഗ് പ്രശ്നമാണ് നിങ്ങൾ പരിഹരിക്കാൻ ശ്രമിക്കുന്നതെന്നും (ക്ലാസിഫിക്കേഷൻ, റിഗ്രഷൻ, ക്ലസ്റ്ററിംഗ് മുതലായവ) ഏത് തരത്തിലുള്ള ഡാറ്റയാണ് നിങ്ങൾ ശേഖരിക്കേണ്ടതെന്നും നിങ്ങളുടെ മോഡലിനെ പരിശീലിപ്പിക്കണമെന്നും നിങ്ങൾ തീരുമാനിക്കണം.
നിങ്ങൾ ഉപയോഗിക്കുന്ന മോഡൽ തരം നിർണ്ണയിക്കുന്നത് നിങ്ങൾ പരിഹരിക്കാൻ ലക്ഷ്യമിടുന്ന മെഷീൻ ലേണിംഗ് പ്രശ്നത്തിന്റെ തരം അനുസരിച്ചായിരിക്കും. വർഗ്ഗീകരണം, റിഗ്രഷൻ, ക്ലസ്റ്ററിംഗ് എന്നിവയാണ് മൂന്ന് പ്രാഥമിക വിഭാഗങ്ങൾ മെഷീൻ ലേണിംഗ് വെല്ലുവിളികൾ. ഇമെയിൽ ഒരു സ്പാം ആണോ അല്ലയോ എന്നത് പോലെയുള്ള ഒരു തരം വേരിയബിൾ പ്രവചിക്കാൻ നിങ്ങൾ ആഗ്രഹിക്കുമ്പോൾ, നിങ്ങൾ വർഗ്ഗീകരണം ഉപയോഗിക്കുന്നു.
ഒരു വീടിന്റെ വില പോലെ തുടർച്ചയായ വേരിയബിൾ പ്രവചിക്കാൻ നിങ്ങൾ ആഗ്രഹിക്കുമ്പോൾ, നിങ്ങൾ റിഗ്രഷൻ ഉപയോഗിക്കുന്നു. താരതമ്യപ്പെടുത്താവുന്ന ഡാറ്റാ ഇനങ്ങളെ അവയുടെ പൊതുതത്വങ്ങളെ അടിസ്ഥാനമാക്കി ഒരുമിച്ച് ചേർക്കാൻ ക്ലസ്റ്ററിംഗ് ഉപയോഗിക്കുന്നു.
നമ്മുടെ ഉദാഹരണം നോക്കിയാൽ; ഒരു വ്യക്തിയുടെ ലിംഗഭേദവും പ്രായവും അനുസരിച്ച് ഇഷ്ടപ്പെട്ട സംഗീത ശൈലി നിർണ്ണയിക്കുക എന്നതാണ് ഞങ്ങളുടെ വെല്ലുവിളി. ഈ ഉദാഹരണത്തിനായി ഞങ്ങൾ 18 ആളുകളുടെ ഒരു ഡാറ്റാസെറ്റും അവരുടെ പ്രായം, ലിംഗഭേദം, പ്രിയപ്പെട്ട സംഗീത ശൈലി എന്നിവയെക്കുറിച്ചുള്ള വിവരങ്ങളും ഉപയോഗിക്കും.
2. ഡാറ്റ തയ്യാറാക്കുക
നിങ്ങൾ പ്രശ്നം വ്യക്തമാക്കിയ ശേഷം, മോഡൽ പരിശീലിപ്പിക്കുന്നതിന് നിങ്ങൾ ഡാറ്റ തയ്യാറാക്കേണ്ടതുണ്ട്. ഇത് ഡാറ്റ വൃത്തിയാക്കുന്നതും പ്രോസസ്സ് ചെയ്യുന്നതും ഉൾക്കൊള്ളുന്നു. അതിനാൽ, അത് ഒരു ഫോർമാറ്റിലാണെന്ന് ഞങ്ങൾക്ക് ഉറപ്പാക്കാൻ കഴിയും മെഷീൻ ലേണിംഗ് അൽഗോരിതം ഉപയോഗിക്കാൻ കഴിയും.
നഷ്ടമായ മൂല്യങ്ങൾ ഇല്ലാതാക്കുക, വിഭാഗീയ ഡാറ്റയെ സംഖ്യാപരമായ ഡാറ്റയിലേക്ക് മാറ്റുക, എല്ലാ സ്വഭാവസവിശേഷതകളും ഒരേ സ്കെയിലിലാണെന്ന് ഉറപ്പാക്കാൻ ഡാറ്റ സ്കെയിലിംഗ് അല്ലെങ്കിൽ നോർമലൈസ് ചെയ്യുക തുടങ്ങിയ പ്രവർത്തനങ്ങൾ ഇതിൽ ഉൾപ്പെട്ടേക്കാം.
ഉദാഹരണത്തിന്, നഷ്ടപ്പെട്ട മൂല്യങ്ങൾ നിങ്ങൾ ഇല്ലാതാക്കുന്നത് ഇങ്ങനെയാണ്:
import pandas as pd
# Load the data into a pandas DataFrame
data = pd.read_csv('data.csv')
# Check for missing values
print(data.isnull().sum())
# Drop rows with missing values
data.dropna(inplace=True)
# Check that all missing values have been removed
print(data.isnull().sum())
ചെറിയ കുറിപ്പ്: ഓ " എന്ന വരിയിൽimport pandas as pd",
ഞങ്ങൾ പാണ്ടാസ് ലൈബ്രറി ഇറക്കുമതി ചെയ്യുകയും അതിന്റെ പ്രവർത്തനങ്ങളും ഒബ്ജക്റ്റുകളും പിന്നീട് കോഡിൽ പരാമർശിക്കുന്നത് എളുപ്പമാക്കുന്നതിന് "pd" എന്ന അപരനാമം നൽകുകയും ചെയ്യുന്നു.
ഡാറ്റാ കൃത്രിമത്വത്തിനും വിശകലനത്തിനുമായി പൈത്തണിനുള്ള അറിയപ്പെടുന്ന മൊഡ്യൂളാണ് പാണ്ടസ്, പ്രത്യേകിച്ച് ഘടനാപരമായ അല്ലെങ്കിൽ പട്ടികാ ഡാറ്റയുമായി പ്രവർത്തിക്കുമ്പോൾ.
സംഗീത വിഭാഗങ്ങൾ നിർണ്ണയിക്കുന്നതിനുള്ള ഞങ്ങളുടെ ഉദാഹരണത്തിൽ. ഞങ്ങൾ ആദ്യം ഡാറ്റാസെറ്റ് ഇറക്കുമതി ചെയ്യും. ഞാൻ ഇതിന് music.csv എന്ന് പേരിട്ടു, എന്നിരുന്നാലും, നിങ്ങൾക്ക് വേണമെങ്കിൽ പേര് നൽകാം.
ഒരു മെഷീൻ ലേണിംഗ് മോഡൽ പരിശീലിപ്പിക്കുന്നതിന് ഡാറ്റ തയ്യാറാക്കുന്നതിനായി, ഞങ്ങൾ അതിനെ ആട്രിബ്യൂട്ടുകളിലേക്കും (പ്രായവും ലിംഗഭേദവും) ലക്ഷ്യങ്ങളിലേക്കും (സംഗീത തരം) വിഭജിക്കുന്നു.
ഞങ്ങളുടെ മോഡലിന്റെ പ്രകടനം വിലയിരുത്തുന്നതിനും ഓവർഫിറ്റിംഗ് ഒഴിവാക്കുന്നതിനുമായി ഞങ്ങൾ ഡാറ്റയെ 80:20 പരിശീലന, ടെസ്റ്റിംഗ് സെറ്റുകളായി വിഭജിക്കും.
# Import necessary libraries
import pandas as pd
from sklearn.model_selection import train_test_split
# Load data from CSV file/code>
music_data = pd.read_csv('music.csv')
# Split data into features and target
X = music_data.drop(columns=['genre'])
y = music_data['genre']
# Split data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
3. ഒരു മെഷീൻ ലേണിംഗ് മോഡൽ തിരഞ്ഞെടുക്കുക.
നിങ്ങൾ ഡാറ്റ തയ്യാറാക്കിയ ശേഷം, നിങ്ങളുടെ ടാസ്ക്കിന് അനുയോജ്യമായ ഒരു മെഷീൻ ലേണിംഗ് മോഡൽ നിങ്ങൾ തിരഞ്ഞെടുക്കണം.
ഡിസിഷൻ ട്രീകൾ, ലോജിസ്റ്റിക് റിഗ്രഷൻ, സപ്പോർട്ട് വെക്റ്റർ മെഷീനുകൾ, ന്യൂറൽ നെറ്റ്വർക്കുകൾ എന്നിവയും മറ്റുള്ളവയും പോലുള്ള നിരവധി അൽഗോരിതങ്ങൾ തിരഞ്ഞെടുക്കാനുണ്ട്. നിങ്ങൾ തിരഞ്ഞെടുക്കുന്ന അൽഗോരിതം നിർണ്ണയിക്കുന്നത് നിങ്ങൾ ഉത്തരം നൽകാൻ ശ്രമിക്കുന്ന തരത്തിലുള്ള പ്രശ്നങ്ങൾ, നിങ്ങളുടെ പക്കലുള്ള ഡാറ്റയുടെ തരം, നിങ്ങളുടെ പ്രകടന ആവശ്യങ്ങൾ എന്നിവ അനുസരിച്ചായിരിക്കും.
ഈ ഉദാഹരണത്തിനായി ഞങ്ങൾ ഒരു ഡിസിഷൻ ട്രീ ക്ലാസിഫയർ ഉപയോഗിക്കും, കാരണം ഞങ്ങൾ ഒരു വർഗ്ഗീകരണ പ്രശ്നവുമായി പ്രവർത്തിക്കുന്നു (വർഗ്ഗീകരണ ഡാറ്റ പ്രവചിക്കുന്നു).
# Import necessary libraries
from sklearn.tree import DecisionTreeClassifier
ഡിസിഷൻ ട്രീ ക്ലാസിഫയർ എങ്ങനെ പ്രവർത്തിക്കുന്നു എന്നതിന്റെ ദൃശ്യവൽക്കരണം ഇതാ:
4. മോഡൽ പരിശീലിപ്പിക്കുക
സ്വീകാര്യമായ ഒരു മെഷീൻ ലേണിംഗ് അൽഗോരിതം തിരഞ്ഞെടുക്കുമ്പോൾ നിങ്ങൾക്ക് മോഡൽ പരിശീലിപ്പിക്കാൻ തുടങ്ങാം. പുതിയതും മുമ്പ് കണ്ടിട്ടില്ലാത്തതുമായ ഡാറ്റയിൽ എങ്ങനെ പ്രവചനങ്ങൾ നടത്താം എന്നതിനെക്കുറിച്ചുള്ള അൽഗോരിതം ബോധവത്കരിക്കുന്നതിന് മുമ്പ് ജനറേറ്റുചെയ്ത ഡാറ്റ ഉപയോഗിക്കുന്നത് ഇത് അർത്ഥമാക്കുന്നു.
പ്രവചിച്ച മൂല്യങ്ങളും പരിശീലന ഡാറ്റയിലെ യഥാർത്ഥ മൂല്യങ്ങളും തമ്മിലുള്ള വ്യത്യാസം കുറയ്ക്കുന്നതിന് പരിശീലന സമയത്ത് അൽഗോരിതം അതിന്റെ ആന്തരിക പാരാമീറ്ററുകൾ പരിഷ്കരിക്കും. പരിശീലനത്തിനായി ഉപയോഗിക്കുന്ന ഡാറ്റയുടെ അളവും അൽഗോരിതത്തിന്റെ നിർദ്ദിഷ്ട പാരാമീറ്ററുകളും എല്ലാം ഫലമായുണ്ടാകുന്ന മോഡലിന്റെ കൃത്യതയെ സ്വാധീനിക്കും.
ഞങ്ങളുടെ നിർദ്ദിഷ്ട ഉദാഹരണത്തിൽ, ഇപ്പോൾ ഞങ്ങൾ ഒരു രീതി തീരുമാനിച്ചുകഴിഞ്ഞാൽ, പരിശീലന ഡാറ്റ ഉപയോഗിച്ച് ഞങ്ങളുടെ മോഡലിനെ പരിശീലിപ്പിക്കാം.
# Train the decision tree classifier
model = DecisionTreeClassifier()
model.fit(X_train, y_train)
5. മോഡൽ വിലയിരുത്തുക
മോഡൽ പരിശീലിപ്പിച്ച ശേഷം, അത് കൃത്യവും വിശ്വസനീയവുമാണെന്ന് ഉറപ്പാക്കാൻ പുതിയ ഡാറ്റയിൽ അത് വിലയിരുത്തണം. പരിശീലന സമയത്ത് ഉപയോഗിക്കാത്ത ഡാറ്റ ഉപയോഗിച്ച് മോഡൽ പരീക്ഷിക്കുകയും അതിന്റെ പ്രൊജക്റ്റ് മൂല്യങ്ങൾ ടെസ്റ്റ് ഡാറ്റയിലെ യഥാർത്ഥ മൂല്യങ്ങളുമായി താരതമ്യം ചെയ്യുകയും ചെയ്യുന്നു.
ഓവർഫിറ്റിംഗ് അല്ലെങ്കിൽ അണ്ടർഫിറ്റിംഗ് പോലെയുള്ള ഏതെങ്കിലും മോഡൽ പിഴവുകൾ തിരിച്ചറിയാൻ ഈ അവലോകനത്തിന് സഹായിക്കാനാകും, കൂടാതെ ആവശ്യമായി വന്നേക്കാവുന്ന ഏത് ഫൈൻ-ട്യൂണിംഗിലേക്കും ഇത് നയിച്ചേക്കാം.
ടെസ്റ്റിംഗ് ഡാറ്റ ഉപയോഗിച്ച്, ഞങ്ങളുടെ മോഡലിന്റെ കൃത്യത ഞങ്ങൾ വിലയിരുത്തും.
# Import necessary libraries
from sklearn.metrics import accuracy_score
# Predict the music genre for the test data
predictions = model.predict(X_test)
# Evaluate the model's accuracy
accuracy = accuracy_score(y_test, predictions)
print("Accuracy: ", accuracy)
കൃത്യത സ്കോർ ഇപ്പോൾ അത്ര മോശമല്ല. 🙂 നിങ്ങളുടെ കൃത്യത സ്കോർ മെച്ചപ്പെടുത്തുന്നതിന്, നിങ്ങൾക്ക് എല്ലായ്പ്പോഴും ഡാറ്റ കൂടുതൽ വൃത്തിയാക്കാം അല്ലെങ്കിൽ ഏതാണ് ഉയർന്ന സ്കോർ നൽകുന്നതെന്ന് കാണാൻ വ്യത്യസ്ത മെഷീൻ ലേണിംഗ് മോഡലുകൾ പരീക്ഷിക്കാം.
6. മോഡൽ ഫൈൻ-ട്യൂൺ ചെയ്യുക
മോഡലിന്റെ കാര്യക്ഷമത പര്യാപ്തമല്ലെങ്കിൽ, വിവിധ അൽഗോരിതം പാരാമീറ്ററുകൾ മാറ്റുന്നതിലൂടെയോ പുതിയ അൽഗരിതങ്ങൾ ഉപയോഗിച്ച് പൂർണ്ണമായും പരീക്ഷിച്ചുകൊണ്ടോ നിങ്ങൾക്ക് ഇത് മികച്ചതാക്കാൻ കഴിയും.
ഈ നടപടിക്രമത്തിൽ ഇതര പഠന നിരക്കുകൾ പരീക്ഷിക്കുക, ക്രമപ്പെടുത്തൽ ക്രമീകരണങ്ങൾ പരിഷ്ക്കരിക്കുക, അല്ലെങ്കിൽ ഒരു ന്യൂറൽ നെറ്റ്വർക്കിലെ മറഞ്ഞിരിക്കുന്ന പാളികളുടെ എണ്ണമോ വലുപ്പമോ മാറ്റൽ എന്നിവ ഉൾപ്പെട്ടേക്കാം.
7. മോഡൽ ഉപയോഗിക്കുക
മോഡലിന്റെ പ്രകടനത്തിൽ നിങ്ങൾ സംതൃപ്തരാണെങ്കിൽ, പുതിയ ഡാറ്റയിൽ പ്രവചനങ്ങൾ സൃഷ്ടിക്കുന്നതിന് നിങ്ങൾക്ക് അത് ഉപയോഗിച്ച് തുടങ്ങാം.
ഇത് മോഡലിലേക്ക് പുതിയ ഡാറ്റ നൽകുകയും ആ ഡാറ്റയെക്കുറിച്ചുള്ള പ്രവചനങ്ങൾ സൃഷ്ടിക്കുന്നതിന് മോഡലിന്റെ പഠിച്ച പാരാമീറ്ററുകൾ ഉപയോഗിക്കുകയും അല്ലെങ്കിൽ ഒരു വിശാലമായ ആപ്ലിക്കേഷനിലേക്കോ സിസ്റ്റത്തിലേക്കോ മോഡൽ സംയോജിപ്പിക്കുന്നതിനോ ആവശ്യമായി വന്നേക്കാം.
പുതിയ ഡാറ്റയുടെ കൃത്യതയിൽ ഞങ്ങൾ സംതൃപ്തരായ ശേഷം പ്രവചനങ്ങൾ സൃഷ്ടിക്കാൻ ഞങ്ങളുടെ മോഡൽ ഉപയോഗിക്കാം. നിങ്ങൾക്ക് ലിംഗഭേദത്തിന്റെയും പ്രായത്തിന്റെയും വ്യത്യസ്ത മൂല്യങ്ങൾ പരീക്ഷിക്കാം.
# Test the model with new data
new_data = [[25, 1], [30, 0]]
predictions = model.predict(new_data)
print("Predictions: ", predictions)
അവസാനിപ്പിക്കുക
ഞങ്ങളുടെ ആദ്യത്തെ മെഷീൻ ലേണിംഗ് മോഡൽ പരിശീലനം പൂർത്തിയാക്കി.
നിങ്ങൾക്ക് ഇത് ഉപയോഗപ്രദമാണെന്ന് ഞാൻ കരുതുന്നു. നിങ്ങൾക്ക് ഇപ്പോൾ ലീനിയർ റിഗ്രഷൻ അല്ലെങ്കിൽ റാൻഡം ഫോറസ്റ്റ് പോലുള്ള വ്യത്യസ്ത മെഷീൻ ലേണിംഗ് മോഡലുകൾ ഉപയോഗിക്കാൻ ശ്രമിക്കാം.
നിരവധി ഡാറ്റാസെറ്റുകളും വെല്ലുവിളികളും ഉണ്ട് കഗ്ലെ നിങ്ങളുടെ കോഡിംഗും മെഷീൻ ലേണിംഗിനെക്കുറിച്ചുള്ള ധാരണയും മെച്ചപ്പെടുത്താൻ നിങ്ങൾ ആഗ്രഹിക്കുന്നുവെങ്കിൽ.
നിങ്ങളുടെ അഭിപ്രായങ്ങൾ രേഖപ്പെടുത്തുക