Si të trajnoni modelet e difuzionit të qëndrueshëm: një udhëzues hap pas hapi

Shumica prej nesh janë të njohur me gjeneratorët e imazheve të AI si Difuzion i qëndrueshëm. Ajo tashmë ka ndryshuar industrinë dhe është përfshirë në jetën tonë.

Sidoqoftë, modelet e Difuzionit të Qëndrueshëm janë shumë më tepër sesa gjenerimi i imazheve.

Ka kaq shumë fusha në të cilat ne mund t'i përdorim ato.

Modelet e difuzionit të qëndrueshëm janë modele matematikore. Dhe, ato mund t'ju ndihmojnë për të hetuar dinamikën e ndryshimit të sistemeve me kalimin e kohës.

Ato bazohen në konceptet e procesit të difuzionit. Prandaj, ju mund të ekzaminoni një gamë të gjerë fenomenesh. Për shembull; transmetimi i nxehtësisë, reaksionet kimike dhe përhapja e informacionit në tregjet financiare.

Difuzion i qëndrueshëm

Këto modele janë jashtëzakonisht të adaptueshme. Pra, ju mund të parashikoni gjendjen e ardhshme të një sistemi bazuar në gjendjen e tij aktuale.

Përveç kësaj, ju mund të shihni parimet themelore fizike ose financiare që e drejtojnë atë. Ky koncept ka qenë shumë i dobishëm në shumë fusha. Këto përfshijnë fizikën, kiminë dhe financën.

Kjo është arsyeja pse ne duam ta hetojmë më tej. Dhe, ne duam t'ju japim një tutorial se si t'i trajnoni këto modele të Difuzionit të Qëndrueshëm.

Si erdhën modelet e difuzionit të qëndrueshëm?

Kjo i ka rrënjët në fund të shekullit të 19-të.

Hetimi matematik i proceseve të difuzionit në çështje është vendi ku nisën modelet e Difuzionit të Qëndrueshëm. Një nga modelet më të njohura të Difuzionit të Qëndrueshëm është ekuacioni Fokker-Planck.

Për herë të parë u prezantua në vitin 1906. Këto modele kanë evoluar dhe modifikuar me kalimin e kohës. Prandaj, ne tani i përdorim ato në një sërë industrish.

Cila është logjika pas saj?

Me fjalë të thjeshta, siç thamë, ato janë modele matematikore. Përveç kësaj, ato na ndihmojnë të hetojmë se si një pronë ose sasi përhapet me kalimin e kohës në një sistem.

Ato bazohen në parimet e procesit të difuzionit. Pra, ata na ndihmojnë të hetojmë se si një sasi përhapet në një sistem. Kjo përhapje është rezultat i ndryshimeve në përqendrim, presion ose parametra të tjerë.

Le të japim një shembull të thjeshtë. Imagjinoni që keni një enë plot me lëng në të cilën keni shtuar një ngjyrë. Difuzioni këtu shihet kur boja fillon të shpërndahet dhe të emulsifikohet në lëng. Bazuar në karakteristikat e lëngut dhe ngjyrës, modelet e difuzionit të qëndrueshëm mund të përdoren për të parashikuar se si ngjyra do të shpërndahet dhe përzihet me kalimin e kohës.

Në sistemet më komplekse, si tregjet financiare ose reaksionet kimike, këto modele mund të parashikojnë se si informacioni ose atributet do të përhapen dhe do të ndikojnë në sistem me kalimin e kohës. Përveç kësaj, të dhënat e mëdha mund të mësohen trajnoni këto modele për të bërë parashikime të sakta. Ato janë ndërtuar duke përdorur formula matematikore që përshkruajnë evolucionin afatgjatë të sistemit.

Të kuptuarit dhe parashikimi i përhapjes së tipareve të caktuara në një sistem me kalimin e kohës është ideja kryesore që qëndron në themel të këtyre modeleve. Është e rëndësishme të mbani mend se ekspertët në fusha të specializuara zakonisht përdorin këto modele.

Si të trajnoni modelet?

Mblidhni dhe përgatitni të dhënat tuaja:

Së pari duhet të mbledhni dhe përgatitni të dhënat tuaja përpara se të filloni të trajnoni modelin tuaj. Të dhënat tuaja mund të kenë nevojë të pastrohen dhe të formatohen. Gjithashtu, numrat që mungojnë gjithashtu mund të kenë nevojë të eliminohen.

Zgjidhni një arkitekturë model

Modelet e Difuzionit të Qëndrueshëm vijnë në forma të ndryshme. Ai bazohet kryesisht në ekuacionin Fokker-Planck, ekuacionin e Schrödinger dhe ekuacionin Master. Duhet të zgjidhet modeli që përputhet më mirë me situatën tuaj të veçantë. Kështu, secili prej këtyre modeleve ka avantazhe dhe disavantazhe.

Fletore Jupyter

Vendosja e funksionit tuaj të humbjes

Është e rëndësishme pasi ndikon se sa mirë modeli juaj mund të përputhet me të dhënat. Për modelet e Difuzionit të Qëndrueshëm, gabimi mesatar në katror dhe divergjenca Kullback-Leibler janë funksione të shpeshta të humbjes.

Trajnoni modelin tuaj

Duke përdorur zbritjen e gradientit stokastik ose një qasje të ngjashme optimizimi, mund të filloni të trajnoni modelin tuaj pasi të përcaktoni funksionin tuaj të humbjes.

Shqyrtoni përgjithësimin e modelit tuaj

Ju duhet të kontrolloni të dhënat e freskëta pas trajnimit duke i krahasuar ato me një grup testimi të të dhënave.

Rregulloni hiperparametrat e modelit tuaj

Për të përmirësuar performancën e modelit tuaj, eksperimentoni me vlera të ndryshme të hiperparametrave si shpejtësia e të mësuarit, madhësia e grupit dhe numri i shtresave të fshehura në rrjet.

Përsëritni veprimet e mëparshme

Ju mund t'ju duhet t'i përsërisni këto procese më shumë se një herë për të marrë rezultatet më të mira. Do të varet nga vështirësia e problemit dhe kalibri i të dhënave.

Udhëzues për kodim

Gjuhët e programimit si Python, MATLAB, C++ dhe R mund të përdoren të gjithë për të krijuar modele të Difuzionit të Qëndrueshëm. Gjuha e përdorur do të mbështetet në aplikacionin e veçantë. Gjithashtu, mund të varet nga mjetet dhe bibliotekat e disponueshme për atë gjuhë.

Piton

Python është zgjidhja më e mirë në këtë rast. Ka biblioteka të forta si NumPy dhe SciPy për llogaritjen numerike. Gjithashtu, ai mbështet TensorFlow dhe PyTorch për krijimin dhe trajnimin e rrjeteve nervore. Prandaj, ai bëhet një opsion i shkëlqyeshëm për të shkruar modele të Difuzionit të Qëndrueshëm.

Shembull:

Le të përdorim ekuacionin e difuzionit, një formulë matematikore që përshkruan se si një cilësi ose sasi, si nxehtësia ose përqendrimi i një substance, ndryshon me kalimin e kohës në një sistem. Ekuacioni në përgjithësi duket si ky:

∂u/∂t = α ∇²u

Koeficienti i difuzionit () është një matje se sa lehtë një veti ose sasi përhapet nëpër një sistem.

Laplasiani i u (2u) është një përshkrim se si ndryshon vetia ose sasia në lidhje me hapësirën. Ku u është vetia ose sasia që shpërndahet (për shembull, temperatura ose përqendrimi), t është kalimi i kohës, është koeficienti i difuzionit dhe është konstanta e difuzionit ().

Mund ta zbatojmë duke përdorur metodën Euler në Python.

import numpy as np

# Define the diffusion coefficient

alpha = 0.1

# Define the initial condition (e.g. initial temperature or concentration)

u = np.ones(100)

# Time step

dt = 0.01

# Time-stepping loop

for t in range(1000):

# Compute the spatial derivative

du = np.diff(u)

# Update the value of u

u[1:] = u[1:] + alpha * du * dt

Ky kod përdor teknikën Euler për të zbatuar ekuacionin e difuzionit. Ai përshkruan gjendjen fillestare si një gjendje fillestare uniforme të përfaqësuar nga një grup prej tyre me formën e (100). 0.01 përdoret si hap kohor.

Problemi i difuzionit 1

Janë përfunduar 1000 përsëritje të ciklit të hapjes së kohës.

Ai përdor funksionin np.diff, i cili përcakton ndryshimin midis elementeve fqinjë. Prandaj, ai llogarit derivatin hapësinor të pronës ose sasisë që shpërndahet. Dhe, ai përfaqësohet nga du, në çdo përsëritje.

Pastaj e shumëzojmë derivatin hapësinor me koeficientin e difuzionit alfa dhe hapin kohor për të përditësuar vlerën e u.

Një shembull më kompleks

Si do të dukej një model i qëndrueshëm i difuzionit që mat vetëm difuzionin e qëndrueshëm të nxehtësisë? Si funksionon ai kod?

Problemi i difuzionit 2

Zgjidhja e një grupi ekuacionesh diferenciale të pjesshme (PDE) që shpjegojnë se si nxehtësia përhapet në një sistem me kalimin e kohës është e nevojshme. Pra, ne mund të trajnojmë një model të Difuzionit të Qëndrueshëm që përsërit shpërndarjen e qëndrueshme të nxehtësisë.

Këtu është një ilustrim se si ekuacioni i nxehtësisë, një PDE që shpjegon Difuzionin e Qëndrueshëm të nxehtësisë në një shufër njëdimensionale, mund të zgjidhet duke përdorur metodën e diferencës së fundme:

import numpy as np

import matplotlib.pyplot as plt

# Define the initial conditions

L = 1 # length of the rod

Nx = 10 # number of spatial grid points

dx = L / (Nx - 1) # spatial grid spacing

dt = 0.01 # time step

T = 1 # total time

# Set up the spatial grid

x = np.linspace(0, L, Nx)

# Set up the initial temperature field

T0 = np.zeros(Nx)

T0[0] = 100 # left boundary condition

T0[-1] = 0 # right boundary condition

# Set up the time loop

Tn = T0

for n in range(int(T / dt)):

Tnp1 = np.zeros(Nx)

Tnp1[0] = 100 # left boundary condition

Tnp1[-1] = 0 # right boundary condition

for i in range(1, Nx - 1):

Tnp1[i] = Tn[i] + dt * (Tn[i+1] - 2*Tn[i] + Tn[i-1]) / dx**2

Tn = Tnp1

# Plot the final temperature field

plt.plot(x, Tn)

plt.xlabel('x')

plt.ylabel('T(x)')

plt.show()

Rezultati i problemit të difuzionit

Si funksionon gjenerimi i imazhit nga teksti?

Meqenëse është mjaft popullor në internet, ne mund të kontrollojmë gjithashtu se si funksionon gjenerimi i imazhit.

Metodat e përpunimit të gjuhës natyrore (NLP) dhe rrjetet nervore. Dhe, ato përdoren shpesh për të siguruar një model të Difuzionit të Qëndrueshëm për konvertimin tekst-në-imazh. Një përshkrim i gjerë se si të realizohet është dhënë më poshtë:

1- Tokenizoni fjalët në të dhënat e tekstit dhe eliminoni fjalët ndaluese dhe shenjat e pikësimit. Shndërrojini fjalët në vlera numerike. Është pjesë e parapërpunimit (përfshirjet e fjalëve).

import nltk

from nltk.tokenize import word_tokenize

nltk.download('punkt')

# Pre-processing the text data

text = "a bird sitting on a flower. "

words = word_tokenize(text)

words = [word.lower() for word in words if word.isalpha()]

2- Mësoni si të lidhni tekstin dhe imazhet duke përdorur një rrjet nervor që kombinon një kodues dhe një dekoder. Rrjeti i dekoderit merr kodin latent si hyrje. Më pas, krijon fotografinë e lidhur pasi rrjeti i koduesit konverton të dhënat e tekstit në një paraqitje kompakte (kodi latent).

import tensorflow as tf

# Define the encoder model

encoder = tf.keras.Sequential()

encoder.add(tf.keras.layers.Embedding(input_dim=vocab_size,

output_dim=latent_dim))

encoder.add(tf.keras.layers.GRU(latent_dim))

encoder.add(tf.keras.layers.Dense(latent_dim))

# Define the decoder model

decoder = tf.keras.Sequential()

decoder.add(tf.keras.layers.Dense(latent_dim,

input_shape=(latent_dim,)))

decoder.add(tf.keras.layers.GRU(latent_dim))

decoder.add(tf.keras.layers.Dense(vocab_size))

# Combine the encoder and decoder into an end-to-end model

model = tf.keras.Sequential([encoder, decoder])

3- Duke i ofruar asaj një koleksion të konsiderueshëm imazhesh dhe përshkrimet e tekstit që vijnë me to. Më pas, mund të trajnoni rrjetin kodues-dekoder.

# Compile the model

model.compile(optimizer='adam',

loss='categorical_crossentropy')

# Train the model on the dataset

model.fit(X_train, y_train, epochs=10, batch_size=32)

4- Pasi rrjeti të jetë trajnuar, mund ta përdorni për të prodhuar foto nga futjet e reja të tekstit. Dhe, kjo është duke ushqyer tekstin në rrjetin e koduesit. Më pas, mund të prodhoni një kod latent dhe më pas të futni kodin latent në rrjetin e dekoderit për të prodhuar imazhin e lidhur.

# Encode the text input

latent_code = encoder.predict(text)

# Generate an image from the latent code

image = decoder.predict(latent_code)

5-Zgjedhja e funksioneve të përshtatshme të të dhënave dhe humbjes është një nga hapat më të rëndësishëm. Të dhënat janë të ndryshme dhe përmbajnë një gamë të gjerë fotografish dhe përshkrimesh teksti. Ne duam të sigurohemi që imazhet të jenë realiste. Gjithashtu, duhet të jemi të sigurt që përshkrimet e tekstit janë të realizueshme në mënyrë që të mund të dizajnojmë funksionin e humbjes.

# Define the loss function

loss = tf.losses.mean_squared_error(y_true, y_pred)

# Compile the model

model.compile(optimizer='adam', loss=loss)

# use diverse dataset

from sklearn.utils import shuffle

X_train, y_train = shuffle(X_train, y_train)

Së fundi, ju mund të eksperimentoni me arkitektura dhe metodologji të tjera. Pra, që ju mund të ngrini performancën e modelit, si p.sh mekanizmat e vëmendjes, GAN ose VAE.

Si të trajnohen modelet e difuzionit të qëndrueshëm

Si të trajnoni modelet e difuzionit të qëndrueshëm: Një udhëzues hap pas hapi