كيفية تدريب نماذج الانتشار المستقرة: دليل خطوة بخطوة

معظمنا على دراية بمولدات صور الذكاء الاصطناعي مثل انتشار مستقر. لقد غيرت الصناعة بالفعل وتم دمجها في حياتنا.

ومع ذلك ، فإن نماذج الانتشار المستقر هي أكثر بكثير من مجرد توليد للصور.

هناك العديد من المجالات التي يمكننا توظيفهم فيها.

نماذج الانتشار المستقر هي نماذج رياضية. ويمكنهم مساعدتك في استكشاف ديناميكيات الأنظمة المتغيرة بمرور الوقت.

وهي تستند إلى مفاهيم عملية الانتشار. ومن ثم ، يمكنك دراسة مجموعة واسعة من الظواهر. علي سبيل المثال؛ انتقال الحرارة والتفاعلات الكيميائية وانتشار المعلومات في الأسواق المالية.

انتشار مستقر

هذه النماذج قابلة للتكيف للغاية. لذلك ، يمكنك توقع الحالة المستقبلية للنظام بناءً على حالته الحالية.

إلى جانب ذلك ، يمكنك رؤية المبادئ المادية أو المالية الأساسية التي تحكمها. كان هذا المفهوم مفيدًا جدًا في العديد من المجالات. وتشمل هذه الفيزياء والكيمياء والتمويل.

هذا هو السبب في أننا نريد إجراء مزيد من التحقيق في الأمر. ونريد أن نقدم لك برنامجًا تعليميًا حول كيفية تدريب نماذج الانتشار المستقر هذه.

كيف نشأت نماذج الانتشار المستقرة؟

تعود جذور هذا إلى أواخر القرن التاسع عشر.

التحقيق الرياضي لعمليات الانتشار في الأمور هو المكان الذي بدأت فيه نماذج الانتشار المستقر. تعد معادلة فوكر بلانك واحدة من أشهر نماذج الانتشار المستقر.

تم تقديمه لأول مرة في عام 1906. تطورت هذه النماذج وتم تعديلها عبر الزمن. ومن ثم ، فإننا نستخدمها الآن في مجموعة متنوعة من الصناعات.

ما هو المنطق وراء ذلك؟

بعبارات بسيطة ، كما قلنا ، إنها نماذج رياضية. إلى جانب ذلك ، تساعدنا في التحقيق في كيفية انتشار خاصية أو كمية بمرور الوقت في النظام.

وهي تستند إلى مبادئ عملية الانتشار. لذا ، فهم يساعدوننا في التحقيق في كيفية انتشار الكمية عبر النظام. هذا الانتشار هو نتيجة للاختلافات في التركيز أو الضغط أو غيرها من المعلمات.

دعنا نعطي مثال بسيط. تخيل أن لديك وعاءًا مليئًا بالسائل الذي أضفت فيه الصبغة. يظهر الانتشار هنا عندما تبدأ الصبغة في التشتت والاستحلاب في السائل. استنادًا إلى خصائص السائل والصبغة ، يمكن استخدام نماذج الانتشار المستقر للتنبؤ بكيفية تشتت الصبغة واختلاطها بمرور الوقت.

في الأنظمة الأكثر تعقيدًا ، مثل الأسواق المالية أو التفاعلات الكيميائية ، يمكن لهذه النماذج أن تتنبأ بكيفية انتشار المعلومات أو السمات وتأثيرها على النظام بمرور الوقت. الى جانب ذلك ، قد تعتاد البيانات الكبيرة على تدريب هذه النماذج لعمل تنبؤات دقيقة. تم إنشاؤها باستخدام الصيغ الرياضية التي تصف تطور النظام على المدى الطويل.

إن فهم وتوقع انتشار سمات معينة في نظام ما عبر الزمن هو الفكرة الرئيسية الكامنة وراء هذه النماذج. من المهم أن تتذكر أن الخبراء في المجالات المتخصصة يستخدمون عادةً هذه النماذج.

كيف تدرب العارضين؟

اجمع وحضر بياناتك:

يجب عليك أولاً جمع وإعداد البيانات الخاصة بك قبل أن تتمكن من البدء في تدريب النموذج الخاص بك. قد تحتاج بياناتك للتنظيف والتنسيق. أيضًا ، قد يلزم أيضًا التخلص من الأرقام المفقودة.

حدد بنية النموذج

تأتي نماذج الانتشار المستقر في أشكال متنوعة. يعتمد في الغالب على معادلة فوكر بلانك ومعادلة شرودنغر والمعادلة الرئيسية. يجب اختيار النموذج الذي يتناسب بشكل أفضل مع وضعك الخاص. وبالتالي ، لكل من هذه النماذج مزايا وعيوب.

مفكرة Jupyter

إنشاء وظيفة الخسارة الخاصة بك

إنه مهم لأنه يؤثر على مدى مطابقة نموذجك للبيانات. بالنسبة لنماذج الانتشار المستقر ، فإن متوسط الخطأ التربيعي وتباعد Kullback-Leibler هما وظائف خسارة متكررة.

تدريب نموذجك

باستخدام النسب المتدرج العشوائي أو نهج تحسين مماثل ، يمكنك البدء في تدريب النموذج الخاص بك بعد تحديد وظيفة الخسارة الخاصة بك.

افحص قابلية تعميم نموذجك

يجب عليك التحقق من البيانات الجديدة بعد التدريب من خلال مقارنتها بمجموعة اختبار من البيانات.

اضبط المعلمات الفوقية الخاصة بنموذجك

لتحسين أداء النموذج الخاص بك ، قم بتجربة القيم المختلفة للمعلمات الفائقة مثل معدل التعلم وحجم الدفعة وعدد الطبقات المخفية في الشبكة.

كرر الإجراءات السابقة

قد تحتاج إلى تكرار هذه العمليات أكثر من مرة للحصول على أفضل النتائج. سوف يعتمد على صعوبة المشكلة وعيار البيانات.

دروس الترميز

لغات البرمجة مثل Python و MATLAB و C ++ و R يمكن استخدامها لإنشاء نماذج Stable Diffusion. ستعتمد اللغة المستخدمة على التطبيق المعين. أيضًا ، يمكن أن تعتمد على الأدوات والمكتبات المتاحة لتلك اللغة.

بايثون

بايثون هي الخيار الأفضل في هذه الحالة. لديها مكتبات قوية مثل NumPy و SciPy للحساب العددي. كما أنه يدعم TensorFlow و PyTorch لإنشاء وتدريب الشبكات العصبية. وبالتالي ، يصبح خيارًا رائعًا لكتابة نماذج Stable Diffusion.

على سبيل المثال:

دعنا نستخدم معادلة الانتشار ، وهي صيغة رياضية تصف كيف تتغير الجودة أو الكمية ، مثل الحرارة أو تركيز المادة ، بمرور الوقت في النظام. تبدو المعادلة عمومًا كما يلي:

∂u / ∂t = α ∇²u

معامل الانتشار () هو قياس مدى سهولة انتشار خاصية أو كمية عبر النظام.

Laplacian of u (2u) هو وصف لكيفية تغير الخاصية أو الكمية فيما يتعلق بالمساحة. عندما تكون u هي الخاصية أو الكمية التي يتم نشرها (على سبيل المثال ، درجة الحرارة أو التركيز) ، فإن t هو مرور الوقت ، وهو معامل الانتشار ، وهو ثابت الانتشار ().

يمكننا تنفيذه باستخدام طريقة أويلر في بايثون.

import numpy as np

# Define the diffusion coefficient

alpha = 0.1

# Define the initial condition (e.g. initial temperature or concentration)

u = np.ones(100)

# Time step

dt = 0.01

# Time-stepping loop

for t in range(1000):

# Compute the spatial derivative

du = np.diff(u)

# Update the value of u

u[1:] = u[1:] + alpha * du * dt

يستخدم هذا الرمز تقنية أويلر لتنفيذ معادلة الانتشار. يصف حالة البداية بأنها حالة أولية موحدة ممثلة بمصفوفة من تلك التي على شكل (100). يستخدم 0.01 كخطوة زمنية.

مشكلة الانتشار 1

تم الانتهاء من 1000 تكرار لحلقة الوقت.

تستخدم الدالة np.diff ، والتي تحدد الفرق بين العناصر المجاورة. ومن ثم ، فإنه يحسب المشتق المكاني للممتلكات أو الكمية التي يتم نشرها. وتمثلها du في كل تكرار.

ثم نضرب المشتق المكاني في معامل الانتشار ألفا والخطوة الزمنية لتحديث قيمة u.

مثال أكثر تعقيدًا

كيف سيبدو نموذج الانتشار المستقر الذي يقيس فقط انتشار الحرارة المستقر؟ كيف يعمل هذا الرمز؟

مشكلة الانتشار 2

من الضروري حل مجموعة من المعادلات التفاضلية الجزئية (PDEs) التي تشرح كيفية انتشار الحرارة عبر النظام بمرور الوقت. لذلك ، يمكننا تدريب نموذج الانتشار المستقر الذي يكرر الانتشار الثابت للحرارة.

فيما يلي توضيح لكيفية حل معادلة الحرارة ، PDE الذي يشرح الانتشار المستقر للحرارة في قضيب أحادي البعد ، باستخدام طريقة الفروق المحدودة:

import numpy as np

import matplotlib.pyplot as plt

# Define the initial conditions

L = 1 # length of the rod

Nx = 10 # number of spatial grid points

dx = L / (Nx - 1) # spatial grid spacing

dt = 0.01 # time step

T = 1 # total time

# Set up the spatial grid

x = np.linspace(0, L, Nx)

# Set up the initial temperature field

T0 = np.zeros(Nx)

T0[0] = 100 # left boundary condition

T0[-1] = 0 # right boundary condition

# Set up the time loop

Tn = T0

for n in range(int(T / dt)):

Tnp1 = np.zeros(Nx)

Tnp1[0] = 100 # left boundary condition

Tnp1[-1] = 0 # right boundary condition

for i in range(1, Nx - 1):

Tnp1[i] = Tn[i] + dt * (Tn[i+1] - 2*Tn[i] + Tn[i-1]) / dx**2

Tn = Tnp1

# Plot the final temperature field

plt.plot(x, Tn)

plt.xlabel('x')

plt.ylabel('T(x)')

plt.show()

نتيجة مشكلة الانتشار

كيف يتم إنشاء الصور من النص؟

نظرًا لأنها تحظى بشعبية كبيرة على الإنترنت ، يمكننا التحقق من كيفية عمل إنشاء الصور أيضًا.

طرق معالجة اللغة الطبيعية (NLP) و الشبكات العصبية. وكثيرًا ما يتم استخدامها لتوفير نموذج Stable Diffusion لتحويل النص إلى صورة. يتم توفير وصف واسع لكيفية تحقيق ذلك أدناه:

1- قم بترميز الكلمات الموجودة في بيانات النص ، وإزالة كلمات التوقف وعلامات الترقيم. حول الكلمات إلى قيم عددية. إنه جزء من المعالجة المسبقة (كلمة زينة).

import nltk

from nltk.tokenize import word_tokenize

nltk.download('punkt')

# Pre-processing the text data

text = "a bird sitting on a flower. "

words = word_tokenize(text)

words = [word.lower() for word in words if word.isalpha()]

2- تعلم كيفية ربط النص والصور باستخدام شبكة عصبية تجمع بين مشفر وفك ترميز. تستقبل شبكة وحدة فك التشفير الكود الكامن كمدخل. بعد ذلك ، يقوم بإنشاء الصورة المرتبطة بعد أن تقوم شبكة التشفير بتحويل البيانات النصية إلى تمثيل مضغوط (رمز كامن).

import tensorflow as tf

# Define the encoder model

encoder = tf.keras.Sequential()

encoder.add(tf.keras.layers.Embedding(input_dim=vocab_size,

output_dim=latent_dim))

encoder.add(tf.keras.layers.GRU(latent_dim))

encoder.add(tf.keras.layers.Dense(latent_dim))

# Define the decoder model

decoder = tf.keras.Sequential()

decoder.add(tf.keras.layers.Dense(latent_dim,

input_shape=(latent_dim,)))

decoder.add(tf.keras.layers.GRU(latent_dim))

decoder.add(tf.keras.layers.Dense(vocab_size))

# Combine the encoder and decoder into an end-to-end model

model = tf.keras.Sequential([encoder, decoder])

3- بتزويدها بمجموعة كبيرة من الصور والأوصاف النصية التي تترافق معها. بعد ذلك ، يمكنك تدريب شبكة وحدة فك التشفير.

# Compile the model

model.compile(optimizer='adam',

loss='categorical_crossentropy')

# Train the model on the dataset

model.fit(X_train, y_train, epochs=10, batch_size=32)

4- بعد تدريب الشبكة ، يمكنك استخدامها لإنتاج صور من مدخلات نصية جديدة. ويتم ذلك عن طريق تغذية النص في شبكة التشفير. بعد ذلك ، يمكنك إنتاج رمز كامن ، ثم تغذية الشفرة الكامنة في شبكة وحدة فك التشفير لإنتاج الصورة المرتبطة.

# Encode the text input

latent_code = encoder.predict(text)

# Generate an image from the latent code

image = decoder.predict(latent_code)

5- يعد اختيار مجموعة البيانات المناسبة ووظائف الخسارة من أهم الخطوات. مجموعة البيانات متنوعة وتحتوي على مجموعة كبيرة من الصور والأوصاف النصية. نريد التأكد من أن الصور واقعية. أيضًا ، نحتاج إلى التأكد من أن أوصاف النص ممكنة حتى نتمكن من تصميم دالة الخسارة.

# Define the loss function

loss = tf.losses.mean_squared_error(y_true, y_pred)

# Compile the model

model.compile(optimizer='adam', loss=loss)

# use diverse dataset

from sklearn.utils import shuffle

X_train, y_train = shuffle(X_train, y_train)

أخيرًا ، يمكنك تجربة البنى والمنهجيات الأخرى. لذلك ، يمكنك رفع أداء النموذج ، مثل آليات الانتباهأو GANs أو VAEs.