ਡਿਫਿਊਜ਼ਨ ਮਾਡਲ ਦੀ ਜਾਣ-ਪਛਾਣ

ਵਿਸ਼ਾ - ਸੂਚੀ[ਛੁਪਾਓ][ਦਿਖਾਓ]

ਡਿਫਿਊਜ਼ਨ ਮਾਡਲ ਕੀ ਹੈ?
ਡਿਫਿਊਜ਼ਨ ਮਾਡਲ ਵਿੱਚ ਡੂੰਘੀ ਡੁਬਕੀ+-
ਅੰਤਮ ਉਦੇਸ਼
ਡਿਫਿਊਜ਼ਨ ਮਾਡਲ ਦੇ ਲਾਭ
ਸਿੱਟਾ

ਹਾਲ ਹੀ ਦੇ ਸਾਲਾਂ ਵਿੱਚ, "ਡਿਫਿਊਜ਼ਨ ਮਾਡਲ" ਕਹੇ ਜਾਂਦੇ ਜਨਰੇਟਿਵ ਮਾਡਲ ਤੇਜ਼ੀ ਨਾਲ ਪ੍ਰਸਿੱਧ ਹੋ ਗਏ ਹਨ, ਅਤੇ ਚੰਗੇ ਕਾਰਨ ਨਾਲ।

ਦੁਨੀਆ ਨੇ ਦੇਖਿਆ ਹੈ ਕਿ ਫੈਲਣ ਵਾਲੇ ਮਾਡਲ ਕੀ ਕਰਨ ਦੇ ਸਮਰੱਥ ਹਨ, ਜਿਵੇਂ ਕਿ ਤਸਵੀਰ ਸੰਸ਼ਲੇਸ਼ਣ 'ਤੇ GAN ਨੂੰ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਨਾ, ਸਿਰਫ 2020 ਅਤੇ 2021 ਦੇ ਦਹਾਕੇ ਵਿੱਚ ਪ੍ਰਕਾਸ਼ਿਤ ਕੁਝ ਚੋਣਵੇਂ ਇਤਿਹਾਸਕ ਪ੍ਰਕਾਸ਼ਨਾਂ ਲਈ ਧੰਨਵਾਦ।

ਪ੍ਰੈਕਟੀਸ਼ਨਰਾਂ ਨੇ ਹਾਲ ਹੀ ਵਿੱਚ ਫੈਲਣ ਵਾਲੇ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਦੇਖੀ ਹੈ FROM-E 2, OpenAI ਦਾ ਚਿੱਤਰ ਨਿਰਮਾਣ ਮਾਡਲ ਜੋ ਪਿਛਲੇ ਮਹੀਨੇ ਪ੍ਰਕਾਸ਼ਿਤ ਕੀਤਾ ਗਿਆ ਸੀ.

ਬਹੁਤ ਸਾਰੇ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਪ੍ਰੈਕਟੀਸ਼ਨਰ ਬਿਨਾਂ ਸ਼ੱਕ ਡਿਫਿਊਜ਼ਨ ਮਾਡਲਾਂ ਦੇ ਅੰਦਰੂਨੀ ਕੰਮਕਾਜ ਨੂੰ ਲੈ ਕੇ ਉਤਸੁਕ ਹਨ, ਕਿਉਂਕਿ ਉਹਨਾਂ ਦੀ ਹਾਲੀਆ ਸਫਲਤਾ ਦੇ ਮੱਦੇਨਜ਼ਰ।

ਇਸ ਪੋਸਟ ਵਿੱਚ, ਅਸੀਂ ਡਿਫਿਊਜ਼ਨ ਮਾਡਲਾਂ, ਉਹਨਾਂ ਦੇ ਡਿਜ਼ਾਈਨ, ਉਹਨਾਂ ਦੇ ਫਾਇਦੇ ਅਤੇ ਹੋਰ ਬਹੁਤ ਕੁਝ ਦੇ ਸਿਧਾਂਤਕ ਅਧਾਰਾਂ ਨੂੰ ਦੇਖਾਂਗੇ। ਚਲੋ ਚੱਲੀਏ।

ਡਿਫਿਊਜ਼ਨ ਮਾਡਲ ਕੀ ਹੈ?

ਆਉ ਇਹ ਪਤਾ ਲਗਾ ਕੇ ਸ਼ੁਰੂ ਕਰੀਏ ਕਿ ਇਸ ਮਾਡਲ ਨੂੰ ਪ੍ਰਸਾਰ ਮਾਡਲ ਕਿਉਂ ਕਿਹਾ ਜਾਂਦਾ ਹੈ।

ਭੌਤਿਕ ਵਿਗਿਆਨ ਦੀਆਂ ਕਲਾਸਾਂ ਵਿੱਚ ਥਰਮੋਡਾਇਨਾਮਿਕਸ ਨਾਲ ਸਬੰਧਤ ਇੱਕ ਸ਼ਬਦ ਨੂੰ ਪ੍ਰਸਾਰ ਕਿਹਾ ਜਾਂਦਾ ਹੈ। ਇੱਕ ਸਿਸਟਮ ਸੰਤੁਲਨ ਵਿੱਚ ਨਹੀਂ ਹੁੰਦਾ ਜੇਕਰ ਇੱਕ ਸਮੱਗਰੀ ਦੀ ਇੱਕ ਵੱਡੀ ਤਵੱਜੋ ਹੁੰਦੀ ਹੈ, ਜਿਵੇਂ ਕਿ ਇੱਕ ਸੁਗੰਧ, ਇੱਕ ਸਥਾਨ ਵਿੱਚ।

ਸਿਸਟਮ ਨੂੰ ਸੰਤੁਲਨ ਵਿੱਚ ਦਾਖਲ ਹੋਣ ਲਈ ਫੈਲਾਉਣਾ ਲਾਜ਼ਮੀ ਹੈ। ਸੁਗੰਧ ਦੇ ਅਣੂ ਉੱਚ ਸੰਘਣਤਾ ਵਾਲੇ ਖੇਤਰ ਤੋਂ ਪੂਰੇ ਸਿਸਟਮ ਵਿੱਚ ਫੈਲਦੇ ਹਨ, ਜਿਸ ਨਾਲ ਸਿਸਟਮ ਨੂੰ ਇੱਕਸਾਰ ਹੋ ਜਾਂਦਾ ਹੈ।

ਹਰ ਚੀਜ਼ ਅੰਤ ਵਿੱਚ ਫੈਲਣ ਕਾਰਨ ਸਮਰੂਪ ਹੋ ਜਾਂਦੀ ਹੈ।

ਡਿਫਿਊਜ਼ਨ ਮਾਡਲ ਇਸ ਥਰਮੋਡਾਇਨਾਮਿਕ ਗੈਰ-ਸੰਤੁਲਨ ਸਥਿਤੀ ਦੁਆਰਾ ਪ੍ਰੇਰਿਤ ਹੁੰਦੇ ਹਨ। ਡਿਫਿਊਜ਼ਨ ਮਾਡਲ ਮਾਰਕੋਵ ਚੇਨ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ, ਜੋ ਕਿ ਵੇਰੀਏਬਲਾਂ ਦੀ ਇੱਕ ਲੜੀ ਹੈ ਜਿੱਥੇ ਹਰੇਕ ਵੇਰੀਏਬਲ ਦਾ ਮੁੱਲ ਪਿਛਲੀ ਘਟਨਾ ਦੀ ਸਥਿਤੀ 'ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ।

ਇੱਕ ਤਸਵੀਰ ਲੈਂਦੇ ਹੋਏ, ਅਸੀਂ ਅੱਗੇ ਫੈਲਣ ਦੇ ਪੂਰੇ ਪੜਾਅ ਦੌਰਾਨ ਇਸ ਵਿੱਚ ਲਗਾਤਾਰ ਇੱਕ ਖਾਸ ਮਾਤਰਾ ਵਿੱਚ ਸ਼ੋਰ ਜੋੜਦੇ ਹਾਂ।

ਰੌਲੇ-ਰੱਪੇ ਵਾਲੇ ਚਿੱਤਰ ਨੂੰ ਸਟੋਰ ਕਰਨ ਤੋਂ ਬਾਅਦ, ਅਸੀਂ ਵਾਧੂ ਰੌਲੇ ਦੀ ਸ਼ੁਰੂਆਤ ਕਰਕੇ ਲੜੀ ਵਿੱਚ ਅਗਲੀ ਚਿੱਤਰ ਬਣਾਉਣ ਲਈ ਅੱਗੇ ਵਧਦੇ ਹਾਂ।

ਕਈ ਵਾਰ, ਇਹ ਵਿਧੀ ਕੀਤੀ ਜਾਂਦੀ ਹੈ. ਇਸ ਵਿਧੀ ਨੂੰ ਕਈ ਵਾਰ ਦੁਹਰਾਉਣ ਦੇ ਨਤੀਜੇ ਵਜੋਂ ਇੱਕ ਸ਼ੁੱਧ ਸ਼ੋਰ ਤਸਵੀਰ.

ਫਿਰ ਅਸੀਂ ਇਸ ਬੇਢੰਗੇ ਚਿੱਤਰ ਤੋਂ ਇੱਕ ਤਸਵੀਰ ਕਿਵੇਂ ਬਣਾ ਸਕਦੇ ਹਾਂ?

ਫੈਲਣ ਦੀ ਪ੍ਰਕਿਰਿਆ ਨੂੰ a ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਉਲਟਾ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ ਨਿਊਰਲ ਨੈਟਵਰਕ. ਟੀ ਤੋਂ ਟੀ-1 ਤੱਕ ਤਸਵੀਰ ਬਣਾਉਣ ਲਈ ਬੈਕਵਰਡ ਡਿਫਿਊਜ਼ਨ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਇੱਕੋ ਨੈੱਟਵਰਕ ਅਤੇ ਉਹੀ ਵਜ਼ਨ ਵਰਤੇ ਜਾਂਦੇ ਹਨ।

ਨੈੱਟਵਰਕ ਨੂੰ ਤਸਵੀਰ ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾਉਣ ਦੀ ਬਜਾਏ, ਕੋਈ ਵੀ ਹਰ ਪੜਾਅ 'ਤੇ ਰੌਲੇ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਸਕਦਾ ਹੈ, ਜਿਸ ਨੂੰ ਚਿੱਤਰ ਤੋਂ ਹਟਾਇਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ, ਤਾਂ ਜੋ ਕੰਮ ਨੂੰ ਹੋਰ ਸਰਲ ਬਣਾਇਆ ਜਾ ਸਕੇ।

ਕਿਸੇ ਵੀ ਸਥਿਤੀ ਵਿੱਚ, ਦ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਡਿਜ਼ਾਈਨ ਅਜਿਹੇ ਤਰੀਕੇ ਨਾਲ ਚੁਣਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ ਜੋ ਡਾਟਾ ਅਯਾਮ ਨੂੰ ਕਾਇਮ ਰੱਖੇ।

ਡਿਫਿਊਜ਼ਨ ਮਾਡਲ ਵਿੱਚ ਡੂੰਘੀ ਡੁਬਕੀ

ਇੱਕ ਫੈਲਾਅ ਮਾਡਲ ਦੇ ਭਾਗ ਇੱਕ ਅੱਗੇ ਦੀ ਪ੍ਰਕਿਰਿਆ (ਇੱਕ ਪ੍ਰਸਾਰ ਪ੍ਰਕਿਰਿਆ ਵਜੋਂ ਵੀ ਜਾਣੀ ਜਾਂਦੀ ਹੈ), ਜਿਸ ਵਿੱਚ ਇੱਕ ਡੈਟਮ (ਅਕਸਰ ਇੱਕ ਚਿੱਤਰ) ਹੌਲੀ-ਹੌਲੀ ਸ਼ੋਰ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਅਤੇ ਇੱਕ ਉਲਟ ਪ੍ਰਕਿਰਿਆ (ਇੱਕ ਰਿਵਰਸ ਫੈਲਾਅ ਪ੍ਰਕਿਰਿਆ ਵਜੋਂ ਵੀ ਜਾਣੀ ਜਾਂਦੀ ਹੈ), ਜਿਸ ਵਿੱਚ ਸ਼ੋਰ ਹੁੰਦਾ ਹੈ। ਟੀਚੇ ਦੀ ਵੰਡ ਤੋਂ ਇੱਕ ਨਮੂਨੇ ਵਿੱਚ ਵਾਪਸ ਬਦਲਿਆ ਗਿਆ।

ਜਦੋਂ ਸ਼ੋਰ ਦਾ ਪੱਧਰ ਕਾਫ਼ੀ ਘੱਟ ਹੁੰਦਾ ਹੈ, ਤਾਂ ਅੱਗੇ ਦੀ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਨਮੂਨਾ ਚੇਨ ਪਰਿਵਰਤਨ ਸਥਾਪਤ ਕਰਨ ਲਈ ਕੰਡੀਸ਼ਨਲ ਗੌਸੀਅਨ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ। ਇਸ ਗਿਆਨ ਨੂੰ ਮਾਰਕੋਵ ਧਾਰਨਾ ਨਾਲ ਜੋੜਨ ਦੇ ਨਤੀਜੇ ਵਜੋਂ ਅੱਗੇ ਦੀ ਪ੍ਰਕਿਰਿਆ ਦਾ ਇੱਕ ਆਸਾਨ ਪੈਰਾਮੀਟਰਾਈਜ਼ੇਸ਼ਨ:

q(x1:T |x0) := YT t=1 q(xt|xt−1), q(xt|xt−1) := N (xt; p 1 − βtxt−1, βtI)

ਇੱਥੇ ਇੱਕ….T ਇੱਕ ਪਰਿਵਰਤਨ ਅਨੁਸੂਚੀ (ਜਾਂ ਤਾਂ ਸਿੱਖੀ ਜਾਂ ਸਥਿਰ) ਹੈ ਜੋ ਇਹ ਭਰੋਸਾ ਦਿਵਾਉਂਦੀ ਹੈ, ਕਾਫ਼ੀ ਉੱਚ ਟੀ ਲਈ, ਕਿ xT ਅਸਲ ਵਿੱਚ ਇੱਕ ਆਈਸੋਟ੍ਰੋਪਿਕ ਗੌਸੀਅਨ ਹੈ।

ਵੱਡੇ ਟੀ

ਉਲਟ ਪ੍ਰਕਿਰਿਆ ਉਹ ਹੈ ਜਿੱਥੇ ਫੈਲਾਅ ਮਾਡਲ ਜਾਦੂ ਹੁੰਦਾ ਹੈ। ਮਾਡਲ ਤਾਜ਼ਾ ਡੇਟਾ ਪੈਦਾ ਕਰਨ ਲਈ ਸਿਖਲਾਈ ਦੌਰਾਨ ਇਸ ਪ੍ਰਸਾਰ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਉਲਟਾਉਣਾ ਸਿੱਖਦਾ ਹੈ। ਮਾਡਲ ਸੰਯੁਕਤ ਵੰਡ ਨੂੰ ਇਸ ਤਰ੍ਹਾਂ ਸਿੱਖਦਾ ਹੈ (x0:T) ਸ਼ੁੱਧ ਗੌਸੀ ਸ਼ੋਰ ਸਮੀਕਰਨ ਨਾਲ ਸ਼ੁਰੂ ਕਰਨ ਦਾ ਨਤੀਜਾ

(xT):=N(xT,0,I)।

pθ(x0:T ) := p(xT ) YT t=1 pθ(xt−1|xt), pθ(xt−1|xt) := N (xt−1; µθ (xt, t), Σθ( xt, t))

ਜਿੱਥੇ ਗੌਸੀਅਨ ਪਰਿਵਰਤਨ ਦੇ ਸਮੇਂ-ਨਿਰਭਰ ਪੈਰਾਮੀਟਰਾਂ ਦੀ ਖੋਜ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਖਾਸ ਤੌਰ 'ਤੇ, ਇਸ ਗੱਲ ਵੱਲ ਧਿਆਨ ਦਿਓ ਕਿ ਮਾਰਕੋਵ ਫਾਰਮੂਲੇਸ਼ਨ ਕਿਵੇਂ ਦੱਸਦੀ ਹੈ ਕਿ ਦਿੱਤੀ ਗਈ ਰਿਵਰਸ ਡਿਫਿਊਜ਼ਨ ਟ੍ਰਾਂਜਿਸ਼ਨ ਡਿਸਟ੍ਰੀਬਿਊਸ਼ਨ ਸਿਰਫ਼ ਪੁਰਾਣੇ ਟਾਈਮਸਟੈਪ (ਜਾਂ ਬਾਅਦ ਦੇ ਟਾਈਮਸਟੈਪ, ਇਸ ਗੱਲ 'ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ ਕਿ ਤੁਸੀਂ ਇਸ ਨੂੰ ਕਿਵੇਂ ਦੇਖਦੇ ਹੋ):

pθ(xt−1|xt) := N (xt−1; µθ (xt, t), Σθ(xt, t))

ਮਾਡਲ ਸਿਖਲਾਈ

ਇੱਕ ਉਲਟ ਮਾਰਕੋਵ ਮਾਡਲ ਜੋ ਸਿਖਲਾਈ ਡੇਟਾ ਦੀ ਸੰਭਾਵਨਾ ਨੂੰ ਵੱਧ ਤੋਂ ਵੱਧ ਕਰਦਾ ਹੈ, ਇੱਕ ਪ੍ਰਸਾਰ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ। ਵਿਹਾਰਕ ਤੌਰ 'ਤੇ, ਸਿਖਲਾਈ ਨੈਗੇਟਿਵ ਲੌਗ ਸੰਭਾਵਨਾ 'ਤੇ ਪਰਿਵਰਤਨਸ਼ੀਲ ਉਪਰਲੀ ਸੀਮਾ ਨੂੰ ਘਟਾਉਣ ਦੇ ਸਮਾਨ ਹੈ।

E [− log pθ(x0)] ≤ Eq − log pθ(x0:T ) q(x1:T |x0) = Eq − log p(xT ) − X t≥1 log pθ(xt−1|xt) q (xt|xt−1) =: L

ਮਾਡਲ

ਸਾਨੂੰ ਹੁਣ ਇਹ ਫੈਸਲਾ ਕਰਨ ਦੀ ਲੋੜ ਹੈ ਕਿ ਸਾਡੇ ਟੀਚੇ ਫੰਕਸ਼ਨ ਦੇ ਗਣਿਤਿਕ ਆਧਾਰ ਨੂੰ ਸਥਾਪਿਤ ਕਰਨ ਤੋਂ ਬਾਅਦ ਸਾਡੇ ਡਿਫਿਊਜ਼ਨ ਮਾਡਲ ਨੂੰ ਕਿਵੇਂ ਲਾਗੂ ਕਰਨਾ ਹੈ। ਅਗਾਂਹਵਧੂ ਪ੍ਰਕਿਰਿਆ ਲਈ ਲੋੜੀਂਦਾ ਇੱਕੋ-ਇੱਕ ਫੈਸਲਾ ਵੇਰੀਏਂਸ ਅਨੁਸੂਚੀ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰ ਰਿਹਾ ਹੈ, ਜਿਸ ਦੇ ਮੁੱਲ ਆਮ ਤੌਰ 'ਤੇ ਪ੍ਰਕਿਰਿਆ ਦੌਰਾਨ ਵਧਦੇ ਹਨ।

ਅਸੀਂ ਉਲਟ ਪ੍ਰਕਿਰਿਆ ਲਈ ਗੌਸੀ ਡਿਸਟ੍ਰੀਬਿਊਸ਼ਨ ਪੈਰਾਮੀਟਰਾਈਜ਼ੇਸ਼ਨ ਅਤੇ ਮਾਡਲ ਆਰਕੀਟੈਕਚਰ ਦੀ ਵਰਤੋਂ ਕਰਨ 'ਤੇ ਜ਼ੋਰ ਦਿੰਦੇ ਹਾਂ।

ਸਾਡੇ ਡਿਜ਼ਾਇਨ ਦੀ ਇਕੋ ਸ਼ਰਤ ਇਹ ਹੈ ਕਿ ਇਨਪੁਟ ਅਤੇ ਆਉਟਪੁੱਟ ਦੋਵਾਂ ਦੇ ਮਾਪ ਇੱਕੋ ਹਨ। ਇਹ ਅਜ਼ਾਦੀ ਦੀ ਵਿਸ਼ਾਲ ਡਿਗਰੀ ਨੂੰ ਰੇਖਾਂਕਿਤ ਕਰਦਾ ਹੈ ਜੋ ਡਿਫਿਊਜ਼ਨ ਮਾਡਲ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ।

ਹੇਠਾਂ, ਅਸੀਂ ਇਹਨਾਂ ਵਿਕਲਪਾਂ ਬਾਰੇ ਵਧੇਰੇ ਡੂੰਘਾਈ ਵਿੱਚ ਜਾਵਾਂਗੇ।

ਅੱਗੇ ਦੀ ਪ੍ਰਕਿਰਿਆ

ਸਾਨੂੰ ਅੱਗੇ ਦੀ ਪ੍ਰਕਿਰਿਆ ਦੇ ਸਬੰਧ ਵਿੱਚ ਪਰਿਵਰਤਨ ਅਨੁਸੂਚੀ ਪ੍ਰਦਾਨ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ। ਅਸੀਂ ਉਹਨਾਂ ਨੂੰ ਖਾਸ ਤੌਰ 'ਤੇ ਸਮਾਂ-ਨਿਰਭਰ ਸਥਿਰਾਂਕ ਵਜੋਂ ਸੈੱਟ ਕੀਤਾ ਹੈ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਸਿੱਖਣ ਦੀ ਸੰਭਾਵਨਾ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਕੀਤਾ ਹੈ। ਤੋਂ ਇੱਕ ਕਾਲਕ੍ਰਮਿਕ ਅਨੁਸੂਚੀ

β1 = 10−4 ਤੋਂ βT = 0.02.

Lt ਨਿਸ਼ਚਿਤ ਪਰਿਵਰਤਨ ਅਨੁਸੂਚੀ ਦੇ ਕਾਰਨ ਸਿੱਖਣਯੋਗ ਮਾਪਦੰਡਾਂ ਦੇ ਸਾਡੇ ਸੈੱਟ ਦੇ ਸਬੰਧ ਵਿੱਚ ਇੱਕ ਸਥਿਰ ਬਣ ਜਾਂਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਅਸੀਂ ਸਿਖਲਾਈ ਦੌਰਾਨ ਇਸ ਨੂੰ ਅਣਡਿੱਠ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦੇ ਹਾਂ, ਚਾਹੇ ਚੁਣੇ ਗਏ ਖਾਸ ਮੁੱਲਾਂ ਦੀ ਪਰਵਾਹ ਕੀਤੇ ਬਿਨਾਂ।

ਉਲਟ ਪ੍ਰਕਿਰਿਆ

ਅਸੀਂ ਹੁਣ ਉਲਟ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨ ਲਈ ਲੋੜੀਂਦੇ ਫੈਸਲਿਆਂ 'ਤੇ ਜਾਂਦੇ ਹਾਂ। ਯਾਦ ਰੱਖੋ ਕਿ ਅਸੀਂ ਰਿਵਰਸ ਮਾਰਕੋਵ ਪਰਿਵਰਤਨ ਨੂੰ ਗੌਸੀਅਨ ਵਜੋਂ ਕਿਵੇਂ ਦਰਸਾਇਆ:

pθ(xt−1|xt) := N (xt−1; µθ (xt, t), Σθ(xt, t))

ਹੁਣ ਜਦੋਂ ਅਸੀਂ ਕਾਰਜਸ਼ੀਲ ਕਿਸਮਾਂ ਦੀ ਪਛਾਣ ਕਰ ਲਈ ਹੈ. ਇਸ ਤੱਥ ਦੇ ਬਾਵਜੂਦ ਕਿ ਪੈਰਾਮੀਟਰਾਈਜ਼ ਕਰਨ ਲਈ ਹੋਰ ਗੁੰਝਲਦਾਰ ਤਕਨੀਕਾਂ ਹਨ, ਅਸੀਂ ਹੁਣੇ ਸੈੱਟ ਕੀਤਾ ਹੈ

Σθ(xt, t) = σ 2 t I

σ 2 t = βt

ਇਸ ਨੂੰ ਹੋਰ ਤਰੀਕੇ ਨਾਲ ਕਹਿਣ ਲਈ, ਅਸੀਂ ਮਲਟੀਵੈਰੀਏਟ ਗੌਸੀਅਨ ਨੂੰ ਇੱਕੋ ਵੇਰੀਏਂਸ ਵਾਲੇ ਵੱਖਰੇ ਗੌਸੀਅਨ ਦਾ ਨਤੀਜਾ ਮੰਨਦੇ ਹਾਂ, ਇੱਕ ਵੇਰੀਏਂਸ ਮੁੱਲ ਜੋ ਸਮੇਂ ਦੇ ਨਾਲ ਉਤਰਾਅ-ਚੜ੍ਹਾਅ ਕਰ ਸਕਦਾ ਹੈ। ਇਹ ਭਟਕਣਾਵਾਂ ਫਾਰਵਰਡਿੰਗ ਪ੍ਰਕਿਰਿਆ ਦੇ ਭਟਕਣ ਦੀ ਸਮਾਂ-ਸਾਰਣੀ ਨਾਲ ਮੇਲ ਕਰਨ ਲਈ ਸੈੱਟ ਕੀਤੀਆਂ ਗਈਆਂ ਹਨ।

ਇਸ ਨਵੇਂ ਫਾਰਮੂਲੇ ਦੇ ਨਤੀਜੇ ਵਜੋਂ, ਸਾਡੇ ਕੋਲ:

pθ(xt−1|xt) := N (xt−1; µθ (xt, t), Σθ(xt, t)):=N (xt−1; µθ (xt, t), σ2 t I)

ਇਸ ਦੇ ਨਤੀਜੇ ਵਜੋਂ ਹੇਠਾਂ ਦਿਖਾਇਆ ਗਿਆ ਵਿਕਲਪਿਕ ਨੁਕਸਾਨ ਫੰਕਸ਼ਨ ਹੁੰਦਾ ਹੈ, ਜੋ ਲੇਖਕਾਂ ਨੇ ਵਧੇਰੇ ਇਕਸਾਰ ਸਿਖਲਾਈ ਅਤੇ ਵਧੀਆ ਨਤੀਜੇ ਪੈਦਾ ਕਰਨ ਲਈ ਪਾਇਆ:

Lsimple(θ):= Et,x0, h − θ( √ α¯tx0 + √ 1 − α¯t, t) 2

ਲੇਖਕ ਫੈਲਣ ਵਾਲੇ ਮਾਡਲਾਂ ਅਤੇ ਲੈਂਗੇਵਿਨ-ਅਧਾਰਤ ਸਕੋਰ-ਮੈਚਿੰਗ ਜਨਰੇਟਿਵ ਮਾਡਲਾਂ ਦੇ ਇਸ ਫਾਰਮੂਲੇ ਦੇ ਵਿਚਕਾਰ ਸਬੰਧ ਵੀ ਖਿੱਚਦੇ ਹਨ। ਤਰੰਗ-ਅਧਾਰਤ ਕੁਆਂਟਮ ਭੌਤਿਕ ਵਿਗਿਆਨ ਅਤੇ ਮੈਟ੍ਰਿਕਸ-ਅਧਾਰਤ ਕੁਆਂਟਮ ਮਕੈਨਿਕਸ ਦੇ ਸੁਤੰਤਰ ਅਤੇ ਸਮਾਨਾਂਤਰ ਵਿਕਾਸ ਦੇ ਨਾਲ, ਜਿਸ ਨੇ ਇੱਕੋ ਵਰਤਾਰੇ ਦੇ ਦੋ ਤੁਲਨਾਤਮਕ ਫਾਰਮੂਲੇ ਪ੍ਰਗਟ ਕੀਤੇ, ਇਹ ਪ੍ਰਤੀਤ ਹੁੰਦਾ ਹੈ ਕਿ ਡਿਫਿਊਜ਼ਨ ਮਾਡਲ ਅਤੇ ਸਕੋਰ-ਆਧਾਰਿਤ ਮਾਡਲ ਇੱਕੋ ਸਿੱਕੇ ਦੇ ਦੋ ਪਹਿਲੂ ਹੋ ਸਕਦੇ ਹਨ।

ਨੈੱਟਵਰਕ ਆਰਕੀਟੈਕਚਰ

ਇਸ ਤੱਥ ਦੇ ਬਾਵਜੂਦ ਕਿ ਸਾਡੇ ਸੰਘਣੇ ਨੁਕਸਾਨ ਫੰਕਸ਼ਨ ਦਾ ਉਦੇਸ਼ ਇੱਕ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣਾ ਹੈ ਸ, ਅਸੀਂ ਅਜੇ ਵੀ ਇਸ ਮਾਡਲ ਦੇ ਆਰਕੀਟੈਕਚਰ 'ਤੇ ਫੈਸਲਾ ਨਹੀਂ ਕੀਤਾ ਹੈ। ਇਹ ਗੱਲ ਧਿਆਨ ਵਿੱਚ ਰੱਖੋ ਕਿ ਮਾਡਲ ਵਿੱਚ ਇੱਕੋ ਜਿਹੇ ਇੰਪੁੱਟ ਅਤੇ ਆਉਟਪੁੱਟ ਮਾਪ ਹੋਣੇ ਚਾਹੀਦੇ ਹਨ।

ਇਸ ਰੁਕਾਵਟ ਦੇ ਮੱਦੇਨਜ਼ਰ, ਇਹ ਸ਼ਾਇਦ ਅਚਾਨਕ ਨਹੀਂ ਹੈ ਕਿ ਯੂ-ਨੈੱਟ-ਵਰਗੇ ਆਰਕੀਟੈਕਚਰ ਅਕਸਰ ਤਸਵੀਰ ਦੇ ਪ੍ਰਸਾਰ ਮਾਡਲਾਂ ਨੂੰ ਬਣਾਉਣ ਲਈ ਵਰਤੇ ਜਾਂਦੇ ਹਨ।

ਨੈੱਟਵਰਕ ਆਰਕੀਟੈਕਚਰ

ਲਗਾਤਾਰ ਕੰਡੀਸ਼ਨਲ ਗੌਸੀਅਨ ਡਿਸਟ੍ਰੀਬਿਊਸ਼ਨ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਉਲਟ ਪ੍ਰਕਿਰਿਆ ਦੇ ਰੂਟ ਦੇ ਨਾਲ ਕਈ ਬਦਲਾਅ ਕੀਤੇ ਜਾਂਦੇ ਹਨ। ਯਾਦ ਰੱਖੋ ਕਿ ਉਲਟ ਪ੍ਰਕਿਰਿਆ ਦਾ ਟੀਚਾ ਪੂਰਨ ਅੰਕ ਪਿਕਸਲ ਮੁੱਲਾਂ ਦੀ ਬਣੀ ਤਸਵੀਰ ਬਣਾਉਣਾ ਹੈ। ਇਸ ਲਈ ਸਾਰੇ ਪਿਕਸਲ ਉੱਤੇ ਹਰੇਕ ਸੰਭਾਵੀ ਪਿਕਸਲ ਵੈਲਯੂ ਲਈ ਵੱਖਰੀ (ਲੌਗ) ਸੰਭਾਵਨਾਵਾਂ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰਨਾ ਜ਼ਰੂਰੀ ਹੈ।

ਇਹ ਰਿਵਰਸ ਡਿਫਿਊਜ਼ਨ ਚੇਨ ਦੇ ਆਖਰੀ ਪਰਿਵਰਤਨ ਲਈ ਇੱਕ ਵੱਖਰਾ ਡਿਸਕ੍ਰਿਟ ਡੀਕੋਡਰ ਨਿਰਧਾਰਤ ਕਰਕੇ ਪੂਰਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਕਿਸੇ ਖਾਸ ਚਿੱਤਰ ਦੀ ਸੰਭਾਵਨਾ ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾਉਣਾ x0 ਨੂੰ ਦਿੱਤਾ x1.

pθ(x0|x1) = YD i=1 Z δ+(xi 0 ) δ−(xi 0 ) N (x; µ i θ (x1, 1), σ2 1 ) dx

δ+(x) = ∞ ਜੇ x = 1 x + 1 255 ਜੇ x < 1 δ−(x) = −∞ ਜੇ x = −1 x − 1 255 ਜੇ x > −1

ਜਿੱਥੇ ਸੁਪਰਸਕ੍ਰਿਪਟ I ਇੱਕ ਕੋਆਰਡੀਨੇਟ ਦੇ ਐਕਸਟਰੈਕਸ਼ਨ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ ਅਤੇ D ਡੇਟਾ ਵਿੱਚ ਮਾਪਾਂ ਦੀ ਸੰਖਿਆ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ।

ਇਸ ਬਿੰਦੂ 'ਤੇ ਉਦੇਸ਼ ਸਮੇਂ-ਭਿੰਨਤਾ ਵਿੱਚ ਉਸ ਪਿਕਸਲ ਲਈ ਸੰਭਾਵੀ ਮੁੱਲਾਂ ਦੀ ਵੰਡ ਦੇ ਮੱਦੇਨਜ਼ਰ ਇੱਕ ਖਾਸ ਪਿਕਸਲ ਲਈ ਹਰੇਕ ਪੂਰਨ ਅੰਕ ਮੁੱਲ ਦੀ ਸੰਭਾਵਨਾ ਨੂੰ ਸਥਾਪਤ ਕਰਨਾ ਹੈ t=1।

ਅੰਤਮ ਉਦੇਸ਼

ਸਭ ਤੋਂ ਵੱਡੇ ਨਤੀਜੇ, ਵਿਗਿਆਨੀਆਂ ਦੇ ਅਨੁਸਾਰ, ਇੱਕ ਨਿਸ਼ਚਤ ਸਮੇਂ ਦੇ ਪੜਾਅ 'ਤੇ ਇੱਕ ਤਸਵੀਰ ਦੇ ਸ਼ੋਰ ਦੇ ਹਿੱਸੇ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਤੋਂ ਆਏ ਹਨ। ਅੰਤ ਵਿੱਚ, ਉਹ ਹੇਠਾਂ ਦਿੱਤੇ ਟੀਚੇ ਨੂੰ ਨਿਯੁਕਤ ਕਰਦੇ ਹਨ:

Lsimple(θ):= Et,x0, h − θ( √ α¯tx0 + √ 1 − α¯t, t) 2

ਹੇਠਾਂ ਦਿੱਤੀ ਤਸਵੀਰ ਵਿੱਚ, ਸਾਡੇ ਪ੍ਰਸਾਰ ਮਾਡਲ ਲਈ ਸਿਖਲਾਈ ਅਤੇ ਨਮੂਨਾ ਲੈਣ ਦੀਆਂ ਪ੍ਰਕਿਰਿਆਵਾਂ ਨੂੰ ਸੰਖੇਪ ਰੂਪ ਵਿੱਚ ਦਰਸਾਇਆ ਗਿਆ ਹੈ:

ਅੰਤਮ ਉਦੇਸ਼

ਡਿਫਿਊਜ਼ਨ ਮਾਡਲ ਦੇ ਲਾਭ

ਜਿਵੇਂ ਕਿ ਪਹਿਲਾਂ ਹੀ ਸੰਕੇਤ ਕੀਤਾ ਗਿਆ ਸੀ, ਪ੍ਰਸਾਰ ਮਾਡਲਾਂ 'ਤੇ ਖੋਜ ਦੀ ਮਾਤਰਾ ਹਾਲ ਹੀ ਵਿੱਚ ਕਈ ਗੁਣਾ ਹੋ ਗਈ ਹੈ। ਡਿਫਿਊਜ਼ਨ ਮਾਡਲ ਹੁਣ ਅਤਿ-ਆਧੁਨਿਕ ਚਿੱਤਰ ਗੁਣਵੱਤਾ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ ਅਤੇ ਗੈਰ-ਸੰਤੁਲਨ ਥਰਮੋਡਾਇਨਾਮਿਕਸ ਦੁਆਰਾ ਪ੍ਰੇਰਿਤ ਹਨ।

ਡਿਫਿਊਜ਼ਨ ਮਾਡਲ ਅਤਿ-ਆਧੁਨਿਕ ਤਸਵੀਰ ਦੀ ਗੁਣਵੱਤਾ ਦੇ ਨਾਲ-ਨਾਲ ਕਈ ਤਰ੍ਹਾਂ ਦੇ ਹੋਰ ਫਾਇਦੇ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ ਵਿਰੋਧੀ ਸਿਖਲਾਈ ਦੀ ਲੋੜ ਨਹੀਂ।

ਵਿਰੋਧੀ ਸਿਖਲਾਈ ਦੀਆਂ ਕਮੀਆਂ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਜਾਣੀਆਂ ਜਾਂਦੀਆਂ ਹਨ, ਇਸ ਲਈ ਬਰਾਬਰ ਪ੍ਰਦਰਸ਼ਨ ਅਤੇ ਸਿਖਲਾਈ ਦੀ ਪ੍ਰਭਾਵਸ਼ੀਲਤਾ ਦੇ ਨਾਲ ਗੈਰ-ਵਿਰੋਧੀ ਵਿਕਲਪਾਂ ਦੀ ਚੋਣ ਕਰਨਾ ਅਕਸਰ ਤਰਜੀਹੀ ਹੁੰਦਾ ਹੈ।

ਡਿਫਿਊਜ਼ਨ ਮਾਡਲ ਸਿਖਲਾਈ ਦੀ ਪ੍ਰਭਾਵਸ਼ੀਲਤਾ ਦੇ ਮਾਮਲੇ ਵਿੱਚ ਸਕੇਲੇਬਿਲਟੀ ਅਤੇ ਸਮਾਨਤਾ ਦੇ ਫਾਇਦੇ ਵੀ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ।

ਹਾਲਾਂਕਿ ਡਿਫਿਊਜ਼ਨ ਮਾਡਲ ਪਤਲੀ ਹਵਾ ਤੋਂ ਬਾਹਰ ਜਾਪਦੇ ਨਤੀਜੇ ਪੈਦਾ ਕਰਦੇ ਪ੍ਰਤੀਤ ਹੁੰਦੇ ਹਨ, ਇਹਨਾਂ ਨਤੀਜਿਆਂ ਦਾ ਆਧਾਰ ਬਹੁਤ ਸਾਰੇ ਵਿਚਾਰਸ਼ੀਲ ਅਤੇ ਦਿਲਚਸਪ ਗਣਿਤਿਕ ਫੈਸਲਿਆਂ ਅਤੇ ਸੂਖਮਤਾਵਾਂ ਦੁਆਰਾ ਰੱਖਿਆ ਗਿਆ ਹੈ, ਅਤੇ ਉਦਯੋਗ ਦੇ ਵਧੀਆ ਅਭਿਆਸ ਅਜੇ ਵੀ ਵਿਕਸਤ ਕੀਤੇ ਜਾ ਰਹੇ ਹਨ।

ਸਿੱਟਾ

ਸਿੱਟੇ ਵਜੋਂ, ਖੋਜਕਰਤਾ ਪ੍ਰਸਾਰ ਸੰਭਾਵੀ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਉੱਚ-ਗੁਣਵੱਤਾ ਤਸਵੀਰ ਸੰਸ਼ਲੇਸ਼ਣ ਖੋਜਾਂ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦੇ ਹਨ, ਗੈਰ-ਸੰਤੁਲਿਤ ਥਰਮੋਡਾਇਨਾਮਿਕਸ ਦੇ ਵਿਚਾਰਾਂ ਦੁਆਰਾ ਪ੍ਰੇਰਿਤ ਲੇਟਵੇਂ ਵੇਰੀਏਬਲ ਮਾਡਲਾਂ ਦੀ ਇੱਕ ਸ਼੍ਰੇਣੀ।

ਉਹਨਾਂ ਨੇ ਆਪਣੇ ਅਤਿ-ਆਧੁਨਿਕ ਨਤੀਜਿਆਂ ਅਤੇ ਗੈਰ-ਵਿਰੋਧੀ ਸਿਖਲਾਈ ਦੇ ਕਾਰਨ ਬਹੁਤ ਵਧੀਆ ਚੀਜ਼ਾਂ ਪ੍ਰਾਪਤ ਕੀਤੀਆਂ ਹਨ ਅਤੇ ਉਹਨਾਂ ਦੇ ਬਚਪਨ ਨੂੰ ਦੇਖਦੇ ਹੋਏ, ਆਉਣ ਵਾਲੇ ਸਾਲਾਂ ਵਿੱਚ ਹੋਰ ਤਰੱਕੀ ਦੀ ਉਮੀਦ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ।

ਖਾਸ ਤੌਰ 'ਤੇ, ਇਹ ਖੋਜ ਕੀਤੀ ਗਈ ਹੈ ਕਿ ਡਿਫਿਊਜ਼ਨ ਮਾਡਲ DALL-E 2 ਵਰਗੇ ਉੱਨਤ ਮਾਡਲਾਂ ਦੀ ਕਾਰਜਸ਼ੀਲਤਾ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹਨ।

ਇੱਥੇ ਤੁਸੀਂ ਪੂਰੀ ਖੋਜ ਤੱਕ ਪਹੁੰਚ ਕਰ ਸਕਦੇ ਹੋ।

ਡਿਫਿਊਜ਼ਨ ਮਾਡਲ ਦੀ ਜਾਣ-ਪਛਾਣ

ਡਿਫਿਊਜ਼ਨ ਮਾਡਲ ਕੀ ਹੈ?