טיש פון קאָנטענץ[באַהאַלטן][ווייַזן]
אין אַלגעמיין, טיף גענעראַטיווע מאָדעלס ווי GANs, VAEs און אַוטאָרעגרעסיוו מאָדעלס שעפּן בילד סינטעז פּראָבלעמס.
געגעבן די הויך קוואַליטעט פון די דאַטן זיי שאַפֿן, דזשענעראַטיוו אַדווערסאַריאַל נעטוואָרקס (GANs) האָבן באקומען אַ פּלאַץ פון ופמערקזאַמקייט אין די לעצטע יאָרן.
דיפפוסיאָן מאָדעלס זענען אן אנדער פאַסאַנייטינג פעלד פון לערנען וואָס האט געגרינדעט זיך. די פעלדער פון בילד, ווידעא און קול דור האָבן ביידע געפֿונען ברייט נוצן פֿאַר זיי.
דיפפוסיאָן מאָדעלס קעגן גאַנס: וואָס פּראַדוסיז בעסער רעזולטאַטן? געוויינטלעך, דאָס האָט געפֿירט צו אַ אָנגאָינג דיסקוסיע.
אין די קאַמפּיוטיישאַנאַל אַרקאַטעקטשער באקאנט ווי די GAN, צוויי נוראַל נעטוואָרקס זענען געקעמפט קעגן איינער דעם אנדערן צו פּראָדוצירן ניי סינטאַסייזד קאַסעס פון דאַטן וואָס קענען פאָרן פֿאַר עכט דאַטן.
דיפפוסיאָן מאָדעלס ווערן מער און מער פאָלקס זינט זיי צושטעלן טריינינג פעסטקייַט און הויך רעזולטאַטן פֿאַר פּראַדוסינג מוזיק און גראַפיקס.
דער אַרטיקל וועט דורכגיין די דיפיוזשאַן מאָדעל און GANs אין דעטאַל, ווי געזונט ווי ווי זיי אַנדערש פון איינער דעם אנדערן און עטלעכע אנדערע טינגז.
אַזוי, וואָס זענען גענעראַטיווע אַדווערסאַריאַל נעטוואָרקס?
כּדי צו שאַפֿן נייַע קינסטלעך ינסטאַנסיז פון דאַטן וואָס קען זיין טעות מיט עכט דאַטן, דזשענעראַטיוו אַדווערסאַריאַל נעטוואָרקס (GANs) ניצן צוויי נעוראַל נעטוואָרקס און שטעלן זיי קעגן יעדער אנדערער (אַזוי די "קעגנצייַטיק" אין דעם נאָמען).
זיי זענען וויידלי געניצט פֿאַר רעדע, ווידעא און בילד שאַפונג.
די אָביעקטיוו פון GAN איז צו שאַפֿן פריער אַנדיסקאַווערד דאַטן פֿון אַ ספּעציפיש דאַטאַסעט. פּרווון צו אָפּלערנען אַ מאָדעל פון די פאַקטיש, אַניידענטאַפייד אַנדערלייינג דאַטן פאַרשפּרייטונג פון די סאַמפּאַלז, טוט דאָס.
אַלטערנאַטיוועלי געזאגט, די נעטוואָרקס זענען ימפּליסאַט מאָדעלס וואָס פּרווון צו לערנען אַ ספּעציפיש סטאַטיסטיש פאַרשפּרייטונג.
דער אופֿן וואָס GAN האָט געוויינט צו אַנטדעקן ווי צו דערגרייכן דעם ציל איז געווען ראָמאַן. אין פאַקט, זיי פּראָדוצירן דאַטן דורך פּלייינג אַ צוויי-שפּילער שפּיל צו אַנטוויקלען אַן ימפּליסאַט מאָדעל.
די פאלגענדע באשרייבט די סטרוקטור:
- אַ דיסקרימינאַטאָר אַז גיינז די פיייקייט צו דיפערענשיייט צווישן עכט און שווינדל דאַטן
- אַ גענעראַטאָר וואָס פּיקט זיך נייַע וועגן צו שאַפֿן דאַטן קענען טריק די דיסקרימינאַטאָר.
די דיסקרימינאַטאָר פּאָוזיז ווי אַ נעוראַל נעץ. דעריבער, דער גענעראַטאָר דאַרף צו מאַכן אַ בילד מיט הויך קוואַליטעט צו קונץ עס.
דער פאַקט אַז די גענעראַטאָרס זענען נישט טריינד מיט קיין רעזולטאַט פאַרשפּרייטונג איז אַ באַטייטיק דיסטינגקשאַן צווישן אַוטאָענקאָדער מאָדעלס און אנדערע מאָדעלס.
עס זענען צוויי וועגן צו צעלייגנ די אָנווער פאַנגקשאַנז פון די מאָדעל:
- די פיייקייט צו קוואַנטיפיצירן אויב די דיסקרימינאַטאָר אַקיעראַטלי פאָרסעס פאַקטיש דאַטן
- דזשענערייטאַד דאַטן איז אַקיעראַטלי פּרעדיקטעד דורך אַ חלק.
אויף דער בעסטער פיזאַבאַל דיסקרימינאַטאָר, די אָנווער פונקציע איז מינאַמייזד:
דזשאַנעריק מאָדעלס קענען דעריבער זיין קאַנסידערד ווי דיסטאַנסע מינימיזאַטיאָן מאָדעלס און, אויב די דיסקרימינאַטאָר איז ידעאַל, ווי דיווערדזשאַנס מינימיזיישאַן צווישן די אמת און געשאפן פאַרשפּרייטונג.
אין פאַקט, פאַרשידענע דיווערדזשאַנסיז קענען זיין געוויינט און רעזולטאַט אין פאַרשידן GAN טריינינג מעטהאָדס.
די לערנען דינאַמיק, וואָס כולל אַ האַנדל-אַוועק צווישן די גענעראַטאָר און די דיסקרימינאַטאָר, זענען טשאַלאַנדזשינג צו נאָכפאָלגן, טראָץ עס איז פּשוט צו סטרויערן די אָנווער פונקציע פון גאַנס.
עס זענען אויך קיין אַשוראַנס אַז לערנען וועט קאַנווערדזש. ווי אַ רעזולטאַט, טריינינג אַ GAN מאָדעל איז שווער, ווייַל עס איז טיפּיש צו לויפן אַריבער פּראָבלעמס ווי דיסאַפּירינג גראַדיענץ און מאָדע ייַנבראָך (ווען עס איז קיין דייווערסיטי אין די דזשענערייטאַד סאַמפּאַלז).
איצט עס איז צייט פֿאַר דיפפוסיאָן מאָדעלס
די פּראָבלעם מיט די טריינינג קאַנווערדזשאַנס פון GANs איז אַדזשאַסטיד דורך די אַנטוויקלונג פון דיפיוזשאַן מאָדעלס.
די מאָדעלס יבערנעמען אַז אַ דיפיוזשאַן פּראָצעס איז עקוויוואַלענט צו אינפֿאָרמאַציע אָנווער געפֿירט דורך ראַש ס פּראָגרעסיוו ינטערפיראַנס (אַ גאַוסיאַן ראַש איז צוגעגעבן אין יעדער צייט סטעפּ פון די דיפיוזשאַן פּראָצעס).
דער ציל פון אַזאַ אַ מאָדעל איז צו באַשטימען ווי ראַש אַפעקץ די אינפֿאָרמאַציע פאָרשטעלן אין דער מוסטער, אָדער, צו לייגן עס אן אנדער וועג, ווי פיל אינפֿאָרמאַציע איז פאַרפאַלן רעכט צו דיפיוזשאַן.
אויב אַ מאָדעל קענען רעכענען דעם אויס, עס זאָל זיין ביכולת צו צוריקקריגן די אָריגינעל מוסטער און ופמאַכן די אינפֿאָרמאַציע אָנווער וואָס איז פארגעקומען.
דעם איז אַטשיווד דורך אַ דענאָייזינג דיפיוזשאַן מאָדעל. א פאָרויס דיפיוזשאַן פּראָצעס און אַ פאַרקערט דיפיוזשאַן פּראָצעס מאַכן די צוויי סטעפּס.
דער פאָרויס דיפיוזשאַן פּראָצעס ינוואַלווז ביסלעכווייַז אַדינג גאַוסיאַן ראַש (ד"ה די דיפיוזשאַן פּראָצעס) ביז די דאַטן זענען גאָר קאַנטאַמאַנייטאַד דורך ראַש.
די נעוראַל נעץ איז דערנאָך טריינד מיט די פאַרקערט דיפיוזשאַן אופֿן צו לערנען די קאַנדישאַנאַל פאַרשפּרייטונג מאַשמאָעס צו פאַרקערט די ראַש.
דאָ איר קענען פֿאַרשטיין מער וועגן דעם דיפיוזשאַן מאָדעל.
דיפפוסיאָן מאָדעל ווס גאַנז
ווי אַ דיפיוזשאַן מאָדעל, GANs פּראָדוצירן בילדער פֿון ראַש.
דער מאָדעל איז קאַמפּרייזד פון אַ גענעראַטאָר נעוראַל נעץ, וואָס הייבט זיך מיט די ראַש פון עטלעכע ינפאָרמאַטיוו קאַנדישאַנינג וועריאַבאַלז, אַזאַ ווי אַ קלאַס פירמע אָדער טעקסט קאָדירונג.
דער רעזולטאַט זאָל זיין עפּעס וואָס ריזעמבאַלז אַ רעאַליסטיש בילד.
צו שאַפֿן פאָטאָרעאַליסטיש און הויך-פאַדעלאַטי בילד דורות, מיר נוצן GANs. אפילו מער רעאַליסטיש וויזשוואַלז ווי GANs זענען געשאפן מיט דיפיוזשאַן מאָדעלס.
אין אַ וועג, דיפיוזשאַן מאָדעלס זענען מער פּינטלעך אין דיסקרייבינג די פאקטן.
בשעת אַ GAN נעמט ווי אַרייַנשרייַב טראַפ ראַש אָדער אַ קלאַס קאַנדישאַנינג בייַטעוודיק און אַוטפּוץ אַ רעאַליסטיש מוסטער, דיפיוזשאַן מאָדעלס זענען אָפט סלאָוער, יטעראַטיוו און דאַרפֿן פיל מער גיידאַנס.
עס איז נישט פיל פּלאַץ פֿאַר טעות ווען דינאָיסינג איז ריפּיטידלי געווענדט מיט דער ציל צו צוריקקומען צו דער אָריגינעל בילד פֿון די ראַש.
יעדער טשעקפּוינט איז דורכגעגאנגען איבער די שאַפונג בינע, און מיט יעדער שריט, די בילד קען באַקומען מער און מער אינפֿאָרמאַציע.
סאָף
אין מסקנא, רעכט צו ווייניק באַטייטיק פאָרשונג וואָס איז געווען ארויס בלויז אין די 2020 ס און 2021, דיפיוזשאַן מאָדעלס קענען איצט אַוטפּערפאָרם GANs אין טערמינען פון בילד סינטעז.
דעם יאָר, OpenAI לאָנטשט DALL-E2, אַ בילד פּראָדוקציע מאָדעל וואָס אַלאַוז פּראַקטישנערז צו נוצן דיפיוזשאַן מאָדעלס.
כאָטש GANs זענען קאַטינג-ברעג, זייער קאַנסטריינץ מאַכן עס טשאַלאַנדזשינג צו וואָג און נוצן זיי אין נייַע קאַנטעקסץ.
אין סדר צו דערגרייכן GAN-ווי מוסטער קוואַליטעט מיט ליקעליהאָאָד-באזירט מאָדעלס, אַ פּלאַץ פון אַרבעט איז געווען שטעלן אין עס.
לאָזן אַ ענטפֿערן