טיש פון קאָנטענץ[באַהאַלטן][ווייַזן]
גרויס שפּראַך מאָדעלס זענען עטלעכע פון די מערסט ימפּרעסיוו דיוועלאַפּמאַנץ אין די פעלד פון נאַטירלעך שפּראַך פּראָגראַממינג און נעוראַל נעטוואָרקס.
OpenAI's GPT-3 שטייט אויס ווי איינער פון די בעסטער-פּערפאָרמינג מאָדעלס דאָרט. דער רעזולטאַט פון דעם מאָדעל איז אָפט מאל ינדיסטינגגווישאַבאַל פון טעקסט וואָס קומט פון יומאַנז.
אָבער, GPT-3 איז נאָך אַ פֿאַרמאַכט-מקור מאָדעל. כאָטש ינקרעדאַבלי שטאַרק, עס זענען זיכער לימיטיישאַנז וואָס קען מאַכן עס ומפּאַסיק פֿאַר זיכער נוצן קאַסעס.
אין דעם אַרטיקל, מיר וועלן גיין איבער אַ ביסל גרויס שפּראַך מאָדעלס וואָס קענען קאָנקורירן מיט די רוי פאָרשטעלונג פון GPT-3.
פארוואס איר זוכט פֿאַר אַן OpenAI GPT-3 אַלטערנאַטיווע?
OpenAI's GPT-3 מאָדעל ניצט אַוואַנסירטע טיף לערנען מאָדעלס צו פּראָדוצירן מענטש-ווי טעקסט. דאָס איז דער דריט דור שפּראַך פאָרויסזאָגן מאָדעל פון OpenAI ס פאָרשונג לאַבאָראַטאָריע.
דער מאָדעל איז טכילעס באפרייט ווי אַ פֿאַרמאַכט ביתא איידער OpenAI יווענטשאַוואַלי געעפנט די אַפּי צו דעם ציבור אין שפּעט 2021.
דערווייַל, GPT-3 האט פיר באַזע מאָדעלס פֿאַר איר צו קלייַבן פון. אַדאַ, די טשיפּאַסט און פאַסטאַסט מאָדעל קאָס בלויז $ 0.0004 פּער 1000 טאָקענס. OpenAI ס מערסט שטאַרק מאָדעל, Davinci, קאָס $ 0.02 פּער 1000 טאָקענס, אָדער וועגן 50 מאל מער טייַער.
OpenAI אויך ריקווייערז די דעוועלאָפּער צו נאָכפאָלגן זייער אייגענע באַניץ גיידליינז. דער דעוועלאָפּער וועט אויך צושטעלן אַ לימיטעד באַניץ קוואָטע וואָס קענען זיין געוואקסן אַמאָל די דעוועלאָפּער ס אַפּלאַקיישאַן איז באוויליקט דורך אַ מאַנואַל אָפּשאַצונג פּראָצעס.
כאָטש די GPT-3 רעזולטאַט איז באַוווסט פֿאַר זייַן הויך-קוואַליטעט רעזולטאַט, עס איז נישט דער בלויז שפּראַך פּראָגנאָז מאָדעל בנימצא פֿאַר איר צו נוצן.
לאָמיר גיין איבער עטלעכע קאַמפּיטינג מאָדעלס איר קענען נוצן ווי אַן אָלטערנאַטיוו צו GPT-3.
1. גפּט-דזש
GPT-J איז אַן אָפֿן-מקור שפּראַך מאָדעל דורך די Eleuther AI גרופּע.
די נול-שאָס פאָרשטעלונג איז בעערעך אויף פּאַר מיט GPT-3 און איז פיל נעענטער אין פאָרשטעלונג ווי פילע אנדערע GPT ימפּלאַמאַנץ.
די 6-ביליאָן פּאַראַמעטער אַוטאָרעגרעסיוו טעקסט דור מאָדעל איז טריינד אויף אַ דאַטן שטעלן באקאנט ווי "די הויפן".
די הויפן איז פאקטיש אַ קאָמבינאַציע פון 22 קלענערער דאַטאַסעץ קאַמביינד צוזאַמען. עס האט אַ קאַמביינד טעקע גרייס פון 825 GiB און איז באמערקט צו האָבן אַ גרעסערע טראָפּ אויף אַקאַדעמיק און פאַכמאַן קוואלן.
איר קענען פּרובירן די מאָדעל זיך דורך דעם פֿרייַ וועב אַפּלאַקיישאַן.
איך איז געווען ביכולת צו פּרובירן די מאָדעל מיט אַ פּשוט פּינטלעך. GPT-J איז געווען סאַקסידאַד אין ינומערייטינג די "בעסטער וועגן צו לערנען אַ נייַע שפּראַך הייַנט".
אָבער, די פאָרשטעלונג איז עפּעס ספּאַטי ווען איך געפרוווט צו פרעגן עס צו דערקלערן וואָס אַ אַוטאָרעגרעסיוו טעקסט דור מאָדעל איז געווען.
כאָטש די רעזולטאַט איז געווען זינען, עס האט נישט טאַקע ענטפֿערן די פּינטלעך אין אַ מינינגפאַל וועג.
פּרייסינג
זינט GPT-J איז אַן אָפֿן-מקור מאָדעל, איר קען אַקשלי לויפן דיין אייגענע בייַשפּיל. לויט צו די באַאַמטער ריפּאַזאַטאָרי, דער מאָדעל איז דיזיינד צו לויפן אויף אַ טענסאָר פּראַסעסינג אַפּאַראַט (טפּו). כאָטש אָפּטימאַל, דאָס קען נישט זיין די מערסט פּרייַז-עפעקטיוו אָפּציע זינט Google ס טשיפּאַסט וואָלקן טפּוס פּרייַז וועגן $ 4.50 / שעה.
עס קען זיין ווייניקער טייַער אין די לאַנג לויפן צו נוצן דיין אייגענע גפּו אָדער דינגען אַ דעדאַקייטאַד גפּו סערווער דורך סערוויסעס ווי Vast.ai or פלוידסטאַק.
2. דזשוראַססיק-1
Jurassic-1 איז אַ שפּראַך מאָדעל באפרייט דורך AI21 לאַבס, אַן ישראל אַי פירמע וואָס ספּעשאַלייזיז אין NLP. ווי OpenAI, זיי אויך פאָרשלאָגן אַן אַפּי וואָס אַלאַוז איר צו אַקסעס זייער שפּראַך מאָדעל.
איר קענען שאַפֿן אַ חשבון אויף זייער חשבון וועבזייַטל צו אַקסעס אַ שפּילפּלאַץ וועב אַפּ צו פּרובירן די מאָדעל פֿאַר זיך.
די AI21 סטודיאָ אויך כולל אַ שטריך ווו איר קענען באַן און אָנפֿרעג דיין אייגענע מנהג ווערסיעס פון זייער Jurassic-1 מאָדעלס. לויט אַן official blog post, מנהג מאָדעלס מיט ווי ווייניק ווי פופציק ביישפילן קענען אַוטפּערפאָרם פּינטלעך ינזשעניעריע ניצן די אָריגינעל מאָדעל.
פּרייסינג
זיי פאָרשלאָגן פלעקסאַבאַל באַניץ-באזירט פּרייסינג פֿאַר יעדער פון זייער דריי באַזע מאָדעלס. פֿאַר בייַשפּיל, זיי אָפּצאָל $ 0.25 פֿאַר יעדער 1000 טאָקענס דזשענערייטאַד דורך די מאָדעל. אין דורכשניטלעך, יעדער סימען איז בעערעך 1 וואָרט אָדער זעקס אותיות.
דעם מיטל אַז איר קענען נוצן די בעסטער מאָדעל פון AI21 צו שאַפֿן אַ דאָקומענט פון 4000 וואָרט פֿאַר בלויז $ 1. איין זאַך איר דאַרפֿן צו געדענקען איז אַז איר נאָך דאַרפֿן צו צאָלן אַ מינימום פון $ 29 יעדער חודש צו נוצן דעם מאָדעל.
3. טעקסטסינטה
TextSynth איז אן אנדער NLP וועב סערוויס וואָס איר קענען נוצן צו דזשענערייט טעקסט. ניט ענלעך די פריערדיקע צוויי ביישפילן, TextSynth איז נישט אַ סטאַנדאַלאָנע מאָדעל. דער דינסט אַרבעט דורך געבן די באַניצער אַקסעס צו פאַרשידן אנדערע אָפֿן-מקור גרויס שפּראַך מאָדעלס ווי GPT-NeoX, M2M100 און אפילו GPT-J.
דעוועלאָפּערס קענען נוצן זייער REST API צו ויסשטימען די שפּראַך מאָדעלס אין זייער אייגענע אַפּלאַקיישאַנז. איר קענען פּרובירן צו קאָנטראָלירן זייער פריי שפּילפּלאַץ בלאַט צו זען ווי יעדער בנימצא מאָדעל פּערפאָרמז.
פּרייסינג
זייער פריי פּלאַן גיט איר אַקסעס צו אַלע זייער שפּראַך מאָדעלס מיט עטלעכע קורס לימאַץ. די דינסט ריסטריקץ יעדער בקשה צו אַ לענג פון 200 טאָקענס.
דער נאָרמאַל פּלאַן רימוווז די באַגרענעצונג אויף די נומער פון דזשענערייטאַד טאָקענס. די פּרייסינג מאָדעל איז קרעדיט-באזירט צו ויסמיידן אומגעריכט הוצאות. די מינימום נומער פון קרעדיץ צו קויפן איז $ 20. אַניוזד קרעדיץ זענען פאַרקריפּלט נאָך אַ יאָר.
די פּרייַז פון יעדער בקשה איז באזירט אויף די נומער פון אַרייַנשרייַב און דזשענערייטאַד טאָקענס. באַזירט אויף די טיש אויף זייער באַאַמטער וועבזייטל, איר קענען דערוואַרטן צו צאָלן וועגן $ 0.75 צו $ 1.25 פֿאַר ניצן זייער טשיפּער מאָדעלס.
סאָף
אַלעווייַ, דער אַרטיקל קענען העלפֿן איר געפֿינען אַ אַפאָרדאַבאַל און עפעקטיוו שפּראַך מאָדעל איר קענען נוצן ווי אַ OpenAI GPT-3 אָלטערנאַטיוו.
גרויס שפּראַך מאָדעלס זענען זייער שטאַרק און קענען זיין געוויינט פֿאַר אַ פאַרשיידנקייַט פון טאַסקס. זיי קענען ווערן גענוצט צו דזשענערייט טעקסט, איבערזעצן צווישן שפּראַכן, און פֿאַרשטיין און ריספּאַנד צו נאַטירלעך שפּראַך.
באַזירט אויף מיין פאָרשונג אין דעם פּלאַץ און די טעסץ איך האָבן דורכגעקאָכט, GPT-3 נאָך אַוטפּערפאָרמז יעדער אנדערער גרויס שפּראַך מאָדעל איך האב געפרואווט. אָבער, דאָס קען טוישן אין דער צוקונפֿט ווי ריסערטשערז אַנטוויקלען און מעלדונג נייַע מאָדעלס.
רעסעאַרטשערס ביי Google, פאַסעבאָאָק און אנדערע אַי לאַבאָראַטאָריעס וועלן נאָך פאָרזעצן צו אַרבעטן אויף העכערן זייער אייגענע LMMs. עס איז אַוואַדע מעגלעך אַז איינער פון די אַי טימז וועט קומען אויס מיט אַ מאָדעל העכער ווי GPT-3.
לאָזן אַ ענטפֿערן