רעדע סינטעז איז דער פּראָצעס פון סינטעז פון מענטש רעדע. א "רעדע קאָמפּיוטער" אָדער "רעדע סינטאַסייזער," וואָס קען זיין ינאַגרייטיד אין ווייכווארג אָדער ייַזנוואַרג פּראָדוקטן, איז אַ קאָמפּיוטער סיסטעם געניצט פֿאַר דעם צוועק.
נאָרמאַל שפּראַך טעקסט איז איבערגעזעצט אין קול דורך אַ טעקסט-צו-רעדע (TTS) סיסטעם; אנדערע מעטהאָדס איבערזעצן סימבאָליש לינגגוויסטיק רעפּראַזאַנטיישאַנז, אַזאַ ווי פאָנעטיק טראַנסקריפּציעס, אין רעדע.
קאַנקאַטאַנייטינג אַודיאָ קליפּס וואָס זענען געהאלטן אין אַ דאַטאַבייס קענען פּראָדוצירן סינטאַסייזד רעדע. די סיסטעם מיט די וויידאַסט קייט פון אַוטפּוץ, אָבער, קען נישט זיין אַזוי קלאָר, סטאָרז פאָנעס אָדער דיפאָונז.
אין קאַנטראַסט, אַ סינטאַסייזער קענען פאַרבינדן אַ מאָדעל פון די וואָקאַל שעטעך און אנדערע אַספּעקץ פון דער מענטש קול צו פּראָדוצירן אַ גאָר "סינטעטיש" קול רעזולטאַט.
אין דעם שטיק, מיר וועלן קוקן אין 15.ai טעקסט-צו-קול ווייכווארג און עטלעכע פאָלקס אַלטערנאַטיוועס וואָס איר קענען נוצן רעכט איצט.
וואָס איז 15.ai?
15.ai איז אַ פריווייר קינסטלעך סייכל אָנליין פּראָגראַם וואָס קריייץ לעבעדיק, עמאָציאָנעל, הויך קוואַליטעט טעקסט צו רייד קולות פון פארשיידענע פיקטיווע פּערסאָנאַזשן.
די פּרויעקט סטאַרטעד בשעת דער באשעפער איז געווען אַ תּלמיד אין MIT. עס דזשענערייץ און סערוועס עמאָציאָנעל כאַראַקטער קולות פאַסטער ווי אין פאַקטיש-צייט דורך קאַמביינינג אַודיאָ סינטעז טעקניקס, רעדע סינטעז טיף נוראַל נעטוואָרקס, און סענטימענט אַנאַליסיס מאָדעלס.
זיין קול קלאָונינג איז אַן אינטערנעט געצייַג וואָס קאַנווערץ טעקסט אין אַודיאָ סניפּאַץ וואָס אַנטהאַלטן די קולות פון פאָלקס אותיות.
די אותיות אין די ווייַזן זענען אונטערטעניק צו טוישן, אָבער, עטלעכע פון די אותיות פון Rick and Morty, My Little Pony, Spongebob SquarePants און אנדערע האָבן שוין בארעכטיגט פֿאַר די באַניצער פון די קול.
אָבער, די ביגאַסט אַרויסגעבן מיט 15.ai איז אַז עס איז אָפט אַנאַוויילאַבאַל און פּלייגד דורך פּראָבלעמס און מאַלפאַנגקשאַנז, וואָס האט געטריבן מער ווי האַלב פון זייַן קאַסטאַמערז צו גיינ אַף פֿאַר אנדערע 15.ai קאָמפּעטיטאָרס.
בעסטער אַלטערנאַטיוועס פון 15.אַי
1. שפּיל.הט
פּלייַ.הט איז אַן קינסטלעך סייכל קול גענעראַטאָר וואָס טראגט רעאַליסטיש טעקסט-צו-רעדן. טעקסט איז טייקעף קאָנווערטעד צו רייד ניצן קינסטלעך קולות פון Google, אַמאַזאָן, מייקראָסאָפֿט און יבם.
דער רעזולטאַט קענען זיין דאַונלאָודיד ווי אַ וואַוו אָדער mp3 אַודיאָ טעקע. פֿאַר פּאָדקאַסץ, פילמס, E- לערנען און אנדערע ניצט, די אַפּלאַקיישאַן קענען פּראָדוצירן קאַנווינסינג קול-אָווערס.
דערצו, איר קענען נוצן עס צו ווענדן דיין בלאָג אַרטיקלען אין אַודיאָ, וואָס קענען פאַרלענגערן באַניצער באַשטעלונג, אַקסעסאַביליטי און צייט פארבראכט אויף דעם וועבזייטל.
142 שפראַכן און מער ווי 907 קולות מיט בוילעט אַקסענץ זענען בנימצא אויף Play.ht. די מאַלטי-קול פאַנגקשאַנאַליטי קענען אויך זיין געניצט צו רעקאָרדירן דיסקוסיעס פֿאַר ווויסאָוווערז.
אָנהייב דורך אַרייַן, קאַפּיינג אָדער ימפּאָרטינג טעקסט אין די טעקסט קעסטל אויף זייער וועבזייטל צו גער עס צו קול. ניצן פּראָונאַנסייישאַן און פאַרשידענע רעדן פּאַטערנז צו פֿאַרבעסערן די אַודיאָ קוואַליטעט.
פּרייסינג
די פּרעמיע פּרייסינג פון די פּלאַטפאָרמע סטאַרץ פֿון $ 19/חודש.
2. speechify
קליף ווייצמאן האט באשאפן Speechify נאכדעם וואס ער איז דיאגנאזירט געווארן מיט דיסלעקסיע און האט געזוכט רעמעדיעס צו זיינע לייעשוועריקייטן.
די געצייַג איז אַ פאַרשטעלן לייענער וואָס וועט לייענען אַלע מאַטעריאַל אויף דיין מיטל, אַרייַנגערעכנט ביכער, ימיילז, צייטונגען, פּדף, אַרטיקלען אָדער טעקעס.
איבער 30 יי-דזשענערייטאַד שטימען און איבער 20 שפראַכן זענען בארעכטיגט, אַרייַנגערעכנט ענגליש, כינעזיש, שפּאַניש, דייַטש, רוסיש און פּאָרטוגעזיש.
איר קענען יבערקוקן קיין געדרוקט טעקסט, ופּלאָאַד אַ פּדף אָדער נאָכמאַכן און פּאַפּ קיין טעקסט אין דעם פּראָגראַם. דער טעקסט וועט זיין קאָנווערטעד צו רעדע דורך די פּראָגראַם, וואָס איר קענען הערן צו דיין סמאַרטפאָנע.
עטלעכע פון די אַפּ ס קייפּאַבילאַטיז אַרייַננעמען מענטש-ווי לייענען קולות וואָס זענען גרינג צו הערן צו און פֿאַרשטיין. איר קענט אויך פּערסאַנאַלייז דיין דערפאַרונג דורך פאַרגיכערן די לייענען צו נייַן מאָל די דורכשניטלעך.
פּרייסינג
איר קענען פּרובירן די פּלאַטפאָרמע פֿאַר פריי און ביטע קאָנטאַקט די פאַרקויפער פֿאַר זייַן פּרייסינג.
3. Uberduck.ai
Uberduck.ai איז אַ קול פּלאַטפאָרמע פּאַוערד דורך קינסטלעך סייכל וואָס קריייץ עכט, יקספּרעסיוו קולות פֿאַר אַודיאָ אַפּלאַקיישאַנז.
מיט איבער 5,000 קולות צו קלייַבן פון, Uberduck.ai גיט אַ ברייט קייט פון פּאַסאַבילאַטיז פֿאַר פּראַדוסינג טשיקאַווע, לייטלי שטימען.
אין אַדישאַן צו די ריזיק קול ביבליאָטעק, Uberduck.ai אָפפערס אַפּיס פֿאַר ראַפּאַדלי און פּשוט קאַנסטראַקטינג אַודיאָ אַפּפּס. Uberduck.ai אויך אַלאַוז יוזערז צו מאַכן בעספּאָקע קול קלאָונז אויב זיי ווילן צו שאַפֿן אַ גאָר יינציק קול.
Uberduck.ai איז אויך קעסיידער דערהייַנטיקט מיט נייַע פֿעיִקייטן און ימפּרווומאַנץ, וואָס ינשורז אַז איר שטענדיק באַקומען די גרעסטע דערפאַרונג מעגלעך. Uberduck.ai איז ידעאַל פֿאַר טעקסט-צו-רעדן נאַוואַסיז און פּראָפעססיאָנאַלס, דאַנק צו זיין פּשוט, באַניצער-פרייַנדלעך פּלאַן.
פּרייסינג
איר קענען אָנהייבן ניצן עס פֿאַר פריי און פּרעמיע פּרייסינג סטאַרץ פון $ 9.99 / חודש.
4. Voice.ai
Voice.ai איז אַ ווייכווארג פּלאַטפאָרמע פֿאַר קריייטינג קול-באזירט אַפּפּס און ינטערפייסיז. עס קענען זיין גענוצט צו שאַפֿן ווירטואַל אַסיסטאַנץ, רעדע-ענייבאַלד טשאַטבאָץ און אנדערע קול-Powered אַפּפּס וואָס לאָזן יוזערז צו יבערגעבן מיט אַ סיסטעם ניצן נאַטירלעך שפּראַך קול קאַמאַנדז.
צו טייַטשן און ענטפער צו באַניצער ריקוועס, Voice.ai בפֿרט ניצט קינסטלעך סייכל (AI) און מאַשין לערנען אַלגערידאַמז.
צו שאַפֿן אַ גלאַט און פערזענליכען באַניצער דערפאַרונג, עס קענען זיין קאַפּאַלד מיט אנדערע סיסטעמען און פּלאַטפאָרמס, אַזאַ ווי קונה שייכות פאַרוואַלטונג (CRM) סיסטעמען און E- האַנדל פּלאַטפאָרמס.
עטלעכע מעגלעך אַפּלאַקיישאַנז פֿאַר Voice.ai אַרייַננעמען קונה דינסט, קול-באזירט זוכן און נאַוויגאַציע, און קול-קאַנטראָולד סמאַרט היים דעוויסעס.
פּרייסינג
איר קענען אראפקאפיע די ווייכווארג פֿאַר פריי.
5. שווינדל איר
FakeYou איז אַ פריי טעקסט-צו-רעדע ווייכווארג וואָס מאכט עס פּשוט צו בויען דעעפּפאַקעס באזירט אויף קינסטלעך סייכל.
עס איז אַ פריי אַי קול אַפּלאַקיישאַן וואָס ניצט מאַשין וויסן צו דזשענערייט רעאַליסטיש סאָונדס פון פאָלקס קולטור.
FakeYou האט איבער 2,000 קול קלאָונינג פּאַסאַבילאַטיז פֿאַר ימפּערסאַנייטינג ווער עס יז פון דאָנאַלד טראַמפּ צו עלסאַ צו כאַלק אָדער קיין פון דיין באַליבסטע פֿילם און טעלעוויזיע ווייַזן אותיות.
דערצו, די געצייַג ינייבאַלז אָפֿן-מקור רעדע מאָדעלס, מאכן עס אַ פּרויעקט געפירט דורך די קהל. צוזאמען מיט דעם, איר קענען רעקאָרדירן דיין קול, לייגן עס צו אַ פֿילם, קראָם אָלטערד וואַלועס פֿאַר שפּעטער נוצן, און דורכפירן אַ פאַרשיידנקייַט פון אנדערע זאכן.
דערצו, ווי די פּלאַטפאָרמע האט אַ בעספּאָקע קול קלאָונינג אָפּציע, איר קענען רעקאָרדירן דיין אייגענע קול, רעדאַגירן עס מיט פילטערס און נוצן עס פֿאַר דיין אינהאַלט.
פּרייסינג
איר קענען אָנהייבן ניצן עס פֿאַר פריי און פּרעמיע פּרייסינג סטאַרץ פון $ 7 / חודש.
6. iSpeech
iSpeech איז אַ טעקסט-צו-רעדע (TTS) פּלאַטפאָרמע וואָס אַלאַוז ניצערס צו פּראָדוצירן גערעדט אַודיאָ פֿון טעקסט.
עס גיט אַ פאַרשיידנקייַט פון נאַטירלעך-סאַונדינג קולות און אַלאַוז ניצערס צו טוישן די געשאפן רעדע אין אַ פאַרשיידנקייַט פון וועגן, אַרייַנגערעכנט אַדזשאַסטינג די פּעך, גאַנג און הילכיקייט.
iSpeech איז אָפט געניצט צו דזשענערייט קול-אָווערס פֿאַר ווידיאס, אַודיאָבאָאָקס און אנדערע אַודיאָ מאַטעריאַל. עס קענען אויך זיין גענוצט צו בויען ווירטואַל אַסיסטאַנץ, אָטאַמייטיד קונה שטיצן סיסטעמען און אנדערע קול-Powered אַפּלאַקיישאַנז.
אין אַדישאַן צו TTS, iSpeech פּראָווידעס רייד דערקענונג ווייכווארג, וואָס אַלאַוז ניצערס צו טראַנסקריבירן גערעדט אַודיאָ אין טעקסט.
דאָס קען זיין וווילטויק פֿאַר אַ פאַרשיידנקייַט פון אַפּלאַקיישאַנז, אַרייַנגערעכנט באַגעגעניש און אינטערוויו טראַנסקריפּציע, איבערזעצונג פון גערעדט שפּראַך און קריייטינג קאַפּשאַנז פֿאַר ווידעא אינהאַלט.
פּרייסינג
עס איז פריי צו נוצן פֿאַר אַלעמען.
7. נאַטוראַל רעאַדער
NaturalReader איז אַ סאַפיסטאַקייטיד קינסטלעך סייכל-Powered טעקסט-צו-רעדן קול סינטאַסייזער מיט אַ ספּעסיפיעד אָביעקטיוו.
יעדער טעקסט איר צושטעלן איז קאָנווערטעד אין אַי קולות וואָס געזונט ווי מענטשלעך רעדע. דערצו, די פּלאַטפאָרמע האט OCR טעכנאָלאָגיע, וואָס פאַסילאַטייץ די יקסטראַקשאַן פון טעקסט פֿון פאָטאָס און סקאַנד פּדף, צווישן אנדערע.
צו פאַרבעסערן די באַניצער דערפאַרונג, די אַי קול גענעראַטאָר כולל אַ נוציק קראָום פּלוגין אַז איר קענען אראפקאפיע. NaturalReader, אַ קינסטלעך סייכל רעדע גענעראַטאָר, פּרייאָראַטייז קאַנוויניאַנס.
מיט זיין הילף, איר קענען בייַטן קיין טעקסט אין אַ הויך-קוואַליטעט, קלאָר mp3 טעקע אַז איר קענען הערן צו ווען איר ווילט.
דער פּראָגראַם קענען זיין געוויינט פֿאַר אַ נומער פון אַפּלאַקיישאַנז, אַרייַנגערעכנט בראָדקאַסטינג, ינטעראַקטיוו קול ענטפער (IVR) און פּראַוויידינג דערציילונג פֿאַר יאָוטובע ווידיאס.
פּרייסינג
איר קענען פּרובירן עס פריי און פּרעמיע פּרייסינג סטאַרץ פון $ 19 / חודש.
8. וואָרט
Woord איז אַ טעקסט-צו-רעדע פּראָגראַם וואָס זוכט צו צושטעלן סאַלושאַנז פֿאַר אָנליין, ווייכווארג און רירעוודיק אַפּלאַקיישאַנז. איר קענען געשווינד גער טעקסט צו רייד מיט Woord.
צו נוצן די ווייכווארג, אַרייַן די טעקסט, קלייַבן אַ קול באזירט אויף דזשענדער, אַקצענט און שפּראַך, גיט פאָרלייגן און דאַן אראפקאפיע דיין פארוואנדלען רעדע.
וואָרט כּולל 50 קולות פון 21 פאַרשידענע שפּראַכן. אין דערצו, עטלעכע שפּראַכן, אַזאַ ווי בראַזיליאַן פּאָרטוגעזיש און קאַנאַדיאַן פראנצויזיש, האָבן רעגיאָנאַל דיפעראַנסיז אין זייער שטימען.
Woord ניצט קינסטלעך סייכל (AI) טעכנאָלאָגיע צו צושטעלן הויך-קוואַליטעט סינטעטיש מענטש-ווי סאָונדס. דער פּראָגראַם אַלאַוז איר צו גער אַ סאָף סומע פון אַודיאָ, מאכן עס ידעאַל פֿאַר נייַעס, בלאָג איינסן, פאָרשונג צייטונגען און ראמאנען.
עס כולל אַודיאָ האָסטינג, MP3 אראפקאפיע און HTML עמבעדיד אַודיאָ שפּילער, וואָס אַלאַוז איר צו נוצן די טעקעס אויף E- לערנען מאָדולעס, יאָוטובע ווידיאס און אנדערע געשעפט ווידיאס.
פּרייסינג
די פּרעמיע פּרייסינג פון די פּלאַטפאָרמע סטאַרץ פון $ 9.99 / חודש.
9. וואָיסעראַ
Voicera איז אַ געצייַג וואָס אַלאַוז איר צו רעקאָרדירן ווויסאָוווערז פֿאַר בלאָג אַרטיקלען און וועב זייַטלעך. מיט דעם געצייַג, איר קענען גער דיין בלאָג פּאָסטן אין אַ ווויסאָוווער מיט די דרוק פון אַ קנעפּל.
דאָס איז ווונדערלעך ווייַל עטלעכע מענטשן בעסער צו הערן צו געשריבן מאַטעריאַל אלא ווי לייענען עס. אַרייַנגערעכנט אַ ווויסאָוווער אין דיין בלאָג אַרטיקלען איז אַ גרויס וועג צו פאַרגרעסערן אָנטייל און געבן דיין פּלאַץ אַ מער דינאַמיש געפיל.
מיט די לעצטע אַי טעכנאָלאָגיע, Voicera קריייץ לעבעדיק סאָונדס וואָס געזונט ווי עכט מענטשן.
Voicera איז דערווייַל בנימצא אין איבער 10 שפּראַכן, מיט מער אויף דעם וועג. אין אַדישאַן צו פּשוט טעקסט, די אַפּ גיט אַ קייט פון אַקסענץ פֿאַר אַ מער ינטעראַקטיוו דערפאַרונג.
פּרייסינג
די פּרעמיע פּרייסינג פון די פּלאַטפאָרמע סטאַרץ פון $ 29.
קסנומקס. ריזעמבאַל אַי
די אַי קול גענעראַטאָר רעזעמבלע אַי פאָוקיסיז אויף פּראַדוסינג הויך-קוואַליטעט סינטעטיש קולות.
פילע טעק פּראַדזשעקס, IVRs און אַפּפּס האָבן געוויינט רעזעמבלע אַי אין ווידעא גאַמעס, קינאָ, טעלעוויזיע מגילה, און אנדערע מידיאַ.
אין סדר צו שאַפֿן ינסטאַנטאַניאַס יקספּיריאַנסיז, רעסעמבלע אַי בוסץ דיין קינסטלעך קול ניצן אַ טעקסט-צו-רעדע גענעראַטאָר אין קאַנדזשאַנגקשאַן מיט נידעריק-לייטאַנסי אַפּיס.
דעם סאַפיסטאַקייטיד טעקסט-צו-רעדע סיסטעם ניצט קינסטלעך סייכל און האט אַ נומער פון געשעפט ניצט. עס האט די פיייקייט צו שאַפֿן אַ קאַסטאַמייזד קול וואָס קענען זיין געוויינט אין פּלאַץ פון Google אָדער Alexa קול אַסיסטאַנץ.
פּרייסינג
איר קענען פּרובירן די פּלאַטפאָרמע פֿאַר פריי און עס טשאַרדזשיז $0.006 פּער סעקונדע.
סאָף
אין מסקנא, TTS ווייכווארג איז אַ סאָרט פון אַסיסטיוו טעכנאָלאָגיע וואָס טראַנסלייץ געשריבן טעקסט צו סינטאַסייזד קול.
TTS ווייכווארג קענען לייענען דיגיטאַל טעקסט הויך, אַזאַ ווי עבאָאָקס, נייַעס מעשיות און אנדערע געשריבן מאַטעריאַלס. עס קענען אויך זיין גענוצט צו מאַכן אַודיאָ ווערסיעס פון דאָקומענטן ווי ריפּאָרץ, פּרעזאַנטיישאַנז און רעזאַמייז פֿאַר מענטשן וואָס בעסער וועלן צו הערן צו דעם מאַטעריאַל ווי צו לייענען עס.
TTS ווייכווארג קענען העלפֿן מענטשן וואָס האָבן לייענען טשאַלאַנדזשיז אָדער וויזשאַוואַל ימפּערמאַנץ, ווי געזונט ווי יענע וואָס ווילן צו מולטיטאַסק בשעת לייענען געדרוקט אינפֿאָרמאַציע, אַזאַ ווי דרייווינג אָדער געניטונג.
עס קען אויך העלפֿן מענטשן וואָס ווי צו הערן צו אינפֿאָרמאַציע אין אן אנדער שפּראַך אָדער וואָס ווילן צו פֿאַרבעסערן זייער פּראָונאַנסייישאַן פון אַ פרעמד שפּראַך.
לאָזן אַ ענטפֿערן