Efa naniry ny handre ny toetranao tianao indrindra ve ianao? Lasa zava-misy tsikelikely ny text-to-speech maneno voajanahary miaraka amin'ny fianarana milina.
Ohatra, ny maodely NAT TTS an'ny Google dia ampiasaina hanamafisana ny vaovao Feo manokana fanompoana. Ity serivisy ity dia mampiasa tambajotra neural hamokatra feo voaofana avy amin'ny fandraisam-peo. Web apps toy ny Uberduck omeo feo an-jatony hofidinao hamoronana lahatsoratra narindranao manokana.
Ato amin'ity lahatsoratra ity, hojerentsika ny maodely AI manaitra sy saro-pantarina antsoina hoe 15.ai. Noforonin'ny mpamorona tsy mitonona anarana, mety ho iray amin'ireo mahomby sy mampihetsi-po indrindra maodely text-to-speech hatreto aloha.
Inona no atao hoe 15.ai?
15. ai dia rindranasa an-tranonkala AI izay afaka mamoaka feo amin'ny lahatsoratra amin'ny kabary mihetsiketsika. Ny mpampiasa dia afaka misafidy amin'ny feo isan-karazany manomboka amin'ny Spongebob Squarepants ka hatramin'ny HAL 9000 nanomboka tamin'ny 2001: A Space Odyssey.
Ny fandaharan'asa dia novolavolain'ny mpikaroka MIT taloha tsy mitonona anarana miasa amin'ny anarana 15. Ny mpamorona dia nanambara fa ny tetikasa dia noforonina tamin'ny voalohany ho ampahany amin'ny Programan'ny Fikarohana momba ny Fikarohana undergraduate an'ny oniversite.
Maro amin'ireo feo hita ao amin'ny 15.ai no voaofana amin'ny angon-drakitra ho an'ny daholobe momba ny toetran'ny My Little Pony: Friendship is Magic. Ireo mpankafy mazoto amin'ny seho dia nanao ezaka fiaraha-miasa hanangonana, handika ary handrindra ny ora fifampiresahana miaraka amin'ny tanjona hamoronana mpamorona lahatsoratra amin'ny kabary marina amin'ireo endri-tsoratra tiany indrindra.
Inona no azo atao 15.ai?
Ny fampiharana tranonkala 15.ai dia miasa amin'ny alàlan'ny fisafidianana iray amin'ireo tarehin-tsoratra foronina am-polony izay nampiofanana ilay maodely ary nandefa lahatsoratra fampidirana. Rehefa avy manindry ny Mamorona, ny mpampiasa dia tokony hahazo raki-peo telo amin'ny endri-tsoratra noforonina miteny ireo andalana nomena.
Koa satria ny fianarana lalina Ny modely ampiasaina dia tsy voafaritra, 15.ai dia mamoaka lahateny hafa kely isaky ny mandeha. Mitovy amin'ny fomba mety itakian'ny mpilalao iray ny zavatra maro mba hahazoana ny fanaterana mety, ny 15.ai dia mamorona fomba fanaterana isan-karazany isaky ny mahita vokatra tiany ny mpampiasa.
Ny tetikasa dia misy endri-javatra tokana ahafahan'ny mpampiasa manova amin'ny tanana ny fihetseham-pon'ny tsipika novokarina amin'ny fampiasana contextualizers ara-pihetseham-po. Ireo mari-pamantarana ireo dia afaka manatsoaka ny fihetseham-pon'ny emojis-input mpampiasa mampiasa ny MIT's DeepMoji modely.
Araka ny filazan'ny mpamorona, ny mampiavaka an'i 15.ai amin'ireo programa TTS mitovy amin'izany dia ny fiankinan'ilay modely amin'ny angon-drakitra kely dia kely mba hanamafisana ny feo ary "mihazona ny fihetseham-po sy ny maha-ara-dalàna azy".
Ahoana no fiasan'ny 15.ai?
Andeha hojerentsika ny teknolojia ao ambadiky ny 15.ai.
Voalohany, ny mpamorona ny 15.ai dia milaza fa ny programa dia mampiasa maodely mahazatra hamokarana feo misy toe-po samihafa. Koa satria mbola tsy namoaka taratasy amin'ny antsipiriany momba ny tetikasa ny mpanoratra, dia afaka manao vinavina midadasika ny zava-mitranga ao ambadiky ny sehatra isika.
Famerenana ny Phonemes
Voalohany, andeha hojerentsika ny fomba fandraisan'ny programa ny lahatsoratra fampidirana. Alohan'ny ahafahan'ny programa mamoaka lahateny, dia tsy maintsy mamadika ny teny tsirairay ho amin'ny fitambaran'ny fonemany izy. Ohatra, ny teny hoe "alika" dia misy fonema telo: /d/, /ɒ/, ary /ɡ/.
Ahoana anefa no ahafantaran'i 15.ai hoe inona ny fonema ampiasaina amin'ny teny tsirairay?
Araka ny pejy Momban'ny 15.ai, dia mampiasa tabilao fitadiavana rakibolana ny fandaharana. Ny tabilao dia mampiasa ny Oxford Dictionaries API, Wikibolana, ary ny CMU Pronouncing Dictionary ho loharano. 15.ai dia mampiasa tranonkala hafa toa ny Reddit sy Urban Dictionary ho loharanon'ny teny sy andian-teny vao noforonina.
Raha tsy misy teny nomena ao amin'ny rakibolana, ny fanononana azy dia tsoahina amin'ny alalan'ny fitsipi-pitenenana izay nianaran'ilay modely avy amin'ny LibriTTS dataset. Ity angon-drakitra ity dia corpus–angona misy teny an-tsoratra na tenenina amin'ny fitenin-drazana na fitenim-paritra—misy 585 ora eo ho eo ny olona miteny anglisy.
Embedding Emotions
Araka ny filazan'ny mpamorona, ny modely dia manandrana maminavina ny fihetseham-po tsapa amin'ny lahatsoratra fampidirana. Ny modely dia manatanteraka io asa io amin'ny alàlan'ny DeepMoji famakafakana ny fahatsapana modely. Ity maodely manokana ity dia niofana tamin'ny bitsika an'arivony tapitrisa miaraka amin'ny emoji miaraka amin'ny tanjona hahatakatra ny fomba ampiasana ny fiteny hanehoana fihetseham-po. Ny vokatr'ilay maodely dia ampidirina ao amin'ny maodely TTS mba hanodikodinana ny vokatra mankany amin'ny fihetseham-po irina.
Raha vantany vao nesorina tao amin'ny lahatsoratry ny teny fampidirana ny phonemes sy ny fihetseham-po, dia izao no fotoana hanambadiana kabary.
Voice Cloning sy Synthesis
Ny maodely text-to-speech toy ny 15.ai dia fantatra amin'ny hoe maodely multi-speaker. Ireo modely ireo dia natsangana mba hahafahana mianatra miteny amin'ny feo samihafa. Mba hampiofanana araka ny tokony ho izy ny maodetsika, dia tsy maintsy mitady fomba hanesorana ireo endri-peo miavaka isika ary haneho izany amin'ny fomba azon'ny solosaina iray. Ity dingana ity dia fantatra amin'ny hoe fametahana mpandahateny.
Mampiasa maodely text-to-speech amin'izao fotoana izao ny tambajotra vaovao mba hamoronana ny tena vokatra audio. Ny tamba-jotra neural amin'ny ankapobeny dia misy faritra roa lehibe: encoder sy decoder.
Ny encoder dia manandrana manangana véctor famintinana tokana mifototra amin'ny véctor fampidirana isan-karazany. Apetraka ao amin'ny encoder ny fampahafantarana momba ny phonemes, ny lafiny fihetseham-po, ary ny endri-peo mba hamoronana fanehoana ny tokony ho vokatra. Ny decoder dia mamadika an'io fanehoana io ho audio ary mamoaka isa fahatokisana.
Ny fampiharana tranonkala 15.ai avy eo dia mamerina ny valiny telo voalohany miaraka amin'ny isa fahatokisana tsara indrindra.
olana
Miaraka amin'ny firongatry ny votoaty vokarin'ny AI toy ny deepfakes, mety ho olana ara-moraly lehibe ny famolavolana AI mandroso izay afaka maka tahaka ny olona tena izy.
Amin'izao fotoana izao, ireo feo azonao isafidianana amin'ny fampiharana tranonkala 15.ai dia olona noforonina avokoa. Na izany aza, tsy nanakana ny fampiharana tsy hahazo resabe amin'ny aterineto izany.
Mpilalao feo vitsivitsy no nanosika ny fampiasana ny teknolojia cloning feo. Ny fanahiana avy amin'izy ireo dia ny fakàna sary, ny fampiasana ny feon'izy ireo amin'ny votoaty mazava, ary ny mety hahatonga ny teknôlôjia hahatonga ny anjara asan'ilay mpilalao feo ho lany andro.
Nisy resabe hafa nitranga tany am-piandohan'ny taona 2022 rehefa hita fa mampiasa ny 15.ai ny orinasa antsoina hoe Voiceverse NFT mba hamoronana votoaty ho an'ny fampielezan-kevitr'izy ireo.
Famaranana
Ny text-to-kabary dia efa tena manjaka amin'ny fiainana andavanandro. Mpanampy feo, navigateur GPS. ary ny antso an-telefaona mandeha ho azy dia efa lasa mahazatra. Na izany aza, ireo fampiharana ireo dia mazava ho azy fa tsy maha-olombelona ka azontsika lazaina fa kabary vita amin'ny milina izy ireo.
Ny teknolojia TTS maneno voajanahary sy mampihetsi-po dia mety hanokatra varavarana ho an'ny fampiharana vaovao. Na izany aza, mbola mampiahiahy ny etika amin'ny kloning feo. Azo antoka fa misy dikany ny antony maro amin'ireo mpikaroka ireo no tsy sahy mizara ny algorithm amin'ny besinimaro.
Leave a Reply