Genero aldetik anbiguoa den hizketaren sintesia euskaraz hizlari-bektore manipulazioaren bidez

##plugins.themes.bootstrap3.article.main##

##plugins.themes.bootstrap3.article.sidebar##

Publicado 24-09-2024
Xabier Sarasola Ander Corral Igor Leturia Iñigo Morcillo

Resumen

Genero aldetik anbiguoa den ahotsa duten text-to-speech (TTS) sistemek gero eta interes handiagoa pizten dute; besteak beste, laguntzaile birtualetan eta bozgorailu adimendunetan genero-alborapenak eta estereotipoak saihesteko duten ahalmenagatik. Artikulu honetan, ahots-bihurketarako teknika berriak aplikatu dizkiegu ahots-bektoreei, sare neuronaletan oinarrituta dauden eta genero aldetik anbiguoak diren euskarazko TTS sistemak lortzeko. Hizlari-bektoreak hiztun anitzeko Tacotron 2-a entrenatuz lortu ditugu. Hizlari-bektoreen normalizazioa eta eskala-parametro bat erabiltzen duten eta erabiltzen ez duten sistemak konparatu ditugu, baita genero bakoitzeko batez besteko hizlari bektore eta ahots errealen hizlari bektoreen erabilera sistema horietan. Emaitzek frogatzen dute aurkeztutako metodoak baliozkoak direla genero aldetik anbiguoak diren ahotsak lortzeko eta kalitate onargarria dutela baina hobetu daitezkeela.

Abstract 220 | PDF (Euskara) Downloads 107

##plugins.themes.bootstrap3.article.details##

Sección
Ale Berezia