@prefix pubblicazioni: . @prefix unitaDiPersonaleInterno: . @prefix prodotto: . unitaDiPersonaleInterno:MATRICOLA29121 pubblicazioni:autoreCNRDi prodotto:ID93568 . @prefix prodottidellaricerca: . @prefix istituto: . istituto:CDS078 prodottidellaricerca:prodotto prodotto:ID93568 . @prefix unitaDiPersonaleEsterno: . unitaDiPersonaleEsterno:ID12845 pubblicazioni:autoreCNRDi prodotto:ID93568 . @prefix modulo: . modulo:ID2077 prodottidellaricerca:prodotto prodotto:ID93568 . modulo:ID4192 prodottidellaricerca:prodotto prodotto:ID93568 . unitaDiPersonaleInterno:MATRICOLA9570 pubblicazioni:autoreCNRDi prodotto:ID93568 . @prefix rdf: . prodotto:ID93568 rdf:type prodotto:TIPO1301 . @prefix retescientifica: . prodotto:ID93568 rdf:type retescientifica:ProdottoDellaRicerca . @prefix rdfs: . prodotto:ID93568 rdfs:label "Confronto tra diverse tecniche di conversione per la sintesi TTS delle emozioni (Contributo in atti di convegno)"@en . @prefix xsd: . prodotto:ID93568 pubblicazioni:anno "2006-01-01T00:00:00+01:00"^^xsd:gYear . @prefix skos: . prodotto:ID93568 skos:altLabel "
Nicolao M., Drioli C., Cosi P., (2006)
Confronto tra diverse tecniche di conversione per la sintesi TTS delle emozioni
in Scienze Vocali e del Linguaggio Metodologie di Valutazione e Risorse Linguistiche - AISV 2006, 3rd Conference of Associazione Italiana di Scienze della Voce, Pant\u00E8 di Povo - TRENTO, 29-30 Novembre - 1 Dicembre 2006
"^^rdf:HTML ; pubblicazioni:autori "Nicolao M., Drioli C., Cosi P.,"^^xsd:string ; pubblicazioni:paginaInizio "51 (CD 275)"^^xsd:string ; pubblicazioni:paginaFine "51 (CD 291)"^^xsd:string ; pubblicazioni:altreInformazioni "Nicolao M., Drioli C., Cosi P.\n\u0093Confronto tra diverse tecniche di conversione per la sintesi TTS delle emozioni\u0094\nin Giordani V., Bruseghini V., Cosi P. (editors)\nAbstract Book & CD-Rom Proceedings of AISV 2006, 3rd Conference of Associazione Italiana di Scienze della Voce, \\\"Scienze Vocali e del Linguaggio Metodologie di Valutazione e Risorse Linguistiche\\\"\nPant\u00E8 di Povo TRENTO\n29-30 Novembre - 1 Dicembre 2006\nEDK Editore s.r.l.\nPadova, 2007\npp. 275-291 (51).\n\nDescrizione sintetica del prodotto: Nel presente lavoro vengono descritti gli sviluppi delle tecniche per la creazione di una funzione che converte un segnale vocale neutro in uno caratterizzato emotivamente, basate su quanto gi\u00E0 sviluppato in precedenti lavori (Nicolao et alii, 2005; Nicolao et alii, 2006)."^^xsd:string ; pubblicazioni:url "http://aisv2006.fbk.eu/"^^xsd:string ; pubblicazioni:titoloVolume "Scienze Vocali e del Linguaggio Metodologie di Valutazione e Risorse Linguistiche - AISV 2006, 3rd Conference of Associazione Italiana di Scienze della Voce"^^xsd:string ; pubblicazioni:numeroVolume "II-2006"^^xsd:string ; pubblicazioni:note "Nicolao M., Drioli C., Cosi P., \u0093Confronto tra diverse tecniche di conversione per la sintesi TTS delle emozioni\u0094, in Giordani V., Bruseghini V., Cosi P. (editors), Abstract Book & CD-Rom Proceedings of AISV 2006, 3rd Conference of Associazione Italiana di Scienze della Voce, \\\"Scienze Vocali e del Linguaggio Metodologie di Valutazione e Risorse Linguistiche\\\", Pant\u00E8 di Povo TRENTO, 29-30 Novembre - 1 Dicembre 2006, EDK Editore s.r.l., Padova, 2007, pp. 275-291 (51)."^^xsd:string ; pubblicazioni:pagineTotali "77"^^xsd:string ; pubblicazioni:descrizioneSinteticaDelProdotto "Nel presente lavoro vengono descritti gli sviluppi delle tecniche per la creazione di una funzione che converte un segnale vocale neutro in uno caratterizzato emotivamente, basate su quanto gi\u00E0 sviluppato in precedenti lavori (Nicolao et alii, 2005; Nicolao et alii, 2006)."^^xsd:string ; skos:note "P"^^xsd:string , "Google B"^^xsd:string ; pubblicazioni:affiliazioni "ISTC CNR, UOS Padova\nIstituto di Scienze e Tecnologie della Cognizione\nConsiglio Nazionale delle Ricerche\nUnit\u00E0 Organizzativa di Sipporto di Padova\nvia Martiri della Libert\u00E0, 2\n35137 Padova, Italia"^^xsd:string ; pubblicazioni:titolo "Confronto tra diverse tecniche di conversione per la sintesi TTS delle emozioni"^^xsd:string ; pubblicazioni:isbn "978-88-95112-69-5"^^xsd:string ; pubblicazioni:curatoriVolume "Giordani V., Bruseghini V., Cosi P."^^xsd:string ; prodottidellaricerca:abstract "CONFRONTO TRA DIVERSE TECNI\nCHE DI CONVERSIONE PER\nLA SINTESI TTS DELLE EMOZONI\nMauro Nicolao, Carlo Drioli, Piero Cosi\nIstituto di Scienze e Tecnologie della Cognizione - Sede di Padova \\\"Fonetica e Dialettologia\\\"\nConsiglio Nazionale delle Ricerche, via Martiri della Libert\u00E0, 2 - 35127 Padova, Italia\nnicolao@pd.istc.cnr.it\n,\ndrioli@pd.istc.cnr.it\n,\ncosi@pd.istc.cnr.it\nSOMMARIO\nNel presente lavoro vengono descritti gli sviluppi delle tecniche per la creazione di\nuna funzione che converte un segnale vocale neutro in uno caratterizzato emotivamente,\nbasate su quanto gi\u00E0 sviluppato in precedenti lavori (Nicolao et alii, 2005; Nicolao et alii,\n2006).\nSono stati investigati numerosi metodi per creare questa funzione e si \u00E8 cercato di\nstabilire l'efficienza delle diverse trasformazioni, attraverso dei criteri oggettivi (distanza di\nItakura-Saito) e soggettivi (test percettivi).\nTutte le funzioni sviluppate si basano su un approccio di tipo statistico. Nello\nspecifico, per descrivere lo spazio acustico del segnale vocale neutro vengono utilizzati sia\nmodelli a mistura di funzioni gaussiane (GMM), sia catene di Markov nascoste (HMM).\nE' stata valutata anche la possibilit\u00E0 di applicare le funzioni di conversione in vari\npunti del sistema: o come semplice\npost processing\ndel segnale vocale neutro o agendo\ndirettamente su un database di difoni utilizzato da un sintetizzatore vocale.\nI segnali di riferimento per l'allenamento dei modelli statistici sono ricavati da due\ndatabase di segnali vocali creati\nad hoc.\nUno \u00E8 stato registrato con lo scopo di raccogliere il\nmateriale per costruire una voce per un sintetizzatore a concatenazione di difoni (MBROLA\no SMS). Si ipotizza che questo insieme di file audio sia privo di caratterizzazione emotiva.\nLo stesso parlatore, ha inoltre registrato un database di file audio cercando di fornire ad essi\nuna forte componente emotiva (l'emozione utilizzata in questo lavoro \u00E8 la\ncollera\n).\nDa questi insiemi, tramite un processo di\ncopy synthesis,\nsi sono ottenuti due\ncorpora\nperfettamente allineati per quanto riguarda durate, intonazione e fonemi pronunciati. Lo\nstudio si \u00E8 potuto quindi focalizzare sulla modellizzazione delle sole differenze provocate al\nsegnale dall'emozione presente.\nLo spazio acustico del segnale sintetizzato \u00E8 stato diviso in classi omogenee e, ad\nognuna, \u00E8 stata associata una diversa funzione di trasformazione. Il nostro metodo \u00E8, quindi,\ncostituito da 34 funzioni, specializzate per ogni fonema.\nIn Tabella 1 sono elencati le differenze progettuali che differenziano i segnali\nanalizzati nel progetto."@it . @prefix ns12: . prodotto:ID93568 pubblicazioni:editore ns12:ID218 ; prodottidellaricerca:prodottoDi istituto:CDS078 , modulo:ID4192 , modulo:ID2077 ; pubblicazioni:autoreCNR unitaDiPersonaleEsterno:ID12845 , unitaDiPersonaleInterno:MATRICOLA9570 , unitaDiPersonaleInterno:MATRICOLA29121 . @prefix parolechiave: . prodotto:ID93568 parolechiave:insiemeDiParoleChiave . ns12:ID218 pubblicazioni:editoreDi prodotto:ID93568 . parolechiave:insiemeDiParoleChiaveDi prodotto:ID93568 .