Amazon Polly per tradurre un testo in un file audio
da Massimo Della Rovere · pubblicato il 20 dicembre, 2016 · modificato il 5 agosto, 2017

Con Amazon Polly è possibile tradurre un testo scritto in un file vocale che utilizzerà un linguaggio di tipo parlato, quindi non sarà solo una traduzione in voce ma sarà una vera interpretazione del testo che lo renderà una voce parlata reale. Nella console di questo servizio troverete diversi esempi con cui iniziare a fare delle prove.

Il servizio ti permette di sviluppare categorie completamente nuove di prodotti con funzionalità vocali. Amazon Polly è un servizio di intelligenza artificiale (AI) che utilizza tecnologie avanzate di apprendimento per sintetizzare una voce che assomigli il più possibile a quella umana. In servizio include 47 tipi di voce naturale su 24 lingue per permetterti di selezionare la voce ideale su diversi paesi disponibili.

Amazon Polly

Per usare questo servizio dobbiamo utilizzare delle chiamate API che possono essere integrate in qualsiasi linguaggio di programmazione. Come per Amazon Rekognition è possibile usare un tool che ci permette di usare il servizio e provare il risultato finale ancora prima di mettere le mani ai nostri sorgenti. Basta andare nella console del servizio e compilare i campi richiesti come nella seguente schermata:

Da questa schermata possiamo inserire un testo qualsiasi, le cose cambiano molto in base alla punteggiatura utilizzata, selezionare la lingua o la regione, e in base a questo saranno anche elencate le voci di default, ad esempio in italiano troviamo la voce di Carla e Giorgio, in altre lingue si ha più scelta ma è già tanto che ci sia l’italiano :D

Oltre ad ascoltare la voce generata dal testo indicato, la quale verrà elaborata da una chiamata API, è possibile scaricare una copia del file audio in formato MP3. Qui di seguito vi lascio un’esempio audio che ho generato tramite il servizio.

Il servizio mette a disposizione anche una sezione di personalizzazione pronuncia che è possibile eseguire con il caricamento di file di tipo lexicons. Sinceramente ancora non ho approfondito questo argomento in quanto non fa parte delle mie conoscenze specifiche, ma dato che la cosa mi incuriosisce sono sicuro che lo farò. Per il momento vi indico il link alla documentazione W3C su Lexicon Specification (PLS).

Funzioni avanzate

Sulla documentazione ufficiale di Amazon AWS vengono riportate delle caratteristiche tecniche legate all’infrastruttura del servizio che riguardano le performance e il sistema di cache utilizzato. Per approfondimenti vi consiglio Amazon Polly Doc.

Guida completa su AWS

Questo articolo appartiene ad una serie di pubblicazioni che costituiscono una guida completa dedicata agli Amazon Web Services. Molti servizi che trattiamo in questo blog vengono anche spiegati con dei video che trovate nel nostro canale youtube. Se volete seguire questo percorso didattico iscrivetevi alla community Cloud AWS.

4 Commenti

  1. Ciao, non ho ben capito se sono già disponibili le API in PHP. Ho dato una occhiata a https://github.com/aws/aws-sdk-php ma la classe PollyClient non mi sembra completa... o sbaglio ?

  2. Ciao Roberto, i servizi di Amazon vengono sempre rilasciati con le REST API standard, poi vengono implementate anche nei vari SDK per evitare di chiamarle in modo grezzo. Il servizio è nuovo e penso che bisognerà aspettare un pó. Normalmente fanno prima Java, Python e poi PHP.

  3. Mi sembra che Amazon stia passando sempre più da servizi di infrastruttura hardware a servizi per gli sviluppatori. Conosco questi servizi da qualche mese e devo ammettere che sono una continua sorpresa.

  4. Dall'audio di esempio la qualità mi sembra molto alta. Si perde qualcosa nella parte finale del periodo ma il risultato mi sembra perfetto. Sono curioso di provare il servizio integrato tramite linguaggio di alto livello.

condividi