Ada Boido
convertire un file audio in formato testo
Scarica il file in formato WordScopo della procedura è quello di trascrivere il testo parlato contenuto in un file audio salvandolo in un file di testo modificabile.
Questa trasformazione può essere utile per trascrivere conferenze, riunioni o lezioni scolastiche registrate, ricavandone appunti strutturati e verbali delle riunioni;
naturalmente, le registrazioni con una buona dizione e senza rumori di fondo daranno risultati migliori.
Purtroppo alcuni passaggi finali della procedura non sono accessibili in quanto tutto il flusso audio viene convogliato in un driver interno del PC; esistono sicuramente diverse soluzioni per ovviare a questo problema, tuttavia penso che la procedura possa essere condivisa anche allo scopo di consentire a tutti gli interessati di fare sperimentazione per migliorarne i difetti.
Tutto il software utilizzato è freeware; esistono programmi acquistabili per lo stesso scopo ma il vantaggio di questa procedura è quello di sfruttare il motore di riconoscimento vocale di Google che è molto potente e costantemente aggiornato.
Un altro vantaggio consiste nel poter utilizzare qualsiasi formato audio senza essere vincolati ai soli formati gestiti dal programma di conversione.
Strumenti utilizzati:
• PC Notebook Hewlet Packard Windows 10• Driver audio Virtual Cable
• Win Rar per la gestione di file compressi
• Lettore multimediale VLC
• Browser Google Chrome
• connessione internet
• file audio mp3 o qualsiasi formato audio o video.
• sintesi vocale NVDA
Per quanto riguarda la scelta di VLC Media Player, ho scelto questo software perché consente di variare la velocità di riproduzione ma si potrebbe utilizzare un altro software analogo.
Per quanto riguarda invece l’impiego di Google Chrome, si tratta di una scelta obbligatoria perché il motore di riconoscimento vocale viene reso disponibile da Google solo all’interno del proprio browser.
Procedura in breve:
1 Installare il driver Virtual Cable sul pc2 Aprire la pagina Web Speech Demonstration nel browser Google Chrome.
3 Aprire VLC per riprodurre il file audio. Attenzione: dal passo successivo la sintesi vocale non sarà più disponibile!
4 Impostare Virtual Cable come dispositivo predefinito in Registrazione e in riproduzione.
5 Avviare la riproduzione del file Audio e il riconoscimento del testo
6 Ripristinare il driver audio alle impostazioni precedenti. Da questo momento si potrà nuovamente sentire la sintesi vocale.
7 Trasferire il testo ottenuto in un editor per la gestione di documenti.
Procedura passo passo
1 Installare il driver Virtual Cable sul pcQuesto passaggio si esegue solo la prima volta.
Aprire il vostro browser preferito e andare all’indirizzo:
www.vb-audio.com/Cable/index.htm oppure: Cercare con Google il download di VB Cable Virtual Audio Device. Per scaricare cliccare su VBCABLE_Driver_Pack43.zip (1.09 MB - OCT 2015) Click Here to download from alternative web site.
Il sistema Windows chiederà se si vuole aprire o salvare il file. Fare click su Salva. Nella cartella predefinita Download si troverà il file VBCABLE_Driver_Pack43
Creare una nuova cartella sul Desktop dentro la quale spostare il file scaricato che è in formato .zip
Estrarre il contenuto del file compresso con la funzione estrai qui di Win Rar presente nel menu contestuale.
All’interno della cartella si troveranno tutti i file estratti tra i quali i seguenti:
VBCABLE_Setup_x64 e VBCABLE_Setup
Eseguire il primo setup se il pc è a 64 bit altrimenti eseguire il secondo.
Il file selezionato deve essere eseguito come amministratore. Per fare ciò bisogna aprire il menu contestuale e selezionare Esegui come amministratore. Dopo avere installato il driver chiudere tutti i programmi e riavviare il computer.
2 Aprire la pagina Web Speech Demonstration nel browser Google Chrome.
Avviare Google Chrome. Digitare il seguente indirizzo nella barra degli indirizzi:
www.google.com/intl/it/chrome/demos/speech.html oppure cercare con Google il servizio web speech demonstration Se non lo avete mai utilizzato prima, potrebbe apparire un messaggio nel quale vi viene chiesto il permesso di accedere al microfono.
La pagina si presenta con un’area centrale nella quale inizierà ad apparire il testo nonappena sarà avviata la registrazione. Al di sotto si trova la tendina per la selezione della lingua. A destra di questa area si trova il pulsante Start che attiva ed interrompe la registrazione.
Per verificare che la registrazione funzioni, fare click sul pulsante Start e parlare a voce alta e chiara. Il testo si formerà nell’area sopra indicata.
Per terminare fare di nuovo click sul pulsante Start.
Il testo si cancella automaticamente ad ogni nuova registrazione.
3 Aprire VLC per riprodurre il file audio.
Aprire VLC Media Player per riprodurre il file audio contenente il parlato da trascrivere.
Avviare una riproduzione di prova per regolare volume e velocità. La velocità deve essere leggermente rallentata per dare al motore di riconoscimento il tempo di elaborare il testo simultaneamente. Evitare però di impostarla troppo lenta per non distorcere i suoni.
Per regolare la velocità aprire il menu Riproduzione, selezionare Velocità quindi impostare quella desiderata, per es. Più lento. Non bisogna però impostare una riproduzione troppo lenta perché potrebbe distorcere il suono delle parole.
Posizionare il file mp3 all’inizio e mettere in pausa. A questo punto tutti i componenti sono pronti per lavorare.
4 Impostare Virtual Cable come dispositivo predefinito in Registrazione e in riproduzione.
Aprire il menu contestuale sull’icona Altoparlante Cassa Cuffie presente in basso a destra nella barra delle applicazioni.
Selezionare Dispositivi di registrazione.
Selezionare VB Cableoutput ed aprire il menu contestuale.
Scegliere Imposta come dispositivo predefinito.
Restando in questa finestra, selezionare Riproduzione dalle schede presenti in alto.
La stessa operazione si ottiene riaprendo il menu contestuale Cassa Cuffie dalla barra delle applicazioni e selezionando Dispositivi di riproduzione.
Scegliere Vb Cable input ed aprire il menu contestuale.
Da questo momento non si potranno sentire l’audio e la sintesi vocale perché il segnale verrà convogliato esclusivamente all’interno del pc, nel driver Virtual Cable.
Dal menu contestuale che abbiamo già aperto su VB Cable input, selezionare Imposta come dispositivo predefinito.
5 Avviare la riproduzione del file Audio e il riconoscimento del testo
Avviare la riproduzione del file audio in VLC e immediatamente, fare click sul pulsante Start nella pagina Web Speech, all’interno di Google Chrome.
La riproduzione del file audio inizierà a scorrere in silenzio mentre sulla finestra attiva di Chrome il testo si formerà simultaneamente.
Lasciare la finestra Chrome attiva fino alla fine della riproduzione.
Attenzione: se il pulsante Start viene cliccato inavvertitamente durante l’elaborazione, il processo si arresta e, al click successivo, il testo viene automaticamente cancellato dalla finestra del testo.
Non potendo sentire l’audio riprodotto, si suggerisce di calcolarne la durata in anticipo, in modo tale da sapere quando sarà finito il processo.
Al termine il riquadro in Web Speech conterrà il testo che il motore di Google è stato in grado di riconoscere.
6 Ripristinare il driver audio alle impostazioni precedenti.
Tornare nella finestra Audio che abbiamo lasciato aperta sulla scheda Riproduzione.
Selezionare Cassa Cuffie.
Aprire il menu contestuale e scegliere Imposta come dispositivo predefinito.
Da questo momento si potrà sentire la sintesi vocale.
Sempre nella finestra Audio, selezionare la scheda Registrazione.
Selezionare Microfono e aprire il menu contestuale.
Selezionare Imposta come dispositivo predefinito.
7 Trasferire il testo ottenuto in un editor per la gestione di documenti.
Tornare in Google Chrome e selezionare il testo presente nella finestra di testo di Web Speech quindi copiare con ctrl+c.
Aprire il programma di editing desiderato come per es. Microsoft Word e incollare il testo in un documento con ctrl+v. Il testo è ora pronto per l’inevitabile correzione manuale.
Si dovrà inserire la punteggiatura, correggere gli errori eliminare le frasi superflue, colmare le lacune.
In caso di dubbio si può sempre riascoltare la traccia audio per recuperare eventuali informazioni che non siano state riportate fedelmente.
Workaround
Metodo temporaneo per risolvere il problema del ripristino delle impostazioni audio in assenza della sintesi vocale:La soluzione ideale per evitare il blackout audio durante la conversione, sarebbe quella di poter attivare contemporaneamente il driver interno Virtual Cable ssenza disattivare il canale esterno Cassa Cuffie. Purtroppo al momento attuale, non dispongo di tale possibilità.
Ho pertanto inserito una scorciatoia che si può adottare con le dovute personalizzazioni visto che ogni PC è diverso.
Entrare nel pannello di Controllo.
Cercare le impostazioni Audio ed aprire il menu contestuale.
Selezionare Crea collegamento.
Si aprirà il messaggio: Impossibile creare collegamento in questa posizione. Creare collegamento sul desktop? Selezionare Si.
Andare sull’icona del collegamento sul desktop appena creata e aprire il menu contestuale.
Selezionare Proprietà e aprire la scheda Collegamento.
Posizionarsi nella finestra Tasti di scelta rapida quindi digitare la combinazione di tasti preferita. Sarà sufficiente digitare una lettera, per es. la lettera A, per ottenere la combinazione CTRL+ALT+A.
In questo modo si potrà richiamare la finestra del driver audio quando la sintesi vocale è muta premendo CTRL+ALT+A
Si esegue il seguente percorso per riattivare l’audio: CTRL+ALT+A
Se l’ultima opperazione è stata fatta nella scheda Riproduzione, la stessa scheda sarà nuovamente riaperta.
Freccia giù seleziona Cassa Cuffie.
Aprire il menu contestuale con il proprio tasto funzione. Sui portatili HP la combinazione è SHIFT+F10) Freccia giù per 4 volte si posiziona su Imposta dispositivo come predefinito.
Invio riattiva l’audio e la sintesi vocale.
Versione del documento 1.0 del 27 Novembre 2017 Ada Boido