miniatura.jpg
Articoli correlati

Domenico Felaco IK6QGE

domenico.ikseiqge@tiscali.it


I QSO con i sottotitoli

Un aiuto per capire meglio i radioamatori che parlano lingue diverse dalla nostra


I sottotitoli automatici su YouTube


L'idea è nata guardando, su YouTube, alcuni film e documentari in inglese e constatando che la presenza dei sottotitoli nella stessa lingua poteva risultare decisiva per la comprensione dei dialoghi e dei commenti.

L'interesse per l'argomento, poi, è aumentato quando è emerso che, se i sottotitoli non erano disponibili, YouTube poteva generarli automaticamente, con un procedimento di riconoscimento vocale non precisissimo ma, come vedremo, in molti casi accettabile.

Allora, ed ecco l'idea, perché non studiare un modo per aggiungere i sottotitoli generati automaticamente anche ai nostri QSO in lingua straniera?

In un primo momento, la cosa non è sembrata difficile da realizzare, visto che molte ottime applicazioni capaci di riconoscere, trascrivere e tradurre i messaggi verbali sono disponibili per i tablet, gli smartphone e i computer. Dopo i primi esperimenti, però, sono emersi parecchi problemi ai quali è stato necessario riservare la debita attenzione e di cui dovremo occuparci qui di seguito.


Le abilità linguistiche


Le abilità linguistiche sono quattro, capire (understanding), parlare (speaking), leggere (reading) e scrivere (writing) e, normalmente, sono acquisite nell'ordine in cui sono state appena elencate.

Durante il processo di apprendimento, quindi, ci si impadronisce prima delle abilità relative alla lingua parlata e poi di quelle che riguardano la lingua scritta. I codici usati per comunicare nelle due varianti della stessa lingua sono completamente diversi: nel primo caso si tratta di fonemi, cioè di suoni e rumori particolari che hanno proprietà distintive all'interno di una parola in una determinata lingua, nel secondo caso ci si serve di segni grafici che rappresentano i fonemi e che consentono di riservare un tempo relativamente maggiore alla comprensione dei messaggi.

Se comunichiamo usando una lingua di cui non siamo pienamente padroni, incontriamo minori difficoltà quando siamo noi a parlare e a scegliere i vocaboli e le strutture che conosciamo meglio, mentre, quando parla il nostro interlocutore, non è sempre detto che le sue scelte coincidano con le nostre conoscenze e competenze.

Dunque, “capire” è generalmente più difficile che “parlare” e questo spiega la grande attenzione che siti come YouTube riservano ai sottotitoli.

Per passare da un ambito generale a quello più specifico delle comunicazioni radioamatoriali, sembra ovvio che, se potessimo anche noi aggiungere dei “sottotitoli” a quello che gli interlocutori ci dicono durante i QSO, avremmo le stesse informazioni espresse con due diversi codici linguistici e potremmo avere qualche possibilità in più di capire i messaggi in lingua straniera che riceviamo durante i nostri collegamenti internazionali.

Naturalmente, il discorso vale per i radioamatori che hanno già una certa dimestichezza con la lingua in cui il QSO si svolge e che incontrano qualche difficoltà solamente quando l'interlocutore parla troppo velocemente o usa un registro linguistico alto. “Le parole che in una società civile una persona può usare o capire sono decine di migliaia” (1) e non è improbabile che molte di esse, quando si ascolta una lingua straniera, possano risultare di difficile comprensione.

Vedremo se le più recenti applicazioni per il riconoscimento vocale, come Google Traduttore, possono essere d'aiuto in questo campo.


Il messaggio e il rumore di fondo


Nessuno meglio di noi radioamatori sa che l'essere umano ha la particolare capacità di distinguere, quando ascolta un messaggio verbale, tra fonemi, che sono significativi da un punto di vista linguistico, e rumori di vario genere, che non portano informazioni ma possono rappresentare un serio ostacolo alla comunicazione.

Quando riceviamo un messaggio su una frequenza radioamatoriale, magari in presenza di un groviglio di rumori, interferenze, splatter e così via, interviene, come accade sempre nella comunicazione linguistica, una “(…) enorme attività di reintegrazione fonematica del discorso” svolta dal nostro “sistema percettivo-mnemonico” (2) che ci consente di estrapolare dal contesto confuso i messaggi che c'interessano.

Durante le prime prove con le applicazioni per il riconoscimento vocale, è emerso subito che, purtroppo, la macchina e il software non hanno la stessa capacità di discernimento, specialmente in situazioni particolarmente rumorose.

Malgrado queste limitazioni, le versioni più recenti delle applicazioni per il riconoscimento vocale, operando con metodi statistici e su enormi archivi di riferimento, offrono qualche possibilità per i fini che c'interessano. L'importante è, come vedremo, cercare di fare arrivare, dalla radio all'applicazione, segnali audio in cui i rumori non prevalgano sui messaggi linguistici.


Il riconoscimento vocale


fig 1

Una volta definiti gli obiettivi e i problemi da superare per conseguirli, è stata avviata la sperimentazione, verificando gradualmente le varie procedure per mettere in evidenza quelle che risultavano più vantaggiose.

Tra le numerose applicazioni per il riconoscimento vocale che sono disponibili, ho scelto Google Traduttore che, tra l'altro, è quella che ho usato più frequentemente nel passato. Tutte le informazioni necessarie per utilizzare adeguatamente questa eccellente applicazione, sono disponibili sul sito http://translate.google.com/about/intl/it_ALL/.

Illustro, qui di seguito, le fasi degli esperimenti così come li ho condotti.

1- Ho preparato il seguente materiale (Fig.1):

- ricetrasmettitore con DSP;

- tablet con Android;

- Google Traduttore installato sul tablet;

- computer portatile (con Linux Ubuntu);

- collegamento wi-fi a Internet;

- cuffie stereo;

- cavi e spinotti per i collegamenti (Fig. 2).


fig. 2


2- Ho avviato Google Traduttore sul tablet, ho scelto due lingue, nel caso specifico italiano e inglese, e ho parlato nel microfono in dotazione. Google Traduttore ha riconosciuto automaticamente la lingua parlata, ha trascritto i messaggi, li ha tradotti nell'altra lingua e ha trascritto anche la traduzione. Parlando direttamente nel microfono in ambiente poco rumoroso, tutto ha funzionato piuttosto bene e i messaggi sono stati trascritti con pochi errori.

3- Per continuare gli esperimenti, ma con i messaggi verbali prodotti da una macchina, ho sostituito alla voce diretta quella di un lettore che, da un PC portatile collegato a YouTube, proponeva alcuni brani di un audiobook in lingua inglese. Anche in questo caso, e sempre usando il microfono in dotazione, in assenza di rumori o interferenze, Google Traduttore ha trascritto e tradotto con pochi errori le frasi proposte dal lettore. Usando i testi trascritti come “sottotitoli”, la comprensione dei brani letti è risultata decisamente agevolata.

4- Ho, finalmente, provato a proporre a Google Traduttore, attraverso il microfono in dotazione, le voci dei radioamatori che partecipavano a un QSO sui 40 metri. Anche con segnali forti e per quanto cercassi di minimizzare l'influenza dei rumori di fondo, non ho ottenuto alcun risultato utile. Google Traduttore ha percepito e trascritto solamente qualche parola, di tanto in tanto, e non sempre correttamente.

5- Il passo successivo è stato quello di realizzare un collegamento diretto tra la presa PHONES del ricetrasmettitore, da una parte, e le cuffie della radio e il tablet con Google Traduttore, dall'altra, usando uno “spinotto sdoppiatore”, come illustrato nella Figura 2. È stato possibile, così, ascoltare in cuffia i risultati ottenuti operando sui vari controlli del ricevitore e osservare, a ogni cambiamento dei parametri, il comportamento di Google Traduttore.


Con segnali forti sui 40 metri, Google ha riconosciuto la lingua parlata (nell'esperimento, l'italiano), e ha cominciato immediatamente a trascrivere i messaggi.

6- Le prove, quindi, si sono spostate sui 20 metri, alla ricerca di qualche QSO in lingua inglese. Risultati accettabili si sono avuti con segnali forti e con una pronuncia decente da parte del radioamatore che parlava.

7- I successivi esperimenti con la versione DEMO di PowerSDR, di cui si possono vedere i risultati, compresi gli errori, nella videata riprodotta in Figura 3, hanno fornito trascrizioni accettabili da usare come “sottotitoli” generati automaticamente.


fig. 3


Conclusioni


Google Traduttore ha ottime potenzialità che riguardano la riproduzione vocale delle traduzioni che, però, durante gli esperimenti, interferivano pesantemente con la comprensione dei messaggi audio ricevuti.

Quando possibile, quindi, tali potenzialità sono state disattivate, proprio per poter restare nell'ambito di una sola lingua e per cercare di capirla meglio con l'aiuto dei “sottotitoli”.

La precisione delle trascrizioni dei messaggi ricevuti sulle frequenze radioamatoriali può essere paragonata, in condizioni ottimali, a quella dei sottotitoli generati automaticamente su YouTube. Qualche volta tutto ha senso e il sistema risulta utile e funzionale, ma qualche volta, proprio come su YouTube, le frasi scritte non hanno niente a che vedere con i messaggi verbali e possono addirittura risultare esilaranti.

Ovviamente, le procedure che ho appena illustrato, che sono condizionate dalle apparecchiature e dal software disponibili, valgono solamente come esempi. Poiché è risultato evidente che per ottenere buone trascrizioni dei messaggi vocali è indispensabile ridurre, per quanto possibile, l'influenza dei rumori di fondo, sembra probabile che, se qualcuno volesse ripetere gli esperimenti usando apparecchiature più sofisticate, per esempio con tecnologia SDR, i risultati potrebbero essere anche più interessanti.

Il campo del riconoscimento vocale è in rapida evoluzione e si può facilmente prevedere che sistemi ancor più efficienti saranno utilizzabili nel prossimo futuro. Intanto, noi sperimentiamo con le applicazioni attualmente disponibili, ma siamo pronti a cogliere le eventuali novità in arrivo per migliorare ulteriormente le nostre possibilità di fare QSO in lingua straniera.


Note


1- André Martinet, Elementi di linguistica generale, Editori Laterza, Bari, pag. 24.

2- Walter Berardi, Elementi di fonologia, Edizioni dell'Ateneo, Roma, pag. 208.


Indietro    Menu     Home