Domenico
Felaco IK6QGE
domenico.ikseiqge@tiscali.it
I
QSO con i sottotitoli
Un
aiuto per capire meglio i radioamatori che parlano lingue diverse
dalla nostra
I
sottotitoli automatici su YouTube
L'idea
è nata guardando, su YouTube, alcuni film e documentari in inglese e
constatando che
la presenza dei sottotitoli nella stessa lingua poteva risultare
decisiva
per la comprensione dei dialoghi e dei commenti.
L'interesse
per l'argomento, poi, è aumentato quando
è emerso che, se i sottotitoli non erano disponibili, YouTube
poteva generarli automaticamente, con un procedimento
di riconoscimento vocale non precisissimo ma, come vedremo, in
molti casi accettabile.
Allora,
ed ecco l'idea, perché non studiare un modo per aggiungere i
sottotitoli generati automaticamente anche ai nostri QSO in lingua
straniera?
In
un primo momento, la cosa non è sembrata difficile da realizzare,
visto che molte ottime applicazioni capaci di riconoscere,
trascrivere e tradurre i messaggi verbali sono disponibili per i
tablet, gli smartphone e i computer. Dopo i primi esperimenti, però,
sono emersi parecchi problemi ai quali è stato necessario riservare
la debita attenzione e di cui dovremo occuparci qui di seguito.
Le
abilità linguistiche
Le
abilità linguistiche sono quattro, capire (understanding), parlare
(speaking), leggere (reading) e scrivere (writing) e, normalmente,
sono acquisite nell'ordine in cui sono state appena elencate.
Durante
il processo di apprendimento, quindi, ci si impadronisce prima delle
abilità relative alla lingua parlata e poi di quelle che riguardano
la lingua scritta. I codici usati per comunicare nelle due varianti
della stessa lingua sono completamente diversi: nel primo caso si
tratta di fonemi, cioè di suoni e rumori particolari che hanno
proprietà distintive all'interno di una parola in una determinata
lingua, nel secondo caso ci si serve di segni grafici che
rappresentano i fonemi e che consentono di riservare un tempo
relativamente maggiore alla comprensione dei messaggi.
Se
comunichiamo usando una lingua di cui non siamo pienamente padroni,
incontriamo minori difficoltà
quando
siamo noi a parlare e a
scegliere
i vocaboli e le strutture che conosciamo meglio, mentre,
quando parla il nostro interlocutore, non è sempre detto che le sue
scelte coincidano con le nostre conoscenze e competenze.
Dunque,
“capire” è generalmente più difficile che “parlare” e
questo spiega la grande attenzione che siti come YouTube riservano ai
sottotitoli.
Per
passare da un ambito generale a quello più specifico delle
comunicazioni radioamatoriali, sembra ovvio che, se potessimo anche
noi aggiungere dei “sottotitoli” a quello che gli interlocutori
ci dicono durante i QSO, avremmo le stesse informazioni espresse con
due diversi codici linguistici e potremmo avere qualche possibilità
in più di capire i messaggi in lingua straniera che riceviamo
durante i nostri collegamenti internazionali.
Naturalmente,
il discorso vale per i radioamatori che hanno già
una certa dimestichezza con la lingua in cui il QSO si
svolge e che incontrano
qualche difficoltà solamente
quando l'interlocutore parla troppo velocemente o usa un
registro linguistico alto. “Le
parole che in una società civile una persona può usare o capire
sono decine di migliaia” (1)
e non è improbabile che molte di esse,
quando si ascolta
una lingua straniera, possano risultare
di difficile comprensione.
Vedremo
se le più recenti applicazioni per il riconoscimento vocale, come
Google Traduttore, possono essere d'aiuto in
questo campo.
Il
messaggio e il rumore di fondo
Nessuno
meglio di noi radioamatori sa che l'essere umano ha la particolare
capacità di distinguere, quando ascolta un messaggio verbale, tra
fonemi, che sono significativi da un punto di vista linguistico, e
rumori di vario genere, che non portano informazioni ma possono
rappresentare un serio ostacolo alla comunicazione.
Quando
riceviamo un messaggio su una frequenza radioamatoriale, magari in
presenza di un groviglio di rumori, interferenze, splatter e così
via, interviene, come accade sempre nella comunicazione linguistica,
una “(…) enorme attività di reintegrazione fonematica del
discorso” svolta dal nostro “sistema percettivo-mnemonico” (2)
che ci consente di estrapolare dal contesto confuso i messaggi che
c'interessano.
Durante
le prime prove con le applicazioni per il riconoscimento vocale, è
emerso subito che, purtroppo, la macchina e il software non hanno la
stessa capacità di discernimento, specialmente in situazioni
particolarmente rumorose.
Malgrado
queste limitazioni, le versioni più recenti delle applicazioni per
il riconoscimento vocale, operando con metodi statistici e su enormi
archivi di riferimento, offrono qualche possibilità per i fini che
c'interessano. L'importante è, come vedremo, cercare di fare
arrivare, dalla radio all'applicazione, segnali audio in cui i rumori
non prevalgano sui messaggi linguistici.
Il
riconoscimento vocale
Una
volta definiti gli obiettivi e i problemi da superare per
conseguirli, è stata avviata la sperimentazione, verificando
gradualmente le varie procedure per mettere in evidenza quelle
che risultavano più vantaggiose.
Tra
le numerose applicazioni per il riconoscimento vocale che
sono disponibili,
ho
scelto
Google Traduttore
che,
tra l'altro,
è quella
che
ho usato più frequentemente nel
passato.
Tutte
le informazioni
necessarie
per utilizzare adeguatamente questa
eccellente
applicazione, sono
disponibili sul
sito http://translate.google.com/about/intl/it_ALL/.
Illustro,
qui di seguito, le fasi degli esperimenti così come li ho condotti.
1-
Ho preparato il seguente materiale (Fig.1):
-
ricetrasmettitore con DSP;
-
tablet con Android;
-
Google Traduttore installato sul tablet;
-
computer portatile (con Linux Ubuntu);
-
collegamento wi-fi a Internet;
-
cuffie stereo;
-
cavi e spinotti per i collegamenti (Fig. 2).
2-
Ho avviato Google
Traduttore sul tablet, ho
scelto due lingue, nel
caso specifico italiano
e inglese, e ho
parlato nel microfono
in dotazione. Google Traduttore
ha riconosciuto
automaticamente la lingua parlata,
ha trascritto
i messaggi, li ha
tradotti nell'altra
lingua e ha trascritto
anche
la traduzione. Parlando
direttamente nel microfono in ambiente poco rumoroso, tutto ha
funzionato
piuttosto bene e i
messaggi sono stati trascritti con pochi errori.
3-
Per continuare gli esperimenti, ma con
i messaggi verbali
prodotti da una macchina, ho sostituito alla voce diretta
quella di un lettore che, da un PC portatile collegato a YouTube,
proponeva alcuni brani di un audiobook in lingua inglese. Anche in
questo caso, e sempre usando il microfono in dotazione, in assenza di
rumori o interferenze, Google Traduttore ha trascritto e tradotto con
pochi errori le frasi proposte dal lettore. Usando i testi trascritti
come “sottotitoli”, la comprensione dei brani letti è
risultata decisamente agevolata.
4-
Ho, finalmente, provato a proporre a Google Traduttore,
attraverso il microfono in
dotazione, le
voci dei radioamatori che partecipavano a un
QSO sui 40 metri. Anche
con segnali forti e per
quanto cercassi di minimizzare l'influenza dei rumori di fondo,
non ho ottenuto alcun risultato utile. Google Traduttore ha percepito
e trascritto solamente qualche parola, di tanto in tanto, e non
sempre correttamente.
5-
Il passo successivo è stato quello di realizzare un collegamento
diretto tra
la presa PHONES del
ricetrasmettitore, da una parte, e le cuffie della radio e il tablet
con Google Traduttore, dall'altra, usando uno “spinotto
sdoppiatore”, come illustrato nella Figura 2. È stato possibile,
così, ascoltare in cuffia i risultati ottenuti operando sui vari
controlli del ricevitore e osservare, a ogni cambiamento dei
parametri, il comportamento di Google Traduttore.
Con
segnali forti sui 40 metri, Google ha riconosciuto la lingua parlata
(nell'esperimento, l'italiano), e ha cominciato immediatamente a
trascrivere i messaggi.
6-
Le prove, quindi, si sono spostate sui 20 metri, alla ricerca di
qualche QSO in lingua inglese. Risultati accettabili si sono avuti
con segnali forti e con una pronuncia decente da parte del
radioamatore che parlava.
7-
I successivi esperimenti con la versione DEMO di PowerSDR, di cui si
possono vedere i risultati, compresi gli errori, nella videata
riprodotta in Figura 3, hanno fornito trascrizioni accettabili da
usare come “sottotitoli” generati automaticamente.
Conclusioni
Google
Traduttore ha ottime
potenzialità che riguardano la riproduzione
vocale delle traduzioni
che, però,
durante gli
esperimenti, interferivano pesantemente con la comprensione
dei messaggi audio ricevuti.
Quando
possibile, quindi, tali
potenzialità sono state disattivate, proprio per poter
restare nell'ambito di una sola lingua e per cercare di capirla
meglio con l'aiuto dei “sottotitoli”.
La
precisione delle
trascrizioni dei messaggi ricevuti sulle frequenze
radioamatoriali può essere paragonata, in condizioni ottimali, a
quella dei sottotitoli generati automaticamente su YouTube.
Qualche volta tutto ha senso e il sistema risulta utile e funzionale,
ma qualche
volta, proprio come su YouTube,
le frasi
scritte non hanno niente a che vedere con i messaggi verbali e
possono addirittura risultare esilaranti.
Ovviamente,
le procedure che ho appena illustrato, che sono condizionate dalle
apparecchiature e dal software disponibili, valgono solamente come
esempi. Poiché è risultato evidente che per ottenere buone
trascrizioni dei messaggi vocali è indispensabile ridurre,
per quanto possibile, l'influenza dei rumori di fondo, sembra
probabile che, se qualcuno volesse ripetere gli esperimenti usando
apparecchiature più sofisticate, per
esempio con tecnologia
SDR, i risultati potrebbero essere anche più interessanti.
Il
campo del riconoscimento vocale è in rapida evoluzione e si può
facilmente prevedere che sistemi ancor più efficienti saranno
utilizzabili nel prossimo futuro. Intanto, noi sperimentiamo con le
applicazioni attualmente disponibili, ma siamo pronti a cogliere le
eventuali novità in arrivo per migliorare ulteriormente le nostre
possibilità di fare QSO in lingua straniera.
Note
1-
André Martinet, Elementi di linguistica generale, Editori
Laterza, Bari, pag. 24.
2-
Walter Berardi, Elementi di fonologia, Edizioni dell'Ateneo,
Roma, pag. 208.
|