Voce Chiara Oltre la Mascherina: Sveliamo le Wavelet Ottimali con COPRAS!
Ciao a tutti! Sono qui oggi per parlarvi di una sfida che, scommetto, abbiamo affrontato tutti, specialmente negli ultimi anni: capire cosa dicono le persone quando indossano mascherine o visiere. Frustrante, vero? Il suono arriva ovattato, distorto, e a volte decifrare le parole diventa un’impresa. Ma se vi dicessi che la scienza e la matematica ci vengono in aiuto anche in questo? Esiste uno strumento potentissimo chiamato analisi wavelet, che è un po’ come avere una lente d’ingrandimento super avanzata per scrutare dentro i segnali, come quelli della nostra voce.
Ma Cos’è Questa Analisi Wavelet?
Immaginate di poter scomporre un suono complesso, come la voce umana, nelle sue “note” fondamentali, analizzando sia la frequenza (quanto è acuta o grave la nota) sia quando esattamente quella nota viene suonata. L’analisi wavelet fa proprio questo! È una tecnica di analisi tempo-frequenza che ci permette di “zoomare” sui dettagli di un segnale in modi che altri metodi non consentono. Utilizza delle funzioni speciali, chiamate “wavelet madre”, come dei piccoli “stampini” per confrontare e analizzare il segnale. Pensatela come usare diverse lenti (le wavelet madre) per osservare un oggetto (il segnale vocale): ogni lente rivela dettagli differenti.
La Trasformata Wavelet Discreta (DWT), una versione specifica di questa tecnica, scompone il segnale in due parti: una che cattura le informazioni a bassa frequenza (i suoni più gravi, le “approssimazioni”) e una che cattura quelle ad alta frequenza (i suoni più acuti, i “dettagli”). Questo processo può essere ripetuto più volte, andando sempre più in profondità nell’analisi. È una tecnica già usata con successo per migliorare la qualità del parlato, eliminare rumori di fondo e molto altro.
Il Problema: Quale Lente Usare?
Qui arriva il bello, o meglio, la sfida! Esistono tantissime wavelet madre diverse (come le famiglie Daubechies, Symlet, Coiflet, solo per citarne alcune), ognuna con le sue caratteristiche uniche. Il punto è che, analizzando lo stesso segnale vocale con wavelet madre diverse, si ottengono risultati diversi! Scegliere quella “giusta” è fondamentale per ottenere un’analisi accurata ed efficace, ma come si fa? È un po’ come scegliere l’occhiale giusto per vedere bene: una scelta sbagliata può compromettere tutto.
Storicamente, la scelta si basava su criteri qualitativi (simmetria, regolarità) o su metodi quantitativi che cercavano la wavelet più “simile” al segnale da analizzare. Ad esempio, si può calcolare il Coefficiente Massimo di Correlazione Incrociata (MCC): più alta è la correlazione tra la wavelet e il segnale, meglio è. Un altro approccio è il Rapporto Massimo Energia/Entropia di Shannon (MEER): cerca la wavelet che concentra meglio l’energia del segnale nei suoi coefficienti più importanti, riducendo la “dispersione” dell’informazione.

La Nostra Indagine: Voci Sotto Maschera
Affascinato da questa problematica, ho partecipato a una ricerca proprio su questo tema. Abbiamo registrato la voce di quattro persone (non madrelingua inglesi, ma abituate a usare l’inglese) mentre leggevano vocali e un brano specifico (il “Grandfather Passage”). E l’abbiamo fatto in diverse condizioni:
- Senza mascherina
- Con mascherina chirurgica
- Con mascherina di stoffa
- Con doppia mascherina (chirurgica sotto, stoffa sopra)
- Con mascherina N95
- E tutte queste opzioni anche con l’aggiunta di una visiera!
L’obiettivo era capire come queste barriere fisiche alterassero il segnale vocale e, soprattutto, quale wavelet madre fosse la migliore per analizzare queste voci “mascherate”. Abbiamo registrato tutto con cura, ripetendo le prove tre volte per ogni condizione, per assicurarci che i dati fossero solidi. Abbiamo usato sia il metodo MCC che il metodo MEER per valutare ben 18 diverse wavelet madre appartenenti alle famiglie Daubechies (inclusa la famosa Haar), Symlet e Coiflet.
COPRAS: Mettere Ordine nel Caos
Avere due criteri di valutazione (MCC e MEER) è ottimo, ma a volte possono dare indicazioni leggermente diverse o rendere difficile un confronto diretto, specialmente con tanti dati. Qui entra in gioco un altro strumento potentissimo: il metodo COPRAS (COmplex PRoportional ASsessment). Fa parte delle tecniche di “Decision Making Multi-Criterio” (MCDM), che sono progettate proprio per aiutarci a prendere la decisione migliore quando ci sono tanti fattori (criteri) e tante opzioni (alternative) da considerare.
COPRAS è fantastico perché è sistematico e relativamente semplice da implementare. Pesa l’importanza di ogni criterio (nel nostro caso, MCC e MEER) e valuta ogni alternativa (le nostre 18 wavelet madre) in base a quanto “bene” o “male” si comporta rispetto a quei criteri. Alla fine, ci fornisce una classifica oggettiva, dal migliore al peggiore. Abbiamo deciso di usare COPRAS per combinare i risultati di MCC e MEER e ottenere una classifica definitiva della wavelet madre più adatta per analizzare i segnali vocali in presenza di mascherine e visiere.

I Risultati: E la Wavelet Vincitrice è…
Dopo aver macinato tutti i dati con MCC, MEER e infine COPRAS, i risultati sono stati sorprendentemente chiari e consistenti!
Analizzando sia le vocali che il brano letto, per tutti e quattro gli speaker e in tutte le condizioni di mascherina/visiera, una wavelet madre si è distinta nettamente sulle altre: la Db16, appartenente alla famiglia Daubechies. Sia il metodo MCC (che cerca la massima somiglianza) sia il metodo MEER (che cerca la massima concentrazione di energia) hanno indicato la Db16 come la scelta migliore, o comunque tra le primissime.
Un’altra osservazione interessante: il metodo MEER si è rivelato computazionalmente più veloce dell’MCC (0.86 secondi contro 1.92 secondi sui nostri test), il che è un vantaggio non da poco quando si devono analizzare molti dati.
Ma la scoperta forse più significativa è stata che il tipo specifico di mascherina o la presenza della visiera non hanno cambiato la scelta della wavelet ottimale. La Db16 è rimasta la migliore candidata indipendentemente dalla barriera fisica presente! Questo è importantissimo, perché suggerisce che possiamo usare la stessa “lente” (la Db16) per analizzare efficacemente la voce, che sia libera, filtrata da una chirurgica, da una N95 o persino da una doppia mascherina con visiera.
La classifica finale ottenuta con il metodo COPRAS, che ha considerato insieme MCC e MEER, ha confermato senza ombra di dubbio la superiorità della Db16, seguita da altre wavelet della stessa famiglia Daubechies (Db14, Db12, Db10) e poi dalle Symlet (Sym2, Sym3, etc.). Le Coiflet, in questo specifico contesto, sono risultate meno performanti.

Cosa Ci Portiamo a Casa?
Questa ricerca ci ha fornito un protocollo chiaro e robusto per selezionare la wavelet madre più adatta all’analisi dei segnali vocali, specialmente quando sono “disturbati” da mascherine e visiere. Abbiamo visto che:
- L’analisi wavelet è uno strumento valido per affrontare questo problema.
- I metodi MCC e MEER sono efficaci per valutare le wavelet, con MEER che risulta più rapido.
- Il metodo COPRAS è eccellente per combinare diversi criteri e ottenere una classifica oggettiva.
- Per i segnali vocali analizzati (in inglese, da non madrelingua), in presenza di varie mascherine e visiere, la wavelet madre Db16 è risultata la scelta ottimale.
- Sorprendentemente, il tipo di barriera (mascherina/visiera) non sembra influenzare *quale* wavelet sia la migliore.
Quindi, la prossima volta che sentirete una voce ovattata da una mascherina, pensate che ci sono strumenti matematici sofisticati, come le wavelet e metodi come COPRAS, che ci aiutano a “sentire” più chiaramente, svelando i segreti nascosti nel suono! È affascinante come la matematica possa aiutarci a superare le barriere della comunicazione, non trovate?
Fonte: Springer
