Immagine fotorealistica di un'onda sonora complessa visualizzata su uno schermo digitale, con sovrapposta la forma d'onda stilizzata della wavelet madre Db16 che si adatta perfettamente a una sezione del segnale. Sullo sfondo, una persona indistinta indossa una mascherina chirurgica. Obiettivo prime 50mm, profondità di campo ridotta, illuminazione d'atmosfera high-tech, duotone blu e verde.

Voce Chiara Oltre la Mascherina: Sveliamo le Wavelet Ottimali con COPRAS!

Ciao a tutti! Sono qui oggi per parlarvi di una sfida che, scommetto, abbiamo affrontato tutti, specialmente negli ultimi anni: capire cosa dicono le persone quando indossano mascherine o visiere. Frustrante, vero? Il suono arriva ovattato, distorto, e a volte decifrare le parole diventa un’impresa. Ma se vi dicessi che la scienza e la matematica ci vengono in aiuto anche in questo? Esiste uno strumento potentissimo chiamato analisi wavelet, che è un po’ come avere una lente d’ingrandimento super avanzata per scrutare dentro i segnali, come quelli della nostra voce.

Ma Cos’è Questa Analisi Wavelet?

Immaginate di poter scomporre un suono complesso, come la voce umana, nelle sue “note” fondamentali, analizzando sia la frequenza (quanto è acuta o grave la nota) sia quando esattamente quella nota viene suonata. L’analisi wavelet fa proprio questo! È una tecnica di analisi tempo-frequenza che ci permette di “zoomare” sui dettagli di un segnale in modi che altri metodi non consentono. Utilizza delle funzioni speciali, chiamate “wavelet madre”, come dei piccoli “stampini” per confrontare e analizzare il segnale. Pensatela come usare diverse lenti (le wavelet madre) per osservare un oggetto (il segnale vocale): ogni lente rivela dettagli differenti.

La Trasformata Wavelet Discreta (DWT), una versione specifica di questa tecnica, scompone il segnale in due parti: una che cattura le informazioni a bassa frequenza (i suoni più gravi, le “approssimazioni”) e una che cattura quelle ad alta frequenza (i suoni più acuti, i “dettagli”). Questo processo può essere ripetuto più volte, andando sempre più in profondità nell’analisi. È una tecnica già usata con successo per migliorare la qualità del parlato, eliminare rumori di fondo e molto altro.

Il Problema: Quale Lente Usare?

Qui arriva il bello, o meglio, la sfida! Esistono tantissime wavelet madre diverse (come le famiglie Daubechies, Symlet, Coiflet, solo per citarne alcune), ognuna con le sue caratteristiche uniche. Il punto è che, analizzando lo stesso segnale vocale con wavelet madre diverse, si ottengono risultati diversi! Scegliere quella “giusta” è fondamentale per ottenere un’analisi accurata ed efficace, ma come si fa? È un po’ come scegliere l’occhiale giusto per vedere bene: una scelta sbagliata può compromettere tutto.

Storicamente, la scelta si basava su criteri qualitativi (simmetria, regolarità) o su metodi quantitativi che cercavano la wavelet più “simile” al segnale da analizzare. Ad esempio, si può calcolare il Coefficiente Massimo di Correlazione Incrociata (MCC): più alta è la correlazione tra la wavelet e il segnale, meglio è. Un altro approccio è il Rapporto Massimo Energia/Entropia di Shannon (MEER): cerca la wavelet che concentra meglio l’energia del segnale nei suoi coefficienti più importanti, riducendo la “dispersione” dell’informazione.

Immagine fotorealistica di diverse forme d'onda madre wavelet (Daubechies, Symlet, Coiflet) visualizzate su uno schermo di computer in un laboratorio di analisi audio. Obiettivo macro 60mm, alta definizione, illuminazione da studio controllata, messa a fuoco precisa sulle forme d'onda.

La Nostra Indagine: Voci Sotto Maschera

Affascinato da questa problematica, ho partecipato a una ricerca proprio su questo tema. Abbiamo registrato la voce di quattro persone (non madrelingua inglesi, ma abituate a usare l’inglese) mentre leggevano vocali e un brano specifico (il “Grandfather Passage”). E l’abbiamo fatto in diverse condizioni:

  • Senza mascherina
  • Con mascherina chirurgica
  • Con mascherina di stoffa
  • Con doppia mascherina (chirurgica sotto, stoffa sopra)
  • Con mascherina N95
  • E tutte queste opzioni anche con l’aggiunta di una visiera!

L’obiettivo era capire come queste barriere fisiche alterassero il segnale vocale e, soprattutto, quale wavelet madre fosse la migliore per analizzare queste voci “mascherate”. Abbiamo registrato tutto con cura, ripetendo le prove tre volte per ogni condizione, per assicurarci che i dati fossero solidi. Abbiamo usato sia il metodo MCC che il metodo MEER per valutare ben 18 diverse wavelet madre appartenenti alle famiglie Daubechies (inclusa la famosa Haar), Symlet e Coiflet.

COPRAS: Mettere Ordine nel Caos

Avere due criteri di valutazione (MCC e MEER) è ottimo, ma a volte possono dare indicazioni leggermente diverse o rendere difficile un confronto diretto, specialmente con tanti dati. Qui entra in gioco un altro strumento potentissimo: il metodo COPRAS (COmplex PRoportional ASsessment). Fa parte delle tecniche di “Decision Making Multi-Criterio” (MCDM), che sono progettate proprio per aiutarci a prendere la decisione migliore quando ci sono tanti fattori (criteri) e tante opzioni (alternative) da considerare.

COPRAS è fantastico perché è sistematico e relativamente semplice da implementare. Pesa l’importanza di ogni criterio (nel nostro caso, MCC e MEER) e valuta ogni alternativa (le nostre 18 wavelet madre) in base a quanto “bene” o “male” si comporta rispetto a quei criteri. Alla fine, ci fornisce una classifica oggettiva, dal migliore al peggiore. Abbiamo deciso di usare COPRAS per combinare i risultati di MCC e MEER e ottenere una classifica definitiva della wavelet madre più adatta per analizzare i segnali vocali in presenza di mascherine e visiere.

Fotografia di un esperimento di registrazione vocale in un ambiente controllato simile a un'aula. Una persona indossa una mascherina N95 e una visiera mentre parla in un microfono professionale collegato a un laptop che mostra forme d'onda audio. Obiettivo prime 35mm, profondità di campo che sfoca leggermente lo sfondo, illuminazione naturale dalla finestra.

I Risultati: E la Wavelet Vincitrice è…

Dopo aver macinato tutti i dati con MCC, MEER e infine COPRAS, i risultati sono stati sorprendentemente chiari e consistenti!

Analizzando sia le vocali che il brano letto, per tutti e quattro gli speaker e in tutte le condizioni di mascherina/visiera, una wavelet madre si è distinta nettamente sulle altre: la Db16, appartenente alla famiglia Daubechies. Sia il metodo MCC (che cerca la massima somiglianza) sia il metodo MEER (che cerca la massima concentrazione di energia) hanno indicato la Db16 come la scelta migliore, o comunque tra le primissime.

Un’altra osservazione interessante: il metodo MEER si è rivelato computazionalmente più veloce dell’MCC (0.86 secondi contro 1.92 secondi sui nostri test), il che è un vantaggio non da poco quando si devono analizzare molti dati.

Ma la scoperta forse più significativa è stata che il tipo specifico di mascherina o la presenza della visiera non hanno cambiato la scelta della wavelet ottimale. La Db16 è rimasta la migliore candidata indipendentemente dalla barriera fisica presente! Questo è importantissimo, perché suggerisce che possiamo usare la stessa “lente” (la Db16) per analizzare efficacemente la voce, che sia libera, filtrata da una chirurgica, da una N95 o persino da una doppia mascherina con visiera.

La classifica finale ottenuta con il metodo COPRAS, che ha considerato insieme MCC e MEER, ha confermato senza ombra di dubbio la superiorità della Db16, seguita da altre wavelet della stessa famiglia Daubechies (Db14, Db12, Db10) e poi dalle Symlet (Sym2, Sym3, etc.). Le Coiflet, in questo specifico contesto, sono risultate meno performanti.

Grafico astratto e stilizzato che mostra il ranking delle diverse wavelet madre secondo il metodo COPRAS. La wavelet Db16 è chiaramente al primo posto. Stile infografica scientifica, colori blu e grigio duotone, alta definizione, elementi grafici chiari e leggibili.

Cosa Ci Portiamo a Casa?

Questa ricerca ci ha fornito un protocollo chiaro e robusto per selezionare la wavelet madre più adatta all’analisi dei segnali vocali, specialmente quando sono “disturbati” da mascherine e visiere. Abbiamo visto che:

  • L’analisi wavelet è uno strumento valido per affrontare questo problema.
  • I metodi MCC e MEER sono efficaci per valutare le wavelet, con MEER che risulta più rapido.
  • Il metodo COPRAS è eccellente per combinare diversi criteri e ottenere una classifica oggettiva.
  • Per i segnali vocali analizzati (in inglese, da non madrelingua), in presenza di varie mascherine e visiere, la wavelet madre Db16 è risultata la scelta ottimale.
  • Sorprendentemente, il tipo di barriera (mascherina/visiera) non sembra influenzare *quale* wavelet sia la migliore.

Quindi, la prossima volta che sentirete una voce ovattata da una mascherina, pensate che ci sono strumenti matematici sofisticati, come le wavelet e metodi come COPRAS, che ci aiutano a “sentire” più chiaramente, svelando i segreti nascosti nel suono! È affascinante come la matematica possa aiutarci a superare le barriere della comunicazione, non trovate?

Fonte: Springer

Articoli correlati

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *