Immagine concettuale di un sistema MIMO mmWave avanzato, con fasci di onde radio che si propagano tra antenne multiple, sovrapposta a una rappresentazione stilizzata di una rete neurale. Telephoto zoom, 200mm, fast shutter speed, action tracking, con un leggero effetto motion blur sui fasci per indicare il trasferimento dati.

Sfruttare l’Invisibile: Deep Learning e Info Fuori Banda per Potenziare il MIMO mmWave!

Ciao a tutti, appassionati di tecnologia e futuri architetti delle reti! Oggi voglio parlarvi di una sfida che mi sta particolarmente a cuore e di come, insieme al mio team (virtuale, per così dire, visto che sto traducendo e rielaborando un concetto affascinante), stiamo cercando di superarla con un pizzico di astuzia e tanta intelligenza artificiale. Parliamo di comunicazioni wireless, quelle che ci permettono di essere sempre connessi, e in particolare delle onde millimetriche (mmWave) e dei sistemi MIMO (Multiple-Input Multiple-Output). Pronti a fare un tuffo nel futuro?

L’era dei Dati e la Sfida del mmWave

Viviamo in un’epoca affamata di dati. Pensateci: realtà aumentata, realtà virtuale, auto a guida autonoma, l’automazione industriale spinta… tutte queste meraviglie richiedono una larghezza di banda spaventosa. Il Mobile Edge Computing (MEC) è venuto in nostro soccorso, avvicinando l’elaborazione ai margini della rete, più vicino a noi utenti, ma c’è un “ma”. L’efficacia del MEC dipende criticamente dalla capacità dell’infrastruttura wireless sottostante.

Qui entrano in gioco le comunicazioni a onde millimetriche (mmWave). Queste frequenze altissime offrono una larghezza di banda enorme, il che si traduce in velocità di trasmissione dati da capogiro. Fantastico, no? Beh, quasi. Le mmWave hanno un piccolo difetto: perdono molta potenza durante la propagazione e sono un po’ “schizzinose” con gli ostacoli. Per compensare queste perdite e garantire una connessione stabile, si usano grandi array di antenne e tecniche MIMO. E qui casca l’asino, o meglio, qui inizia la nostra sfida: per far funzionare bene i link MIMO, serve una stima precisa del canale di comunicazione. E indovinate un po’? Farla a frequenze mmWave è un bel rompicapo, soprattutto perché il rapporto segnale-rumore (SNR) prima del beamforming (cioè prima di “orientare” il segnale) è bassissimo. Immaginate di dover ascoltare un sussurro in una stanza affollatissima: ecco, più o meno.

Il Tocco Magico del Deep Learning e l’Intuizione “Fuori Banda”

Negli ultimi tempi, le tecniche di machine learning (ML), e in particolare il deep learning basato su perceptron multistrato, hanno iniziato a farsi strada nel campo della stima del canale MIMO mmWave. C’è un fermento incredibile! Ma c’è di più. I sistemi mmWave vengono sempre più spesso affiancati a sistemi che operano sotto i 6 GHz (sub-6 GHz) per creare comunicazioni multibanda. Perché è interessante? Perché i sistemi sub-6 GHz hanno perdite di propagazione minori, il che significa un SNR più alto prima del beamforming. Avete capito dove voglio arrivare? Esatto! Possiamo usare queste informazioni “fuori banda” (out-of-band), più affidabili, provenienti dal sub-6 GHz, per dare una mano alla stima del canale nei sistemi mmWave. Non è geniale?

Qualcuno ci aveva già pensato, eh [8]! Hanno proposto metodi di stima del canale basati su segnali pilota che sfruttano la componente Line-of-Sight (LOS) del canale ottenuta dalla banda sub-6 GHz. Però, senza l’aiuto del machine learning, molte delle relazioni intrinseche tra le stime del canale in-band (mmWave) e out-of-band (sub-6 GHz) restano nascoste, inutilizzate. Ed è qui che entriamo in gioco noi, o meglio, l’idea che vi presento.

La Nostra Ricetta Segreta: una CNN Specializzata

Abbiamo pensato di estendere questi metodi di stima del canale supportati da informazioni fuori banda usando il machine learning. A differenza dei metodi convenzionali, il ML ha una capacità pazzesca di scovare le correlazioni più sottili. Abbiamo quindi proposto un nuovo approccio per i sistemi MIMO mmWave basato su un’architettura di Rete Neurale Convoluzionale (CNN).

Ma come funziona nel dettaglio? Immaginate un sistema MIMO punto-punto che lavora contemporaneamente su bande sub-6 GHz e mmWave. Entrambi gli array di antenne (sia per sub-6 GHz che per mmWave) sono configurati come Uniform Linear Array (ULA), posizionati insieme e allineati per garantire gli stessi Angoli di Partenza (AoD) e Angoli di Arrivo (AoA) per entrambe le bande. Diamo per scontata una sincronizzazione perfetta e operiamo in modalità Time-Division Duplex (TDD), che ci assicura la reciprocità del canale (il canale è lo stesso in entrambe le direzioni). Come tecnica di trasmissione, usiamo l’Orthogonal Frequency-Division Multiplexing (OFDM), un classico.

La fase di “allenamento” per la stima del canale avviene in due step. Prima, inviamo simboli pilota non pre-codificati su entrambe le bande. Al ricevitore, stimiamo il canale per entrambe le bande con il metodo dei minimi quadrati (Least Squares – LS) e poi lo rifiniamo con un’interpolazione lineare. Grazie alla reciprocità del TDD, anche il trasmettitore conosce questa stima. La stima del canale sub-6 GHz ci serve per calcolare AoA e AoD della componente LOS. Poi, usando queste informazioni angolari, inviamo simboli pilota pre-codificati/combinati solo sulla banda mmWave, dritti verso la componente LOS. Altra stima LS, altra interpolazione lineare e un filtraggio della componente LOS. Et voilà, abbiamo la nostra stima del canale finale supportata da informazioni fuori banda.

Visualizzazione astratta di onde radio mmWave e sub-6 GHz che interagiscono con un'architettura di rete neurale convoluzionale, con particolare attenzione ai dettagli delle antenne MIMO. Macro lens, 80mm, high detail, controlled lighting, duotone blu e argento.

A questo punto, entra in scena la nostra CNN. L’idea è di combinare le stime del canale disponibili con algoritmi di ML. La CNN è particolarmente adatta ai sistemi MIMO perché la disposizione spaziale delle antenne gioca un ruolo cruciale. Come input, diamo alla nostra CNN sia la stima del canale in-band (mmWave) sia quella supportata dalle informazioni fuori banda (sub-6 GHz). Ma non solo! Aggiungiamo anche il fattore K stimato nella banda sub-6 GHz e la varianza del rumore nella banda mmWave. Il fattore K ci dice quanto è dominante la componente LOS rispetto alle componenti diffuse multi-percorso (un K alto significa LOS dominante, un K basso ambiente più dispersivo). La varianza del rumore, beh, è la misura del “disturbo” termico e di altre interferenze nella banda mmWave.

La CNN, dopo aver masticato tutti questi dati, ci restituisce la matrice del canale stimata. L’architettura che abbiamo pensato è composta da nove strati convoluzionali, seguite da uno strato di output. Ogni strato intermedio usa la funzione di attivazione ReLU (Rectified Linear Unit), seguita da uno strato di Batch Normalization (BN) per stabilizzare e accelerare l’apprendimento. Usiamo anche il Zero Padding (ZP) per mantenere le dimensioni della matrice delle feature durante la convoluzione. Lo strato di output applica una funzione di attivazione tangente iperbolica (tanh) per generare le parti reali e immaginarie stimate delle matrici del canale.

Addestramento Offline, Efficienza Online

L’addestramento della CNN avviene offline. Generiamo un set di addestramento bello corposo basato su un modello di canale specifico. Per semplificare, consideriamo un singolo sottoportante OFDM centrale sia per i dati di input che per quelli di output. Prima di dare i dati in pasto alla rete, separiamo le parti reali e immaginarie delle stime del canale. All’uscita, le ricombiniamo. L’obiettivo? Minimizzare l’errore quadratico medio (MSE) normalizzato della stima del canale. Usiamo l’ottimizzatore Adam, con un batch size di 64 e 200 epoche di addestramento. Una volta addestrata, la CNN è pronta per essere usata online dal ricevitore per la stima del canale in tempo reale, applicandola a tutte le sottoportanti.

La cosa bella è che le nostre reti addestrate sono robuste a diverse condizioni del canale wireless, specialmente per quanto riguarda il fattore K e la varianza del rumore. Quindi, non c’è bisogno di riaddestrarle per ogni scenario specifico, risparmiando un sacco di tempo e risorse. C’è un però: la CNN è un po’ “schizzinosa” riguardo alla configurazione delle antenne MIMO. Se la cambi, devi riaddestrarla. Stessa cosa se i valori di fattore K o varianza del rumore escono troppo dal range per cui è stata addestrata.

Mettiamo alla Prova la Teoria: le Simulazioni e i Risultati

Per vedere se la nostra idea funzionava davvero, abbiamo simulato l’MSE normalizzato della stima del canale in un canale Rician selettivo in frequenza. Per il sub-6 GHz, abbiamo usato una portante a 2.55 GHz e una banda di 20.16 MHz. Per le mmWave, portante a 25.5 GHz e banda di 403.2 MHz. In entrambi i casi, una configurazione MIMO 8×8. Come metro di paragone (baseline non-ML), abbiamo usato la stima del canale convenzionale e il Maximal Ratio Combining (MRC). Abbiamo anche testato una CNN che usa solo informazioni in-band.

E i risultati? Beh, lasciatemi dire che ci hanno dato parecchie soddisfazioni! L’MSE normalizzato diminuisce all’aumentare dell’SNR, come c’era da aspettarsi. Ma soprattutto, tutti i metodi di stima basati su ML superano l’approccio convenzionale non-ML su tutto il range di SNR e per diversi valori di fattore K.
In particolare, con un fattore K basso (-20 dB, quindi ambiente molto dispersivo), i metodi ML in-band e quelli supportati da out-of-band hanno prestazioni simili e battono l’MRC. Con un fattore K alto (20 dB, LOS dominante), l’MRC supera la CNN in-band (il che dimostra l’importanza delle informazioni fuori banda mancanti). Tuttavia, la nostra CNN supportata da informazioni fuori banda supera l’MRC a tutti i valori di SNR, scovando quelle relazioni nascoste tra le stime in-band e out-of-band!

Un Occhio alla Complessità Computazionale

Certo, tutta questa intelligenza ha un costo. La stima convenzionale è la più “leggera”. L’MRC richiede più operazioni perché deve fare stime e interpolazioni su entrambe le bande, oltre a un cruciale step di stima congiunta AoD/AoA. La nostra architettura basata su CNN è quella con il maggior numero di operazioni, dovendo calcolare un gran numero di parametri. Ma hey, le prestazioni migliorate potrebbero valere lo sforzo computazionale extra, no?

Verso un Futuro Connesso e Intelligente

In conclusione, abbiamo presentato un metodo di stima del canale basato su deep learning per sistemi MIMO mmWave che sfrutta le preziose informazioni fuori banda provenienti dal sub-6 GHz. La nostra architettura CNN, combinata con queste informazioni, migliora significativamente l’errore quadratico medio del canale rispetto ai metodi non-ML. È un altro passo avanti verso reti wireless sempre più performanti e intelligenti, capaci di sostenere le applicazioni del futuro. E io, nel mio piccolo, sono entusiasta di avervi raccontato questa piccola parte dell’avventura!

Fonte: Springer

Articoli correlati

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *