Un cervello stilizzato composto da grafici finanziari luminosi e frammenti di testo fluttuanti (rappresentanti dati price e non-price), sovrapposto a uno sfondo scuro astratto che simboleggia la complessità del mercato finanziario. Obiettivo grandangolare 24mm, illuminazione drammatica con contrasti netti, focus nitido sul cervello digitale, atmosfera high-tech.

Decifrare i Mercati: Come Dati Insoliti Rivoluzionano la Scelta del Portafoglio

Avete mai avuto la sensazione che i mercati finanziari abbiano una loro “personalità”? Momenti di calma piatta, seguiti da tempeste improvvise, quasi come se avessero degli stati d’animo. Beh, in finanza li chiamiamo stati di mercato: periodi in cui il mercato si comporta in modo relativamente stabile, prima di cambiare bruscamente. Pensate alla crisi del 2008 o al crollo dovuto al COVID-19 nel 2020: eventi che hanno stravolto medie, volatilità e le correlazioni tra i rendimenti delle azioni.

Da decenni, noi ricercatori e professionisti cerchiamo modi per identificare questi “stati” o “regimi” di mercato. L’obiettivo? Capire meglio queste dinamiche complesse e, magari, anticipare i cambiamenti. Una strada promettente è stata quella di analizzare come i rendimenti dei vari asset si muovono insieme, cioè la loro struttura di correlazione. Identificare cambiamenti drastici in questa struttura ci ha aiutato a capire il comportamento storico dei mercati.

Il Limite delle Correlazioni Classiche

Ma c’è un “ma”. Affidarsi solo alle correlazioni passate ha i suoi limiti. Primo, non è detto che ci aiuti a prevedere il futuro o a costruire sistemi di allarme efficaci prima di un crollo. Secondo, le correlazioni basate solo sui prezzi potrebbero non cogliere tutte le sfumature, specialmente quelle legate a decisioni politiche (come quelle della Federal Reserve sui tassi d’interesse) o al sentiment generale che circola. Queste informazioni contestuali sono difficili da catturare guardando solo i numeri dei rendimenti passati.

La Nostra Idea: Andare Oltre i Prezzi

Ed è qui che entra in gioco la nostra ricerca. Ci siamo chiesti: e se potessimo definire gli stati di mercato usando non solo i prezzi, ma anche altri tipi di dati? Dati che magari riflettono meglio il contesto economico, le decisioni politiche o persino il “mood” collettivo?

Abbiamo sviluppato un approccio nuovo per la selezione del portafoglio che si basa proprio su questo: identificare gli stati di mercato usando diverse “metriche di distanza” tra periodi di mercato. Immaginate di misurare quanto due momenti diversi nel tempo siano “simili” o “dissimili” in termini di condizioni di mercato. Lo facciamo usando:

  • Correlazioni dei rendimenti degli asset: Il metodo classico, sia su base giornaliera che intraday (minuto per minuto), ma analizzato in modo più sofisticato.
  • Dati testuali (non-price): Qui sta la vera novità. Abbiamo analizzato i comunicati della Federal Open Market Committee (FOMC), il braccio decisionale della Fed. Questi documenti sono miniere d’oro di informazioni su sentiment, traiettorie politiche e condizioni economiche. Abbiamo usato tecniche di Natural Language Processing (NLP), come tf-idf e modelli avanzati come BERT (in particolare Sentence-BERT, anche affinato specificamente sui dati finanziari), per estrarre “distanze” basate sul linguaggio usato dalla Fed.
  • Dati comportamentali (non-price): Abbiamo anche esplorato i volumi di ricerca su Google Trends per parole chiave legate alla finanza (come “inflazione”, “debito”, “azioni”, “crisi”). L’idea è che le ricerche delle persone riflettano il loro comportamento collettivo e possano dare indizi sullo stato del mercato.

Primo piano di un grafico finanziario complesso su uno schermo digitale, con linee di tendenza sovrapposte a dati testuali sfocati sullo sfondo rappresentanti le diverse fonti di dati (prezzi, FOMC, Google Trends). Obiettivo prime, 35mm, profondità di campo ridotta per enfatizzare il grafico, tonalità duotone blu e grigio.

Come Funziona, Senza Mal di Testa

Il nostro metodo funziona in modo non supervisionato, il che significa che non cerca di prevedere i rendimenti futuri (un compito notoriamente difficile!). Ecco i passi fondamentali:

  1. Calcoliamo le distanze: Per ogni coppia di periodi di tempo nel nostro set di dati di addestramento (2016-2019), calcoliamo la “distanza di mercato” usando uno dei metodi descritti (correlazione prezzi, testo FOMC, Google Trends). Otteniamo così una matrice che ci dice quanto ogni periodo è simile/dissimile a tutti gli altri.
  2. Troviamo i cluster (stati di mercato): Usiamo una tecnica di clustering chiamata DIANA su questa matrice di distanze. È come chiedere a un computer di raggruppare i periodi più simili tra loro. Ogni gruppo rappresenta uno “stato di mercato” distinto. Decidiamo a priori quanti stati cercare (es. 4, 8 o 16).
  3. Ottimizziamo il portafoglio per ogni stato: Per ciascuno stato identificato, calcoliamo la combinazione di asset (azioni USA, obbligazioni, dollaro, oro, petrolio, gas naturale nel nostro caso) che avrebbe massimizzato il rendimento aggiustato per il rischio (usando lo Sharpe Ratio) *durante i periodi appartenenti a quello stato* nel passato (i dati di addestramento).
  4. Applichiamo nel futuro (out-of-sample): Quando arriva un nuovo periodo di tempo (nei nostri test, dal 2020 al 2023), calcoliamo la sua distanza rispetto a tutti i periodi passati nel training set. Identifichiamo a quale stato passato è più “vicino” e applichiamo la strategia di portafoglio ottimizzata per quello stato.

Un aspetto interessante è che possiamo usare una metrica di distanza per trovare gli stati nel training e una diversa (o la stessa) per decidere a quale stato appartiene un nuovo dato nel testing.

La Prova del Nove: Mettiamo alla Prova il Modello

Abbiamo testato il nostro approccio su un portafoglio composto dalle principali classi di asset USA (ETF su indici azionari, Treasury, dollaro, oro, petrolio, gas naturale) dal 2016 al 2023, usando i primi quattro anni per l’addestramento e gli ultimi quattro per la verifica (out-of-sample).

Abbiamo confrontato le performance con diverse strategie di riferimento (baselines):

  • Buy and Hold (compra e tieni un singolo asset)
  • Equal Weight (investi la stessa somma in ogni asset)
  • Tangency Portfolio (ottimizzazione classica basata sulla massimizzazione dello Sharpe Ratio, calcolata sui dati di training o su finestre mobili nel testing)
  • Risk Parity ERC (portafoglio dove ogni asset contribuisce allo stesso modo al rischio totale, calcolato sui dati di training o su finestre mobili nel testing)

I Risultati? Sorprendenti!

Ebbene, i risultati sono stati davvero incoraggianti. La nostra soluzione “ensemble”, che combina le decisioni basate sulle diverse metriche di distanza (prezzi, FOMC, Google Trends), ha battuto nettamente le strategie di riferimento tradizionali. E non di poco: la differenza di performance è statisticamente significativa (p-value bassissimo!).

In media, le 15 combinazioni di ensemble dei nostri modelli hanno ottenuto uno Sharpe Ratio di 0.739 nel periodo di test, contro una media di 0.292 per le 15 strategie baseline. Un bel salto!

Fotografia macro di un documento ufficiale della Federal Reserve (FOMC) con evidenziate parole chiave relative alla politica monetaria. Lente macro 100mm, alta definizione, illuminazione controllata per enfatizzare la texture della carta e il testo.

L’asso nella Manica: i Dati FOMC

Tra tutte le metriche di distanza testate, quella basata sull’analisi dei testi FOMC si è rivelata particolarmente potente. L’ensemble che usava solo i dati FOMC ha raggiunto lo Sharpe Ratio più alto in assoluto: 0.973! Questo suggerisce che “ascoltare” attentamente cosa dice (e come lo dice) la Federal Reserve fornisce un vantaggio informativo cruciale per capire lo stato del mercato e adattare il portafoglio di conseguenza.

Analizzando le decisioni del modello basato su FOMC, abbiamo notato che gli aggiustamenti del portafoglio sembravano allineati con le tendenze macroeconomiche USA. Ad esempio, ha ridotto l’esposizione azionaria all’inizio del 2020 (durante i tagli dei tassi per la pandemia) e aumentato l’esposizione al dollaro USA a fine 2021 (in concomitanza con gli aumenti dei tassi per controllare l’inflazione).

Capire il Contesto: L’Importanza dell’Analisi Testuale Avanzata

All’interno dei modelli basati su FOMC, abbiamo visto che le tecniche NLP più avanzate fanno la differenza. Sentence-BERT, specialmente quando affinato (fine-tuned) specificamente sui comunicati FOMC usando un approccio di apprendimento contrastivo basato sugli stati di mercato identificati dalle correlazioni, ha performato significativamente meglio della versione “zero-shot” (pre-addestrata ma non specifica per il dominio) e del più semplice tf-idf. Questo conferma che per estrarre valore da dati testuali complessi come quelli finanziari, servono modelli capaci di cogliere le sfumature semantiche e contestuali, e l’adattamento al dominio specifico (fine-tuning) è fondamentale.

Anche Google Trends ha mostrato risultati interessanti, superando le performance dei modelli basati solo sulla correlazione dei prezzi, suggerendo che il comportamento collettivo riflesso nelle ricerche online contiene informazioni utili per la selezione del portafoglio.

Le “heat map” delle distanze di mercato hanno anche mostrato come le diverse metriche catturano eventi anomali come la pandemia COVID-19 in modi differenti, evidenziando la complementarità dei vari tipi di dati.

Cosa Significa Tutto Questo?

La nostra ricerca propone un modo nuovo e, dai risultati, più efficace per affrontare il problema della selezione di portafoglio. Invece di basarsi solo sui prezzi passati o tentare previsioni incerte, ci concentriamo sull’identificare lo “stato” attuale del mercato usando un mix di dati, inclusi quelli testuali e comportamentali.

Questo approccio non supervisionato e basato su metriche di distanza multiple sembra offrire una comprensione più ricca delle dinamiche di mercato e porta a decisioni di allocazione più robuste, specialmente in periodi turbolenti. L’integrazione di fonti di dati diverse, come i comunicati della Fed o le tendenze di ricerca, si è dimostrata preziosa.

Certo, c’è ancora spazio per migliorare: si potrebbero esplorare altre tecniche di clustering, integrare più fonti di dati (come le news finanziarie o i verbali dettagliati delle riunioni FOMC), o testare l’approccio su mercati globali e altre classi di asset. Ma la strada intrapresa sembra promettente: capire il contesto, non solo i prezzi, potrebbe essere la chiave per navigare i mercati finanziari con maggiore successo.

Fonte: Springer

Articoli correlati

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *