Visualizzazione astratta di cluster di dati colorati che si trasformano in ordinamenti lineari e logici, simboleggiando l'estrazione di preferenze transitive. Illuminazione cinematografica, obiettivo grandangolare 24mm, focus nitido sui cluster in trasformazione.

Preferenze Svelate: Come l’IA Impara Cosa Ci Piace Davvero (Rispettando la Logica!)

Ciao a tutti, amici lettori! Vi siete mai chiesti come facciamo a prendere decisioni? O, ancora più intrigante, come fanno le macchine a capire cosa ci piace? Oggi voglio portarvi con me in un viaggio affascinante nel mondo dell’intelligenza artificiale e della psicologia, per scoprire come possiamo “estrarre” le relazioni di preferenza dai dati, assicurandoci che abbiano un senso logico. Mettetevi comodi, perché stiamo per parlare di un nuovo approccio che ho contribuito a sviluppare: il clustering con centroidi transitivi, o come lo chiamiamo in gergo, k-orders.

Il Problema: Capire i Gusti Senza Impazzire

Immaginate di voler capire i gusti di un gruppo di persone riguardo a, diciamo, diversi tipi di automobili. Potremmo usare tecniche di clustering, che cercano di raggruppare individui con preferenze simili. Un algoritmo popolare per dati categorici (come “diesel” o “elettrico”) è il k-modes. Questo algoritmo identifica dei “centroidi”, che sono come dei rappresentanti tipici di ogni gruppo. Il problema è che, a volte, questi centroidi possono rappresentare preferenze un po’… illogiche.

Mi spiego meglio. La logica ci dice che se preferisco la mela alla banana (A > B) e la banana alla ciliegia (B > C), allora dovrei preferire la mela alla ciliegia (A > C). Questa è la proprietà transitiva. È un pilastro del comportamento di scelta razionale. Tuttavia, a livello aggregato, o quando i dati sono “rumorosi”, gli algoritmi di clustering tradizionali come il k-modes potrebbero sfornare centroidi che violano questa regola, magari dicendoci che il gruppo preferisce A a B, B a C, ma poi C ad A! Un bel paradosso, noto come paradosso di Condorcet, che rende difficile interpretare i risultati.

Un’altra sfida è l’eterogeneità delle preferenze individuali: non a tutti piacciono le stesse cose, ed è giusto così! Il nostro obiettivo è quindi duplice: raggruppare le persone in base alle loro preferenze e assicurarci che le preferenze “medie” di ogni gruppo siano logicamente coerenti, cioè transitive.

La Nostra Soluzione: k-orders e i Centroidi Transitivi

Ed è qui che entra in gioco il nostro k-orders. Non è un algoritmo completamente nuovo, ma una modifica intelligente del k-modes. La differenza cruciale sta nel passo di “aggiustamento” dei centroidi. Mentre il k-modes si accontenta della moda (l’opzione più frequente) per definire il centroide, il k-orders si assicura che questo centroide rappresenti una relazione di preferenza transitiva.

Abbiamo sviluppato due procedure per questo “aggiustamento magico”:

  • Transitive Centroid Adjustment (TCA): Parte da un ordine lineare stretto (una preferenza transitiva, asimmetrica e completa) e lo modifica iterativamente per minimizzare la distanza dal cluster, mantenendo sempre la transitività.
  • Greedy TCA: Un approccio un po’ più “ingordo”. Parte da un insieme vuoto e costruisce l’ordine di preferenza aggiungendo una coppia di opzioni alla volta, seguendo una sequenza predefinita (basata sulla popolarità nel cluster), finché non si possono aggiungere altre coppie, garantendo sempre che la relazione rimanga aciclica e quindi transitiva.

L’idea di fondo è che, anche se i dati individuali possono essere rumorosi o apparentemente contraddittori, forzando i centroidi ad essere transitivi, possiamo catturare meglio le vere preferenze sottostanti, riducendo il rischio di sovradattamento (overfitting) e ottenendo risultati più accurati e interpretabili. Una volta estratti questi “stati di preferenza” transitivi, possiamo testarli empiricamente usando modelli statistici, come i modelli a classi latenti.

Un cervello stilizzato con ingranaggi colorati che si incastrano perfettamente, a simboleggiare la logica transitiva, su uno sfondo di dati digitali astratti. Illuminazione da studio, obiettivo macro 90mm, alta definizione per evidenziare i dettagli degli ingranaggi.

Quindi, ricapitolando, il k-orders funziona in modo simile al k-modes nella fase di classificazione (assegnare ogni individuo a un cluster), ma brilla nella fase di aggiustamento, dove i nostri TCA e Greedy TCA si assicurano che il “cuore” di ogni cluster, il suo centroide, sia una preferenza perfettamente logica e transitiva.

Mettiamo alla Prova k-orders: Le Simulazioni

Per vedere se la nostra idea funzionava davvero, abbiamo condotto una serie di studi di simulazione. Abbiamo creato dei set di dati artificiali in cui conoscevamo a priori le “vere” preferenze transitive delle persone simulate. Poi abbiamo messo alla prova le due versioni di k-orders (TCA e Greedy TCA) e il classico k-modes.

Abbiamo variato diversi parametri, come la dimensione del campione, la quantità di “errore” nei dati (cioè quanto le risposte simulate si discostavano dalla preferenza transitiva sottostante) e il numero di diversi stati di preferenza presenti nella popolazione simulata. Abbiamo testato scenari con opzioni “a una componente” (es. scegli tra Diesel ed Elettrico) e “a due componenti” (es. preferisci 1000 euro tra 1 anno o 500 euro tra 6 mesi?). In questi ultimi, abbiamo anche considerato l’Assioma di Monotonicità: se un’opzione è migliore di un’altra su una componente e uguale o migliore sull’altra, allora dovrebbe essere preferita.

I risultati? Beh, sono stati molto incoraggianti! Quando i centroidi veri erano relazioni transitive, entrambe le versioni di k-orders hanno superato nettamente k-modes. In particolare, negli esperimenti con opzioni a due componenti, l’algoritmo TCA si è dimostrato superiore al Greedy TCA. Per le opzioni a una componente, il Greedy TCA ha mostrato una leggera superiorità in alcune condizioni. Questo ci dice che, quando ci aspettiamo che le preferenze siano transitive, il nostro k-orders è uno strumento decisamente più adatto.

Abbiamo anche testato un criterio di selezione per identificare la “migliore” soluzione di clustering, ovvero il numero ottimale di cluster da estrarre, che poi abbiamo usato nell’applicazione empirica.

Applicazione nel Mondo Reale: Il Dilemma Sociale del Lockdown

Ma la vera sfida, si sa, è vedere come se la cava un algoritmo con dati reali. E quale contesto più attuale e dibattuto della pandemia di COVID-19? Ci siamo concentrati sul “dilemma sociale del lockdown”: meglio rallentare l’economia per salvare vite, o sacrificare vite umane per evitare il collasso economico di una nazione? Un vero rompicapo etico e sociale.

L’idea era studiare le preferenze individuali in diversi scenari che contrapponevano interessi economici e sanitari, considerando anche contesti pubblici (es. disoccupazione nazionale, numero di decessi nazionali) e privati (es. diminuzione del reddito personale, gravità dell’infezione di un familiare). Ci aspettavamo una grande eterogeneità nelle preferenze, ma anche che queste preferenze, per quanto diverse, fossero internamente transitive.

Abbiamo creato degli stimoli a due componenti (economia e salute), ciascuna con quattro livelli di gravità crescente. Ad esempio, uno stimolo poteva chiedere: “Preferisci che il tuo reddito familiare diminuisca del 5% e ci siano 200 morti in più per COVID-19 rispetto a ieri, OPPURE che il tuo reddito familiare rimanga invariato e ci siano 500 morti in più?”. Abbiamo raccolto dati durante la pandemia, tra il 2020 e il 2021.

Due bilance stilizzate affiancate. Su una, simboli dell'economia (monete, grafici in crescita). Sull'altra, simboli della salute (cuore, stetoscopio). Le bilance sono in equilibrio precario, a rappresentare il dilemma. Luce drammatica, stile film noir, obiettivo prime 35mm, profondità di campo per mettere a fuoco le bilance.

In una prima fase (Studio 1), abbiamo verificato che l’assioma di monotonicità fosse rispettato (e lo era, con una probabilità del 98%!). Poi, nello Studio 2, ci siamo concentrati sugli stimoli “non monotoni” (quelli in cui non c’è una scelta ovviamente dominante) in quattro scenari diversi (es. economia privata vs. salute privata, economia privata vs. salute pubblica, ecc.).

Cosa Abbiamo Scoperto nel Mondo Reale?

Abbiamo applicato il nostro k-orders (specificamente la versione TCA, data la natura a due componenti degli stimoli) e il k-modes ai dati. Poi, per validare le strutture di preferenza estratte, abbiamo utilizzato un modello probabilistico chiamato BLIM (Basic Local Independence Model), molto usato nella teoria degli spazi di conoscenza.

I risultati sono stati affascinanti:

  • Confronto k-orders vs. k-modes: Entrambi i modelli si adattavano bene ai dati, con differenze minime negli indici di fit (come AIC e AICc). Considerando che k-orders è una versione più “vincolata” di k-modes (deve rispettare la transitività), questo risultato è un forte indizio che, nel contesto sociale esaminato, le preferenze possono essere considerate transitive. Se non lo fossero state, k-modes avrebbe dovuto performare decisamente meglio.
  • Bias di desiderabilità sociale: Abbiamo stimato le probabilità di “errore” nelle risposte. È emerso che la probabilità che un soggetto, pur preferendo la componente economica, rispondesse a favore della salute (“falsa salute”) era quasi sempre più alta della probabilità opposta (“falsa economia”). Questo suggerisce una tendenza a conformarsi a risposte socialmente desiderabili, specialmente quando si tratta di dare priorità alla salute.
  • Eterogeneità delle preferenze per la salute: In generale, il numero di “stati di preferenza” (cioè i centroidi dei cluster) che favorivano la componente sanitaria era maggiore di quelli che favorivano la componente economica. Questo suggerisce non solo una tendenza generale a dare più peso alla salute, ma anche che le persone che preferivano la salute mostravano una maggiore eterogeneità nelle loro specifiche gerarchie di preferenza.
  • Il contesto conta!:
    • Quando si confrontavano economia privata vs. salute privata, la preferenza per la salute era schiacciante (circa il 40% del campione mostrava una forte preferenza per la salute in tutti gli stimoli).
    • Nello scenario economia privata vs. salute pubblica, la percentuale di persone che davano uguale peso alle due componenti aumentava drasticamente (oltre il 30%), e la forte preferenza per la salute si dimezzava.
    • Similmente, in economia pubblica vs. salute privata, una buona fetta del campione (circa il 40%) mostrava una forte preferenza per la salute, ma anche qui circa il 30% dava uguale peso. È interessante notare che questi due scenari “misti” erano quelli in cui il dilemma sociale era più palpabile.
    • Infine, in economia pubblica vs. salute pubblica, la preferenza per la componente economica sembrava guadagnare terreno, pur rimanendo una preferenza significativa per la salute per circa il 25% del campione.

In sintesi, sembra che quando le persone devono scegliere tra salute ed economia, rispondono in modo opposto a seconda che entrambe le componenti siano descritte in un contesto privato (più peso alla salute) o pubblico (più peso all’economia). Negli scenari misti, la salute tende a prevalere, ma la differenza si assottiglia se è la salute ad essere pubblica e l’economia privata. Il dilemma sociale, quindi, agisce come un moderatore importante.

Conclusioni e Prospettive Future

Allora, cosa ci portiamo a casa da questa avventura nel mondo delle preferenze? Il nostro algoritmo k-orders si è dimostrato uno strumento prezioso per estrarre relazioni di preferenza dai dati, garantendo che siano logicamente coerenti (transitive) e permettendo di esplorare l’eterogeneità delle scelte individuali. Le simulazioni hanno confermato la sua superiorità rispetto al k-modes quando la transitività è un’assunzione ragionevole, e l’applicazione empirica sul dilemma del lockdown ha svelato dinamiche complesse e affascinanti nel processo decisionale umano.

Certo, ci sono delle limitazioni. Come il k-modes, anche il k-orders potrebbe incappare in ottimi locali invece che globali. Tuttavia, i risultati delle simulazioni suggeriscono che le sue performance sono eccellenti. Una direzione futura potrebbe essere quella di integrare k-orders con approcci che esplorano più a fondo lo spazio delle soluzioni, per aumentare la probabilità di trovare l’ottimo globale, magari ispirandoci all’algoritmo k-states.

Spero che questo viaggio vi abbia incuriosito e mostrato come l’intelligenza artificiale possa aiutarci a capire meglio noi stessi e le nostre scelte, anche quelle più complesse. Alla prossima!

Fonte: Springer

Articoli correlati

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *