Dettato e Vocabolario Cinese: Nuovi Test per Capire Come Leggiamo
Ciao a tutti! Oggi voglio parlarvi di qualcosa che mi affascina tantissimo: come facciamo a capire il linguaggio, e soprattutto, perché siamo tutti così diversi nel farlo? Pensateci: anche tra persone che parlano la stessa lingua madre e hanno un livello di istruzione simile, come gli studenti universitari, le abilità linguistiche possono variare enormemente. Tradizionalmente, la psicolinguistica – la scienza che studia i processi mentali dietro al linguaggio – tendeva un po’ a ignorare queste differenze, considerandole “rumore” statistico. L’obiettivo era trovare le regole generali, quelle che valgono (o si pensava valessero) per tutti. Ma le cose stanno cambiando!
Perché studiare le differenze individuali nel linguaggio?
Negli ultimi anni, c’è stata una vera e propria svolta. Ci siamo resi conto che ignorare le differenze individuali significa perdere un pezzo importante del puzzle. Come mai alcune persone leggono più velocemente di altre? Perché certi errori grammaticali infastidiscono alcuni e passano inosservati per altri? Capire queste variazioni non è solo interessante, ma fondamentale per avere un quadro completo di come funziona il linguaggio nella nostra mente.
Questo cambiamento è stato spinto da alcuni trend importanti:
- Nuovi metodi statistici: Tecniche come i modelli lineari misti (LME) ci permettono finalmente di analizzare non solo l’effetto medio di una variabile linguistica (tipo la frequenza di una parola), ma anche come questo effetto cambia da persona a persona.
- Grandi moli di dati: Progetti di ricerca su larga scala, come l’English Lexicon Project o il Chinese Lexicon Project, ci forniscono dati su migliaia di persone e parole, dandoci la potenza statistica necessaria per studiare interazioni complesse tra abilità individuali e fattori linguistici.
- Scienza aperta: C’è una crescente tendenza a condividere apertamente strumenti e dati. Questo è fantastico, specialmente per chi studia persone adulte con alta competenza linguistica, per le quali spesso mancano test adeguati. Molti test esistenti sono pensati per bambini o studenti di L2, e usandoli con madrelingua esperti si rischia l'”effetto soffitto” (ceiling effect), cioè tutti ottengono punteggi altissimi e non si riescono a distinguere le differenze sottili.
Proprio per colmare questa lacuna nel contesto della lingua cinese, un gruppo di ricercatori ha sviluppato due nuovi test specifici per adulti madrelingua cinesi proficienti, come gli studenti universitari. E oggi vi racconto proprio di questi!

La sfida: creare test adatti per il cinese
Sviluppare questi test non è stato semplice. Gli obiettivi erano chiari:
- Essere abbastanza difficili: Dovevano poter distinguere le abilità anche tra studenti universitari, che generalmente hanno già un’ottima padronanza della lingua. Niente effetto soffitto!
- Essere versatili: Dovevano funzionare sia per chi usa i caratteri semplificati (usati in Cina continentale) sia per chi usa quelli tradizionali (usati a Hong Kong e Taiwan), e tenere conto delle diverse varianti regionali parlate (come mandarino e cantonese).
- Essere brevi: Idealmente, non più di 10-15 minuti per essere facilmente integrabili in altri esperimenti psicolinguistici.
Così sono nati due test: un test di dettato e un test di conoscenza del vocabolario. Il primo, il dettato, chiede ai partecipanti di scrivere correttamente delle parole cinesi che sentono pronunciare. Sembra semplice, ma richiede una conoscenza precisa della forma scritta dei caratteri (ortografia), cosa non banale in cinese data la quantità di omofoni (parole che suonano uguali ma si scrivono diversamente). Il secondo test, quello sul vocabolario, è a scelta multipla: viene presentata una parola (generalmente poco comune) e bisogna scegliere la definizione corretta tra quattro opzioni. Questo misura l’ampiezza del vocabolario, cioè quante parole una persona conosce.
Come sono stati sviluppati i test?
La selezione delle parole è stata cruciale. Per il dettato, due insegnanti di cinese (uno madrelingua cantonese e uno mandarino) hanno collaborato per scegliere 15 parole (da due a quattro caratteri) considerate difficili per studenti universitari, spesso fonte di errori comuni, e valide in diverse regioni. Si è puntato su parole a bassa frequenza per evitare punteggi troppo alti. Il punteggio si basa sul numero di caratteri scritti correttamente.
Per il test di vocabolario, si è partiti da 60 parole a bassa frequenza. L’autore dello studio ha creato le definizioni corrette (basandosi su dizionari e semplificandole) e le alternative sbagliate (distrattori). Questo set iniziale è stato poi vagliato dagli stessi insegnanti e testato su un piccolo gruppo di studenti. Alla fine, sono stati selezionati 24 item (parole) che funzionavano bene, evitando quelli troppo facili, troppo difficili o ambigui. Il punteggio è semplice: un punto per ogni risposta corretta.
Questi test sono stati poi inseriti all’interno di un progetto più ampio chiamato MELD (MEgastudy of Lexical Decision), che mirava a raccogliere dati su larga scala sul riconoscimento di parole cinesi.

Mettere alla prova i test: la validazione psicometrica
Ora arriva la parte scientificamente più “succosa”: verificare se questi test funzionano davvero bene. I ricercatori hanno raccolto dati da ben 930 studenti universitari madrelingua cinesi, provenienti sia dalla Cina continentale (Guangzhou, usano caratteri semplificati e parlano vari dialetti ma studiano in mandarino) sia da Hong Kong (usano caratteri tradizionali e parlano cantonese, ma conoscono anche il mandarino e l’inglese).
Questo grande campione è stato diviso casualmente in due gruppi:
- Gruppo 1 (N=400): Usato per una prima analisi esplorativa. Si è verificato se ogni test misurasse effettivamente una sola abilità sottostante (unidimensionalità) tramite analisi fattoriale esplorativa (EFA). Si è anche controllata l’affidabilità interna (quanto gli item di un test misurano la stessa cosa) e si sono identificati e rimossi alcuni item “problematici” (che non funzionavano bene o non correlavano con il resto del test).
- Gruppo 2 (N=530): Usato per la validazione incrociata (cross-validation), cioè per confermare i risultati ottenuti sul primo gruppo su un campione indipendente.
I risultati della prima analisi (Gruppo 1) sono stati incoraggianti. Dopo aver rimosso un item dal test di dettato e quattro dal test di vocabolario, entrambi i test sono risultati unidimensionali (misurano principalmente una cosa sola, l'”esperienza lessicale”) e con un’affidabilità interna soddisfacente (valori di Cronbach’s α e McDonald’s ω intorno a 0.76-0.80). Questo significa che i test sono abbastanza coerenti al loro interno.
Conferme e correlazioni: cosa ci dicono i risultati?
La vera prova del nove è arrivata con il Gruppo 2. Le analisi fattoriali confermative (CFA) hanno confermato la struttura a singolo fattore per entrambi i test, e i livelli di affidabilità erano molto simili a quelli del primo gruppo. Ottimo!
Ma non basta. Un buon test deve anche correlare con altre misure simili o collegate. E qui i risultati sono interessanti:
- I punteggi dei due test (dettato e vocabolario) erano moderatamente correlati tra loro (r = 0.63), il che ha senso visto che entrambi misurano aspetti dell’esperienza lessicale.
- Entrambi i test correlavano moderatamente con la performance in un compito di decisione lessicale (decidere velocemente se una stringa di caratteri è una parola reale o no), specialmente con il tasso di errore. Chi andava meglio nei test, faceva meno errori nel riconoscere le parole. Questo suggerisce che i test colgono qualcosa di rilevante per l’elaborazione delle parole.
- Le correlazioni con misure auto-riferite (quanto i partecipanti dicevano di essere bravi in cinese o quante ore leggevano) erano piuttosto deboli. Questo conferma un sospetto diffuso: spesso non siamo bravissimi a giudicare le nostre stesse abilità linguistiche! I test oggettivi sono più affidabili.
- Interessante la correlazione con i voti dell’esame di cinese per l’ammissione all’università: quasi nulla per gli studenti della Cina continentale (Gaokao), ma moderata e positiva per quelli di Hong Kong (HKDSE). Le differenze nei sistemi di esame potrebbero spiegare questo risultato.
Ma non è finita qui! I ricercatori hanno usato il test di vocabolario (la versione “ripulita” da 20 item) anche su un altro campione di 188 persone (non solo studenti, ma anche adulti di età diverse reclutati dalla comunità). E cosa hanno scoperto? Il punteggio nel test di vocabolario correlava positivamente non solo con un altro test di vocabolario validato (LexCHI) e con l’autovalutazione delle abilità di lettura e scrittura, ma anche con la performance nella comprensione di frasi! Questo è un risultato importante, perché collega la conoscenza del significato delle singole parole (misurata dal test) alla capacità di capire frasi intere.

A cosa servono questi test (e quali sono i limiti)?
Allora, qual è il succo di tutto questo? Abbiamo due nuovi strumenti, brevi e psicometricamente solidi (dopo qualche aggiustamento), per misurare l’esperienza lessicale in parlanti nativi cinesi adulti. Sono particolarmente utili perché:
- Permettono di studiare le differenze individuali in modo oggettivo, andando oltre le autovalutazioni.
- Aiutano a capire come l’esperienza lessicale influenzi altri processi linguistici, come il riconoscimento di parole o la comprensione di frasi.
- Forniscono dati normativi (basati su oltre 500 studenti), utili per selezionare partecipanti o confrontare gruppi in futuri studi.
- Sono disponibili gratuitamente online (link nel paper originale), promuovendo la scienza aperta e facilitando il lavoro di altri ricercatori.
Ovviamente, come ogni strumento, hanno dei limiti. Sono stati sviluppati principalmente con studenti universitari (soprattutto il dettato) e testati in Cina meridionale. Usano parole a bassa frequenza, il che li rende adatti a persone proficienti ma potrebbe non essere ideale per chi ha competenze più basse. E, cosa importante, misurano l’esperienza lessicale (conoscenza di parole e ortografia), ma non altre abilità linguistiche cruciali come la comprensione sintattica o la capacità di fare inferenze.
Nonostante questo, rappresentano un passo avanti importante. Ci ricordano che le differenze individuali non sono solo “rumore”, ma una componente fondamentale del linguaggio. E avere strumenti affidabili per misurarle è il primo passo per capirle davvero. Chissà quali altre scoperte ci aspettano esplorando la meravigliosa diversità delle nostre menti linguistiche!
Fonte: Springer
