Già le scuole retoriche dell’antica Grecia e di Roma enfatizzavano il ruolo centrale delle proprietà vocali per esprimere le emozioni e sottolineavano la loro efficacia presso l’uditorio. La medesima prospettiva è condivisa dalla psicologia ingenua. Tuttavia, in ambito scientifico, si è finora dedicato poco spazio all’espressione fonetica e paralinguistica delle emozioni. La voce appare in grado di comunicare le emozioni attraverso la modulazione del ritmo, dell’intonazione e dell’intensità dell’eloquio. Essa possiede enorme potere evocativo non solo per che cosa viene detto verbalmente ma soprattutto per come viene detto. In effetti, i tratti soprasegmentali dell’eloquio, di pertinenza della prosodica e della paralinguistica, sono caratterizzati dall’azione sinergica di diversi parametri della fisica acustica, come il tono, la durata (il ritmo, la velocità dell’eloquio, le pause), l’intensità, nonché dalla qualità articolatoria della fonazione.
La fase di encoding
Nella fase di encoding, che esamina e misura i correlati acustici dell’espressione vocale delle emozioni attivate mediante il ricorso a una varietà di procedimenti, sono empiricamente emersi precisi e forti indicatori vocali per le emozioni considerate. A livello metodologico gli studi sull’encoding presentano una variabilità piuttosto elevata per il numero dei locutori, il ricorso ad attori professionisti o «ingenui», il numero e il tipo di emozioni esaminate, il tipo di materiale acustico impiegato, le condizioni elicitanti ecc. Nonostante la presenza di queste differenze metodologiche, esiste una sostanziale convergenza fra i risultati. Dalle quaranta ricerche circa passate in rassegna e dallo studio condotto in Italia da Anolli e Ciceri emerge che la collera è caratterizzata da un incremento della media, della variabilità e della gamma della Fo, da un aumento dell’intensità della voce, dalla presenza di pause molto brevi o anche dalla loro assenza (come voler «espellere» la frase in un’unica emissione del respiro), da un ritmo elevato. Il profilo di intonazione presenta variazioni frequenti a forma angolare.
La voce della collera «calda» risulta quindi tesa e piena. La paura viene espressa con un forte aumento della media, della variabilità e della gamma della Fo, con un’elevata velocità del ritmo di articolazione, con un’intensità di voce molto forte. Ma distintivi della paura sono rilevanti incrementi nella perturbazione della Fo, con i profili delle armoniche notevolmente irregolari, che indicano la presenza di tremore. La voce della paura è quindi sottile, oltremodo tesa e stretta. A sua volta, la tristezza viene comunicata con la voce attraverso un tono mediamente basso per il decremento della media e della gamma della Fo, un volume basso, la presenza di lunghe pause e un ritmo di articolazione rallentato. Si tratta di una voce rilassata e stretta.
La voce della gioca è qualificata da un incremento della media, della gamma e della variabilità della Fo con una tonalità molto acuta e con un profilo di intonazione progressivo, da un aumento dell’intensità e, a volte, da un’accelerazione del ritmo di articolazione. È una voce ampia, piena e mediamente tesa. Il disprezzo, che è stato finora poco esami-nato, viene espresso attraverso un’articolazione molto lenta delle sillabe e una durata prolungata della frase (i singoli fonemi dell’enunciato vengono scanditi in maniera marcata), con un tono di voce profondo e con un’intensità bassa. Si tratta di una voce abbastanza tesa, stretta e mediamente piena. Anche la tenerezza, esplorata per la prima volta da Molli e Ciceri, è caratterizzata da un ritmo regolare, da una tonalità grave con un profilo di intonazione lineare e da un volume mantenuto costantemente basso. È quindi una voce ampia e distesa.
In base a questi studi sull’encoding vocale delle emozioni emerge l’elevata capacità del canale vocale non verbale nel veicolare in modo autonomo precise informazioni circa gli stati affettivi ed emotivi del parlarne, indipendentemente dal contenuto verbale dell’enunciato (codice paralinguistico).
La fase di decoding
Gli studi sulla fase di encoding riguardano la capacità dell’ascoltatore di riconoscere o di inferire correttamente Io stato affettivo ed emotivo del parlarne prestando attenzione soltanto alle sue caratteristiche vocali. Da una rassegna della letteratura esistente emerge un’amiratezza media di riconoscimento pari al 60% (56% dopo la correzione per l’eliminazione delle scelte corrette dovute al caso). Si tratta di un valore nettamente superiore a quello previsto dalle leggi stocastiche del caso (approssimativamente attorno al 12%) spesso al di sopra delle percentuali di riconoscimento delle emozioni attraverso le espressioni facciali. L’efficacia dei tratti paralinguistici per il riconoscimento dell’espressione vocale delle emozioni sembra doversi attribuire alle variazioni di tono, all’intensità e alle sue modificazioni, nonché al ritmo di articolazione.
Esiste una sostanziale congruenza fra i risultati ottenuti nelle ricerche condotte da Van Bezooijen in Olanda, da Scherer in Germania e da Anolli e Ciceri in Italia, impiegando diversi tipi di attori e con differente materiale linguistico. La collera è l’emozione più facilmente riconosciuta, mentre il disgusto, il disprezzo e la tenerezza sono le emozioni meno facilmente individuate attraverso la voce. In generale, sono più facilmente identificabili le espressioni vocali delle emozioni negative rispetto a quelle delle emozioni positive. Informazioni utili e interessanti giungono anche dall’analisi della matrice delle confusioni. Gli errori, infatti, non sono quasi mai a caso, ma appaiono sistematici e regolari attraverso confusioni simmetriche (per esempio, fra la collera e il disprezzo, fra la paura e la tristezza) o confusioni asimmetriche (per esempio, fra la tristezza e la compassione, fra il disprezzo e l’ironia, fra la gioia e l’esaltazione, e non viceversa).
Gli indizi vocali, determinati dall’azione congiunta di molteplici e differenti fattori biologici, linguistici e socioculturali sono, da un lato, alla base della ridondanza del segno linguistico; dall’altro, rendono ragione della grande variabilità che esiste nella comunicazione verbale delle proprie intenzioni ed emozioni da parte del singolo individuo. Per questa ragione l’essere umano risulta dotato di precise e valide abilità nell’inferire in modo accurato un ampio numero di stati emotivi differenti, basandosi esclusivamente sulle caratteristiche vocali del parlante.
Lascia un commento