20181211 tweet

Come si è sviluppato il dibattito attorno alla manifestazione nella "Piazza del Popolo Digitale" di Internet? Abbiamo provato a dare una risposta a questo quesito facendo a pochissimi giorni dall'evento un'analisi istantanea delle reti (network analysis) e degli argomenti (Topic Models)

L'8 Dicembre scorso Matteo Salvini ha tenuto la manifestazione nazionale della Lega a Roma, in Piazza del Popolo al grido dell'hashtag #iocisono. Ma come si è sviluppato il dibattito attorno alla manifestazione nella "Piazza del Popolo Digitale" di Internet?

Abbiamo provato a dare una risposta a questo quesito facendo a pochissimi giorni dall'evento un'analisi istantanea delle reti (network analysis) e degli argomenti (Topic Model) generati dal dibattito attorno alla manifestazione dell'8 Dicembre, nella sfera digitale ed in particolare su Twitter.

Ecco come si è strutturato il nostro viaggio al centro della sfera digitale: per prima cosa abbiamo scaricato tutti i tweet contenenti l'hashtag #iocisono, l'hashtag specifico della manifestazione, prodotti a partire dall'1 Dicembre fino alla mezzanotte dell'8 Dicembre (ovviamente incluso) escludendo i retweets (per un totale di circa 1450 tweets); abbiamo rappresentato graficamente le parole più frequenti contenute nel testo dei tweet (wordcloud) per avere una prima idea dei contenuti degli stessi; successivamente abbiamo compiuto una prima network analysis riguardante le relazioni fra gli utenti che hanno partecipato alla discussione attorno alla manifestazione e una seconda network analysis per analizzare le relazioni fra #iocisono e gli altri hashtag impiegati nella discussione; infine abbiamo impiegato una Topic Analysis per estrarre dall'insieme dei tweet gli argomenti principali del dibattito digitale, ordinarli per prevalenza ed osservare il rapporto fra singolo argomento e numero di retweet. Per i curiosi o gli smanettoni, i dettagli e l'elenco degli strumenti impiegati sono nell'appendice metodologica all'articolo.

 

Le parole più frequenti nel dibattito

Come anticipato, il primo passaggio è stato fare una wordcloud che includesse le paole più frequentemente usate nell'insieme dei tweet analizzati (escludendo #iocisono che è presente in tutti di default).

Come ipotizzabile oltre alle parole relative al luogo della manifestazione, le parole più frequenti rivelano uno schiacciamento totale sulla figura del Segretario: "Capitano" "iostoconsalvini" "LegaSalvini" sono le prime altre parole che svettano. Un po' più piccole fanno capolino anche gli slogan impiegati dalla "protesta" anti-salviniana: iononcisarò e iononcisono. Rimangono però isolate, attorniate da slogan della lega e parole "positive" legate al sostegno alla manifestazione, come "noicisiamo" "grande" "Grazie" "tantissimi" "abbraccio", etcetera. Nota interessante: fanno capolino fra gli altri le "giubbe gialle" francesi in rivolta.

 

 

La rete degli utenti

Analizziamo ora la rete prodotta dalle interazioni fra i diversi utenti su Twitter. Per farlo, abbiamo realizzato una "rete" nella quale ciascun utente è un cerchio (nodo della rete) e ciascun linea che collega due nodi indica che i due utenti hanno interagito fra di loro (ovvero uno ha risposto ad un tweet dell'altro o ha menzionato l'altra persona). I nodi hanno grandezze proporzionali al numero di menzioni ricevute (più una persona è citata da altri, più grande sarà il suo nodo) e hanno colori diversi a seconda dei gruppi che sono andati a formare. Il risultato è il grafico che potete vedere qui sotto.

 

iocisono users

Nota bene: clicca sull'immagine per ingrandirla

I nomi degli utenti sono stati anonimizzati a tutela della privacy (sebbene si tratti di tweet pubblici) ma è chiaro come a troneggiare sia l'account di Matteo Salvini, che siede al centro del proprio universo: tutti gli altri utenti hanno una grandezza minima, indice che nessuno di loro si differenzia dagli altri in quanto a retweet (e dunque capacità virale).

Tutto normale e prevedibile? Mica tanto. Viene naturale chiedersi: in questo universo dominato da Salvini-Re Sole, dove diavolo sta l'account ufficiale della Lega?! Non esiste, è disperso. Infatti, se si va manualmente a guardare l'account Twitter ufficiale della Lega, esso non usa mai l'hashtag dedicato alla manifestazione, #iocisono, che invece viene veicolato e pompato nella sfera digitale solo dall'account di Salvini: una scelta certamente particolare e studiata, visto che stiamo parlando della manifestazione proprio di quello stesso partito. I tweet dell'account della Lega mantengono invece come unico hashtag...proprio #Salvini. La scelta, insomma, è stata di schiacciare tutta la promozione e il dibattito attorno alla manifestazione sul leader piuttosto che sul partito.

Tutti i nodi e i collegamenti di colore verde indicano il gruppo di utenti (cluster) che orbita direttamente su Matteo Salvini. Esistono altri piccoli gruppi di utenti che invece interagiscono prevalentemente fra di loro, pur collegati al gruppo principale: il blu comprende LegaSalvini e il Ministro Fontana, quello arancione Noi con Salvini, quello verde acqua Claudio Borghi, quello rosa un gruppo di contestatori e quello azzurro Antonio Maria Rinaldi. Nessuno di questi, però, sembra venire retwittato in modo visibile.

 

La rete degli hashtag

Come per gli utenti, abbiamo realizzato una simile rete per indicare le relazioni fra hashtag nell'insieme di tutti i tweet analizzati: in questo caso quindi i singoli nodi sono i singoli hashtag e ogni collegamento fra due hashtag indica che i due sono comparsi assieme nello stesso tweet. La dimensione dei nodi indica il numero di volte che un hashtag è comparso, mentre il colore dei gruppi indica gruppi di hashtag correlati fra di loro.

iocisono hashtag

Nota bene: clicca sull'immagine per ingrandirla

Come è ovvio, #iocisono è l'hashtag che abbiamo usato per selezionare i tweet quindi tutti lo contengono. Altri hashtag di dimensioni importanti, che quindi sono molto frequenti, sono #LegaSalvini #8dicembre #piazzadelpopolo ma anche #dalleparoleaifatti, lo slogan della Lega dalla formazione del governo.

Il cluster viola è quello che racchiude dunque #iocisono, gli altri hashtag più frequenti e quelli in generale più strettamente riguardanti la manifestazione. Alcuni sottogruppi sono individuabili in questo stesso cluster, di dimensioni molto elevate: uno riguarda un gruppo di hashtag usati dai militanti della Lega  in arrivo dalla Lombardia verso la manifestazione, un altro un gruppo di hashtag che potremmo definire "Patria, Famiglia e Tradizione", riguardano il Decreto Sicurezza, il Natale ed il Presepe, i movimenti dei padri e madri abbandonati. Nella selva fucsia si intrecciano anche i Tweet di polemica sviluppati sulla base degli hashtag #iononcisono ed #iononcisarò, che però almeno in questo contesto non riescono a raggiungere una forza tale da costituire un gruppo proprio, ma accendono una accesa battaglia campale, segnalata da altri hashtag collegati come #UE, #Bruxelles, #razzismo, #nazibuonisti (il mio hashtag preferito della rete).

Un altro cluster rilevante è quello azzurro, collegato a #iocisono dal "fratellino minore" #iocisarò. Qui è la polemica contro la sinistra a dominare, incarnata ovviamente dall'eterna Boldrini (l'hashtag #Boldrin comprende gli hashtag #boldrini, #boldrinismo e #boldrinismi), fra insulti di natura psichiatrica e rivendicazioni del proprio successo. Il cluster marroncino invece accorpa hashtag riguardanti i giovani ed il futuro ed invece hashtag legati alle appartenenze territoriali.

Le considerazioni più interessanti però riguardano gli altri gruppi: il gruppo azzurrino sembra totalmente scollegato al resto, ed è connesso solo tramite #iocisono; il cluster verde invece riguarda evidentemente i tweet di tifosi della Roma riguardo alla partita Roma - Cagliari, collegati al cluster principale tramite #iocisono, #Roma e #Italia. Il gruppo Giallo è un cluster chiaramente riguardante tweet che collegano la manifestazione con lo scenario internazionale delle giubbe gialle e Macron come pure Trump, ma  presenta anche alcune "interferenze", ed anche il cluster rosa pur collegato dall'hashtag #Acquarius, argomento scottante salviniano, è confusionario.

Ancora una volta, non è un elemento casuale: la scelta di impiegare per una manifestazione nazionale, dunque un evento stand-alone su cui far convergere tutta la propria potenza di fuoco per un periodo ristretto, una frase comune e di vario utilizzo come #iocisono, fa sì che i tweet che riguardano effettivamente la manifestazione si mischino con altri tweet che usano lo stesso hashtag in tutt'altri contesti. Ma finché si è sicuri che la propria potenza di fuoco garantirà un predominio all'interno della rete degli hashtag, come effettivamente abbiamo osservato nel grafo sovrastante, tutti questi altri tweet porteranno semplicemente acqua al proprio mulino e aiuteranno a far diventare trending topic e a far guadagnare rilevanza al tema.

 

Analisi degli argomenti

Per l'ultima analisi abbiamo estratto dall'insieme di tutti i tweet gli argomenti principali riguardanti la manifestazione dell'8 Dicembre che vengono trattati nei tweet scaricati. Gli "argomenti" trovati in realtà non sono altro che gruppi di parole correlate fra di loro lungo l'insieme del testo, che vanno interpretati per dargli un significato. L'analisi ha prodotto 45 argomenti, dei quali per esigenze di spazio, tempo e sanità mentale abbiamo analizzato solo i dieci più rilevanti. L'elenco degli argomenti (i primi dieci con relative didascalie) ordinati gerarchicamente dal più influente al meno influente, è riportato qui sotto:

 

iocisono topic hierarchy

 Nota bene: clicca sull'immagine per ingrandirla

Le dichiarazioni di Salvini e l'intervista ANSA prima della manifestazione di Salvini rappresentano l'argomento di gran lunga preponderante; per chi volesse indagare anche la relazione fra argomento e retweet ricevuti, questo è anche l'unico argomento fra i primi dieci che è positivamente correlato al numero dei retweet ricevuti. Il secondo argomento riguarda tutti i tweet di lancio alla manifestazione, in particolare con la didascalia "Ci vediamo a Roma". Il terzo argomento comprende i tweet che hanno rilanciato, condiviso o commentato la diretta Youtube della manifestazione, che ha rivestito dunque un ruolo centrale. Troviamo poi due argomenti relativi ai principali slogan della Lega e Salvini, "Prima gli Italiani", "Governo del buonsenso", "Io sto con Salvini" e "Dalle parole ai fatti". Radio Padania Libera si ritaglia spazio nel sesto argomento, mentre il settimo argomento riguarda il viaggio d'arrivo a Roma e l'ottavo è legato ai tweet della comunità milanese e a Paolo Grimoldi, dirigente di Milano e fondatore dei giovani padani. Il nono argomento è composto da chi twitta entusiasta per il successo della manifestazione e la piazza piena. Il decimo argomento per importante sembra legato all'intervento di Giorgetti, che è l'unico oltre a Salvini a ritagliarsi un proprio spazio in virtù del proprio intervento (le menzioni di Grimoldi rientrano più nei tweet dei milanesi in viaggio verso Roma, e non si riferiscono ad un suo intervento).

L'elenco completo degli argomenti, raggruppati a loro volta per macro-argomenti sempre secondo lo stesso metodo, può essere visualizzato cliccando qui.

Infine, anche gli argomenti possono essere analizzati sotto forma di grafo, in modo da evidenziare le correlazioni esistenti fra di essi: ciascun argomento costituisce un nodo, la cui dimensione del testo è proporzionale alla sua rilevanza; due nodi vengono collegati da una linea quando esiste un legame fra di essi, e lo spessore della linea che li collega è proporzionale all'intensità della correlazione fra i due argomenti.

 

iocisono topic network

 

Appendice metodologica

I tweet oggetto di analisi sono stati scaricati tramite Tweepy per Python, attraverso il Twitter Search API ufficiale.

Il file per la network analysis degli utenti è stato compilato a mano tramite libreoffice, mentre quello per l'analisi degli hashtag è stato ottenuto tramite R grazie agli scripts messi a disposizione da Jonas Schroeder sotto il nome di InstaCrawlR.

Le network analysis degli utenti e degli hashtag sono state sviluppate e prodotte tramite Gephi.

L'analisi degli argomenti è stata realizzata su R tramite pacchetto stm, ovvero Structural Topic Model. L'elenco degli argomento con macro-argomenti è stato sviluppato grazie al pacchetto stmCorrViz mentre i due grafici relativi agli argomenti sono stati prodotti tramite stminsights.

La wordcloud di apertura è stata realizzata tramite Wordclouds, mentre la foto impiegata come base è stata reperita su Internet senza però riuscire a reperire la fonte. Se l'autore desiderasse essere menzionato o chiedesse la rimozione in virtù di privacy, lo prego di contattarmi.

Gli autori di Vorrei
Alessandro Gerosa
Alessandro Gerosa
Classe 1991, è nato e vive a Monza da sempre, dove è attivista prestato a tante cause. Attualmente svolge un dottorato di ricerca in Sociologia e Metodologia della Ricerca Sociale presso la Statale di Milano, occupandosi principalmente di economia creativa e sfera digitale.