Che cos’è un’inchiesta di Data Journalism? Un caso pratico: La strage dei migranti su Le Monde. | Video

Con questo tutorial potrai ripercorrere le fasi principali della realizzazione di un lavoro di data journalism focalizzato sull’analisi storica delle morti di migranti nel Mediterraneo.

Overview

Il data journalism è un’attività legata molto al tipo di approccio con il quale si può immaginare la narrazione di una storia, e tende ad inquadrarla in un contesto più ampio ed analitico, anche sul piano dello spazio e del tempo.

Che cos’è il datajournalism?

Cosa rende il data journalism diverso rispetto al giornalismo classico? In particolare le nuove possibilità che si aprono combinando la tradizionale ricerca di informazioni (il “fiuto per la notizia”) e la capacità di raccontare una storia attraverso queste, con l’ampiezza di possibilità offerte da metodi, tecniche e grande quantità di dati oggi disponibili associate alle tecnologie digitali.
Il data journalism, scrive Fondazione Ahref, “è un approccio a cavallo tra ricerca e inchiesta giornalistica che fa un uso intensivo di database, mappe digitali e software per analizzare, raccontare e visualizzare un fenomeno o una notizia, spesso producendo dei mashup (un insieme ibrido di informazioni provenienti da più fonti) di elementi diversi”.
I dati possono essere fonte d’informazione per il data journalism, o possono essere lo strumento attraverso il quale la storia viene raccontata, o entrambe le cose. Come qualsiasi fonte, il dato dovrebbe essere trattato con scetticismo: e come qualsiasi strumento, bisogna essere coscienti di come i dati possano permetterci di modellare o restringere il campo delle storie che vengono raccontate partendo da essi (tradotto dal Data Journalism Handbook).
Il data journalism può aiutare un giornalista a raccontare una storia complessa grazie a infografiche animate come queste, o ad automatizzare la raccolta e l’incrocio da diverse fonti pubbliche di dati. Trovate molti esempi sempre nel Data Journalism Handbook, nel sito dei Data journalism Awards, o sui siti DataJournalism.it, Dataninja.it.

Un caso concreto: da un fatto ad una notizia, perché servono i dati

Il 3 ottobre 2013 nelle acque di Lampedusa, nel mare tra la Sicilia e le coste africane, è naufragato un barcone di clandestini. Nel corso del naufragio hanno perso la vita 366 persone secondo l’ultima stima del 3 novembre successivo (Ansa). E’ la prima volta che succede un episodio del genere? La zona di Lampedusa è particolarmente interessata da eventi di questo tipo? Il 7 ottobre, quattro giorni dopo il naufragio, il giornale francese Le Monde ha pubblicato una mappa con i dati di Dataninja, un network italiano di data journalism (più info qui)

Ricerca dei dati

Quando in Dataninja abbiamo cominciato a lavorare sul tema dei migranti morti nel Mediterraneo (estate 2012) ci siamo messi alla ricerca dei dati. Non abbiamo trovato fonti ufficiali (Ministero dell’Interno, istituzioni e osservatori europei come il Frontex) con il censimento dei morti: l’unico sito dove se ne parlava era Fortress Europe, un blog curato da Gabriele Del Grande, un giornalista free lance che per sei anni ha raccolto tutte le testimonianze e le notizie al riguardo.

Scraping

Gabriele ha raccolto i dati in una grande tabella, suddividendo le informazioni in quattro colonne ( data / nazione / breve articolo / fonte ) andando a ritroso nel tempo e ricostruendo gli episodi fino al 1988. Non sapevamo se i dati erano completi, ma per ciascun evento elencato è presente un link a una fonte (che sia essa un articolo di giornale, italiano e del Magreb, o un post sul blog fatto dallo stesso Gabriele). Le cose principali che abbiamo notato sono due: primo, che i dati erano organizzati in tabella quindi era possibile fare lo scraping (lo scraping consiste nell’estrarre dati da fonti come siti internet, file pdf, documenti che includono dati ma che non sono organizzati in tabelle come Excel); secondo, che durante lo scraping potevamo estrarre anche il link alla fonte, che dava almeno in parte attendibilità alla notizia. L’estrazione con Scraper similar (estensione di Google Chrome) è stata semplicissima.

L’Analisi e l’arricchimento dei dati

Una volta estratti i dati, abbiamo costruito un dataset/tabella con cinque colonne: le quattro iniziali (data / nazione / articolo / fonte) e aggiunto nella quinta il link alla fonte della notizia. Totale: circa 1500 naufragi dal 1998 al 2012. Da lì è cominciato il nostro lavoro: ripuliti i dati, ci siamo posti l’obiettivo di contare il numero di morti. Abbiamo aggiunto una sesta colonna nella tabella compilando la con il numero di morti e dispersi per singolo naufragio. Totale: oltre 19 mila tra annegati e persone scomparse in mare e mai più ritrovate.

Le coordinate geografiche

Ma dove sono avvenuti i naufragi? Alcuni in Italia, altri in Spagna, altri a Malta, altri sulle coste della Grecia. Informazioni troppo vaghe. Ci siamo dati l’obiettivo di trovare le coordinate geografiche di ogni singolo evento cercando di risalire ai luoghi esatti. Non è stato semplice, perché molti naufragi sono avvenuti a qualche miglio dalla costa, quindi in mare. Attraverso alcuni accorgimenti, abbiamo ricostruito comunque le coordinate geografiche, aggiungendo al dataset due colonne: latitudine e longitudine (abbiamo costruito un tool dove immettere in nome della località, e che disegna sulla mappa una circonferenza, della quale puoi modificare il raggio. Se scrivi “Lampedusa” con raggio 10km/10nm, viene fuori un pallino che poi puoi spostare in corrispondenza del presunto punto del naufragio. Il tool è qui http://utilities.dataninja.it/coordfinder/).

La visualizzazione

Dalla tabella iniziale di Fortress Europe con quattro colonne, abbiamo quindi costruito un dataset più grande aggiungendo: una colonna per il link alla fonte, una colonna per il numero di morti e dispersi, due colonne per le coordinate geografiche. Questo dataset è già pronto per una mappa. Abbiamo usato un’applicazione online che si chiama CartoDB, proiettando i dati usando come base una mappas di Open Street Map (la Wikipedia delle mappe). I punti dei naufragi sono stati posizionati sulla base delle coordinate geografiche, ma sempre su CartoDB abbiamo attivato un’opzione che permette di definire la grandezza dei punti in base a un numero (il weight, ovvero il peso). Quel numero sono i morti e i dispersi. La mappa finale, che abbiamo ristretto al periodo tra il 2009 e il 2013, mostra tutti i naufragi censiti su Fortress Europe avvenuti nel Mediterraneo. Questa mappa è stata pubblicata sul giornale francese Le Monde il 7 ottobre 2013.