USA Shooting Analysis
Analisi degli incidenti di sparatoria nelle scuole negli Stati Uniti d'America.
Data: 20 gen 2023
Introduzione
Il progetto si concentra sull’analisi degli incidenti di sparatoria nelle scuole negli Stati Uniti d’America utilizzando dati raccolti da Kaggle. Lo scopo principale è stato creare un data warehouse utilizzando Pentaho per il data cleaning e Tableau per la data visualization, al fine di esplorare, analizzare e visualizzare i dati in modo efficace e intuitivo.
Obiettivi del Progetto
- Creazione di un data warehouse per integrare e consolidare i dati sugli incidenti di sparatoria nelle scuole
- Utilizzo di Pentaho per il data cleaning e la preparazione dei dati, garantendo la qualità e l’integrità delle informazioni.
- Utilizzo di Tableau per la creazione di visualizzazioni interattive e informative che permettano di esplorare i dati e identificare pattern e tendenze significative.
- Fornire un’analisi approfondita dei fattori associati agli incidenti di sparatoria nelle scuole, inclusi la frequenza, la localizzazione geografica, le armi utilizzate e altri parametri rilevanti.
Metodologia e Strumenti Utilizzati
Data Cleaning con Pentaho
Pentaho è stato utilizzato per l’implementazione di processi ETL (Extract, Transform, Load) al fine di:
- Integrare i dati da diverse fonti e formati in un unico data warehouse.
- Pulire e standardizzare i dati per garantire la coerenza e l’affidabilità delle informazioni.
- Effettuare la rimozione dei duplicati, la gestione dei dati mancanti e la normalizzazione dei formati per facilitare l’analisi successiva.
Data Visualization con Tableau
Tableau è stato impiegato per creare visualizzazioni interattive e dinamiche dei dati, permettendo agli utenti di:
- Esplorare graficamente i dati sugli incidenti di sparatoria nelle scuole attraverso mappe, grafici e dashboard intuitivi.
- Identificare trend temporali, geografici e demografici associati agli incidenti.
- Analizzare l’impatto e la frequenza degli incidenti in diverse regioni degli Stati Uniti.
Risultati e Conclusioni
Il progetto ha prodotto un data warehouse efficiente e una serie di visualizzazioni dettagliate che hanno permesso di:
- Identificare cluster geografici di incidenti di sparatoria nelle scuole e confrontarli con variabili socio-economiche.
- Esplorare la correlazione tra tipologia di arma utilizzata, numero di vittime e risposte delle autorità.
- Visualizzare chiaramente le informazioni per informare il dibattito pubblico e supportare decisioni politiche e sociali mirate.
Questo progetto non solo ha migliorato la comprensione degli incidenti di sparatoria nelle scuole negli USA attraverso l’analisi dei dati, ma ha anche fornito strumenti efficaci per la visualizzazione e la comunicazione dei risultati agli stakeholder e al pubblico.
Ecco il link al repository GitHub del progetto.