Questo progetto di Laboratorio di Big Data, Data Mining e Data Analytics analizza le performance della rete ferroviaria italiana nel mese di Novembre 2025, utilizzando dati reali granulari estratti dalla piattaforma TrainStats.
Il dataset copre il traffico nazionale dal 01/11/2025 al 30/11/2025.
- Volume: ~250.000 corse monitorate.
- Granularità: Dati per singolo treno (non aggregati).
- Scope: Sono stati filtrati i treni internazionali e i convogli tecnici/merci per focalizzare l'analisi sull'esperienza passeggeri.
- Clona la repository o scarica la cartella.
- Installa le dipendenze:
pip install -r requirements.txt
- Apri il Jupyter Notebook:
jupyter notebook train_stats.ipynb
- Linguaggio: Python
- Analisi Dati: Pandas, NumPy
- Visualizzazione: Matplotlib, Seaborn
- Machine Learning: Scikit-Learn
- Giovanni Morelli
Corso di Laboratorio di Big Data, Data Mining e Data Analytics | CdL Tecnologie dei Sistemi Informatici | Università di Bologna | A.A. 2025-2026
Fonte dati: trainstats.com