Skip to content

Instantly share code, notes, and snippets.

@aborruso
Created February 3, 2026 20:40
Show Gist options
  • Select an option

  • Save aborruso/5b74b9ecc795bd04eedccc0baf6e6cc9 to your computer and use it in GitHub Desktop.

Select an option

Save aborruso/5b74b9ecc795bd04eedccc0baf6e6cc9 to your computer and use it in GitHub Desktop.
note rapide

Report di qualita dati – Dataset “Ordinanze viabili” (Comune di Messina)

Data analisi: 2026-02-03 Dataset CKAN: ordinanze-viabili Risorsa: ordinanze_viabili_latest.csv

Sintesi esecutiva

Il dataset e utilizzabile e ben strutturato, ma presenta criticita importanti sulla conformita dei valori temporali in fine_validita e alcuni metadati mancanti. Si consiglia un intervento di normalizzazione delle date/ore e il completamento dei metadati CKAN per migliorare interoperabilita e riuso.

Valutazione complessiva: Buona con criticita Quality score (indicativo): 78/100

Punti di forza

  • Datastore attivo con schema documentato (label/notes) accessibile via API.
  • Encoding UTF-8, separatore virgola, header coerente.
  • Colonne chiare e semantiche: numero, data_pubblicazione, inizio_validita, fine_validita, aree, tipo, sintesi.
  • Descrizione dataset dettagliata e trasparente sulle limitazioni.

Criticita maggiori (priorita alta)

1) fine_validita non conforme ISO 8601 (orario 24:00:00)

  • Evidenza: 207 record con valore YYYY-MM-DDT24:00:00 (es. 2026-02-03T24:00:00).
  • Impatto: molti parser e DB non accettano 24:00:00.
  • Raccomandazione:
    • Normalizzare a 00:00:00 del giorno successivo, oppure
    • Usare 23:59:59 come fine giornata.

2) Tipo dati incoerente per fine_validita

  • Nel CSV il campo e testo, nel datastore e text, ma la descrizione indica timestamp.
  • Raccomandazione: uniformare a timestamp nel datastore e garantire parsing coerente.

Criticita minori / miglioramenti

Metadati incompleti

  • issued mancante
  • temporal_coverage mancante
  • Tag assenti
  • encoding e separator non dichiarati nei metadati risorsa

Raccomandazione: completare i metadati per migliorare la scoperta e interoperabilita.

Duplicati su numero

  • 2043 righe, numero distinti 1887 → 156 righe con numero duplicato.
  • Nota: potrebbe essere legittimo (ordinanze aggiornate o multiple). Se numero deve essere univoco, serve un controllo.

NULL in aree

  • 18 righe con aree NULL.
  • Raccomandazione: usare stringa vuota o un valore standard quando manca il dato.

Verifiche tecniche (riassunto)

  • HTTP resource URL: 200
  • Encoding: UTF-8
  • Separatore: virgola
  • Righe: 2043
  • Colonne: 7
  • Schema datastore presente via datastore_search?limit=0

Proposte operative

A) Normalizzazione fine_validita

  1. Convertire i valori con T24:00:00 al giorno successivo T00:00:00.
  2. Aggiornare datastore e CSV pubblicato.

B) Miglioramento metadati CKAN

  1. Compilare issued con la data di prima pubblicazione.
  2. Compilare temporal_coverage (intervallo coperto).
  3. Aggiungere tag tematici (es. viabilita, ordinanze, mobilita).
  4. Specificare encoding=UTF-8 e separator=, nei metadati risorsa.

Allegati / Note

Se utile, posso fornire:

  • Elenco completo dei record con fine_validita non conforme.
  • Script di normalizzazione e ricaricamento CSV.
  • Template di metadati CKAN da compilare.
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment