Skip to content

Instantly share code, notes, and snippets.

@aborruso
Created February 3, 2026 20:16
Show Gist options
  • Select an option

  • Save aborruso/3c943a7a94cc436be06a60dc510d963b to your computer and use it in GitHub Desktop.

Select an option

Save aborruso/3c943a7a94cc436be06a60dc510d963b to your computer and use it in GitHub Desktop.
note rapide

Data Quality Report — Ordinanze viabili (Comune di Messina)

Dataset: Ordinanze viabili
Portale: https://dati.comune.messina.it
Risorsa analizzata: ordinanze_viabili_latest.csv
Data analisi: 2026-02-03

1) Sintesi

Dataset generalmente utilizzabile, ma presenta criticità nei campi temporali (timestamp non standard e date non valide) e carenze di documentazione (schema e tag). Necessarie correzioni per garantire piena interoperabilità e parsing automatico.

2) Metadata Quality

  • Titolo/Descrizione: OK, chiari e descrittivi.
  • Publisher/Organizzazione: OK.
  • Tag: assenti (discoverability ridotta).
  • Schema/descrizione campi: assente.
  • issued: vuoto.

3) File Format Readiness

  • Encoding: UTF-8 (OK)
  • BOM: assente (OK)
  • Separatore: virgola (OK)
  • Righe: 2043 + header
  • Colonne: 7

4) Struttura e Tipologie

Colonne:

  • numero
  • data_pubblicazione
  • inizio_validita
  • fine_validita
  • aree
  • tipo
  • sintesi

Valori mancanti:

  • aree: 18 valori NULL

5) Criticità (Severità)

MAJOR

  • fine_validita contiene timestamp non standard T24:00:00 (205 righe).
  • fine_validita contiene date invalide 2026-02-29T00:00:00 (2 righe; 2026 non è bisestile).
  • Assenza di documentazione schema (campi, tipi, significato).

MINOR

  • Tag assenti.
  • Incoerenza metadati risorsa: distribution_format = AAC, formato reale CSV.
  • issued vuoto.

6) Raccomandazioni

  1. Normalizzare fine_validita in ISO 8601:
    • sostituire T24:00:00 con T23:59:59 o T00:00:00 del giorno successivo.
    • correggere date invalide (2026-02-29).
  2. Pubblicare schema dei campi (Table Schema o JSON Schema), con descrizioni e tipi.
  3. Aggiungere tag tematici per migliorare discoverability.
  4. Allineare i metadati della risorsa (distribution_format, issued).

7) Note tecniche

  • Parsing automatico in DuckDB rileva fine_validita come VARCHAR a causa dei valori non standard/invaldi.
  • Encoding UTF-8 verificato.

Report generato automaticamente.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment