Riprendiamo dopo tanto tempo, ogni tanto una goccia serve a “cavar la lapide”…
Stavo cercando i dati meteo storici sulla piovosità in Lombardia, il sito dell’ARPA volendo vi fa scaricare i dati storici, ma solo attraverso una procedura BIZANTINA:
- compila un form
- attendi (dicono entro 24 ore)
- arriva via mail un CSV
Tenete conto che nel form non potete specificare tutti i filtri che volete e potete chiedere solo i dati relativi AD UNA FINESTRA TEMPORALE MASSIMA DI UN ANNO!
Questo è l’open data all’italiana, guai a rendere facile l’accesso ai dati PUBBLICI ai cittadini!
Allora mi sono imbattuto in un’altra str…anezza, ho scoperto che il sito ilmeteo.it rende disponibili i dati meteo storici anche in forma CSV, “ottimo!” mi sono detto, guardo il link (es. http://www.ilmeteo.it/portale/archivio-meteo/Milano/2012/Gennaio?format=csv), lo rendo parametrico (i.e., http://www.ilmeteo.it/portale/archivio-meteo/Milano/$anno/$mese?format=csv) e mi faccio uno script che cattura tutti i dati che voglio…
QUASI
Si scopre infatti che SE CI ARRIVO CON UN BROWSER funziona tutto, se uso ad esempio ‘wget’ (tool a linea di comando) mi ritorna un bel:
ERROR 503: Service Temporarily Unavailable.
Mmm… mi sorge un dubbio, provo così:
wget -U “firefox” http://www.ilmeteo.it/portale/archivio-meteo/Milano/2012/Gennaio?format=csv
(cioè facendo finta, dichiarando, di essere “firefox”)
E FUNZIONA!
Si può essere così stupidi? Cercare di impedire l’accesso a chi non si dichiara (perché è davvero solo una autodichiarazione) essere un browser!?
Mah!