Riprendiamo dopo tanto tempo, ogni tanto una goccia serve a “cavar la lapide”…
Stavo cercando i dati meteo storici sulla piovosità in Lombardia, il sito dell’ARPA volendo vi fa scaricare i dati storici, ma solo attraverso una procedura BIZANTINA:
- compila un form
- attendi (dicono entro 24 ore)
- arriva via mail un CSV
Tenete conto che nel form non potete specificare tutti i filtri che volete e potete chiedere solo i dati relativi AD UNA FINESTRA TEMPORALE MASSIMA DI UN ANNO!
Questo è l’open data all’italiana, guai a rendere facile l’accesso ai dati PUBBLICI ai cittadini!
Allora mi sono imbattuto in un’altra str…anezza, ho scoperto che il sito ilmeteo.it rende disponibili i dati meteo storici anche in forma CSV, “ottimo!” mi sono detto, guardo il link (es. http://www.ilmeteo.it/portale/archivio-meteo/Milano/2012/Gennaio?format=csv), lo rendo parametrico (i.e., http://www.ilmeteo.it/portale/archivio-meteo/Milano/$anno/$mese?format=csv) e mi faccio uno script che cattura tutti i dati che voglio…
QUASI
Si scopre infatti che SE CI ARRIVO CON UN BROWSER funziona tutto, se uso ad esempio ‘wget’ (tool a linea di comando) mi ritorna un bel:
ERROR 503: Service Temporarily Unavailable.
Mmm… mi sorge un dubbio, provo così:
wget -U “firefox” http://www.ilmeteo.it/portale/archivio-meteo/Milano/2012/Gennaio?format=csv
(cioè facendo finta, dichiarando, di essere “firefox”)
E FUNZIONA!
Si può essere così stupidi? Cercare di impedire l’accesso a chi non si dichiara (perché è davvero solo una autodichiarazione) essere un browser!?
Mah!
Vista la facilità con la quale hai avuto accesso ai dati, mi viene da pensare che il problema sia solo un sito fatto male…