F. Meroni (coordinatore), P. Augliera, M. Maistrello e G. Rubbia (Ingv-Mi)


Rapporto della commissione DOL


Database delle forma d'onda delle indagini a rifrazione/riflessione a grande angolo (R/WAR)
registrate sul territorio italiano (DOL, Dss-On-Line)

 

Part  A:  text
Part  B:  annexed


A) TEXT

              prot. 90/2002   

Sommario

 

       Premessa


1.     
Termini iniziali del progetto

1.1   Scopi

1.2   Materiali confluiti e loro status (pubblici o meno)

1.3   Pre-elaborazione dei dati

1.4   Procedure tecniche di sviluppo in materia di elaborazione

1.5   Procedure tecniche di sviluppo in materia di disseminazione


      2.      Percorso realistico per la conclusione del progetto nell'ambito del nuovo quadro operativo e istituzionale


3.     
Conclusioni e proposte


      Riferimenti bibliografici


      Elenco Allegati

 

-------------------------------------------------------------



Premessa

Dopo il suo insediamento (9 Aprile 2002), la commissione si è ritrovata in 6 riunioni, durante le quali ha prodotto e/o elaborato una serie di documenti inerenti il progetto DOL-2000.

Dello stato di avanzamento dei lavori, sono stati informati anche R.Camassi e G.Musacchio.

Questo rapporto finale viene presentato in data odierna dopo che, a seguito di concomitanti impegni di alcuni dei membri, la scadenza dei lavori era stata prorogata a fine Maggio 2002 (scadenza iniziale: 20/5).

 

Milano, 18 Settembre 2002



1. Termini iniziali del progetto

 

1.1  Scopi

 

Si confermano qui gli scopi di DOL già descritti in un articolo pubblicato sul bollettino CILEA n. 63 (Ferrari et al., 1998) e ripresi nel sito http://dssol.mi.ingv.it in questi termini: mettere a disposizione della comunità scientifica una banca dati di sismica attiva (dati 'Deep Seismic Soundings' - DSS - ) completa, facilmente consultabile e gestibile via Web, che oltre alla possibilità di navigazione attraverso l'intera storia delle esplorazioni crostali italiane, consenta anche lo scarico delle forme d'onda numeriche, per eventuali ulteriori elaborazioni e/o re-interpretazioni. Infine, a integrazione dei dati primari, nel progetto è prevista la possibilità di inserire altri dati accessori (riferimenti bibliografici) utili per indirizzare l'utente verso ulteriori approfondimenti.

 

Il più recente documento di aggiornamento del progetto è: "DOL-2000, l'archivio web delle registrazioni sismiche crostali in Italia"; rapporto interno a cura di M.Maistrello, Ingv-Mi, Nov. 2001 (pubblicato anche come ipertesto sul sito citato).

[ top ]

1.2 Materiali confluiti e status

 

La base dati del progetto è costituita da materiale 'grezzo', raccolto presso Istituzioni italiane ed europee e confluito in IRRS, per essere ulteriormente elaborato. E' costituito da tutte le informazioni relative alle varie campagne di sismica crostale italiane eseguite sotto l'egida di diversi coordinatori di progetto negli anni '70-'90.

In particolare, i materiali raccolti per il progetto DOL erano costituiti da:

 

§         nastri analogici originali: cassette o bobine registrate da operatori di vari Istituti di ricerca italiani e stranieri, partner dei progetti, in tempi e ambiti diversi quali:

 

i)    nel progetto europeo E.S.F. ‘EGT’ - European GeoTraverse (1982-'86; coord. S. Mueller, ETH, ZH). I dati dei segmenti Centro-Sud (Alpi-Appennini '83-'86;  Tunisia '85) sono stati raccolti ed elaborati dall'IRRS su incarico della Direzione del progetto; resp. Maistrello;

ii)    sotto l’egida della E.S.C., sotto Commissione 'D' (Deep Seismic Soundings - 1956-'81); coordinamento italiano a cura del ‘Gruppo Italiano Grandi Profili' (coord. C. Morelli, UNI TS). Dati (originali o copie) ceduti gratuitamente all'IRRS-CNR dai diversi Istituti;

iii)   in progetti ‘speciali’ coordinati da Consorzi di ricerca, ad  es.: App. Nord '87 (UNI MI, CNR, AGIP). Dati raccolti dall'IRRS su incarico dei Coordinatori;

iv)  in progetti coordinati da IGL e/o IRRS CNR, ad  es.: Bolsena, 1986-'87-'90. Dati raccolti dall'IRRS in quanto Coordinatore di progetto.

 

§       tabelle e altro materiale cartaceo di supporto. Questo materiale contiene informazioni aggiuntive necessarie per la descrizione geografica e parametrica dei dati relativi ai punti di scoppio e ai siti di registrazione.

 

Circa il loro status: per i dati i) si dispone del parere scritto dei segretari scientifici J. Ansorge e R. Freeman che esprimono il criterio che i dati diventano di dominio "pubblico" una volta pubblicati su una rivista internazionale (copia comunicazione); per i dati ii) il coordinatore italiano C.Morelli conferma un analogo criterio (comunicazione personale e fax); anche per i dati iii) si dispone di una dichiarazione simile del responsabile AGIP  al coordinatore prof. Cassinis (copia fax). I riferimenti citati sono elencati nell'allegato 1.

Questa commissione, sulla base della documentazione prodotta, ritiene quindi che i dati grezzi i) -iii), peraltro già elaborati e pubblicati, siano da ritenersi senz'altro di dominio pubblico.

Per i dati iv) si ritiene che siano anch'essi da considerare pubblici e comunque di pertinenza Ingv in quanto compresi fra quei beni oggetto di trasferimento da IRRS a INGV, in virtù del decreto istitutivo di quest'ultimo.

Il materiale cartaceo di supporto è valutato alla stessa maniera.

 

Per quanto riguarda la classificazione e lo status dei dati raccolti a questo stadio del progetto si è fatto riferimento alle linee guida riassunte in un documento dell'AIPA riguardante il tema delle banche dati (AIPA, 2002).

[ top ]


1.3  Pre-elaborazione dei dati

 

I segnali grezzi venivano successivamente digitalizzati ed elaborati in tempi e con software diversi, per andare a costituire il database del progetto DOL. I dati così elaborati costituivano un primo archivio di dati digitali grezzi, residenti su supporti e con formato diversi. Anche il loro backup è stato alquanto disomogeneo nel tempo.

 

Possiamo sintetizzare la classificazione così:

 

Categoria

Descrizione

A1

dati digitalizzati in ambiente HP-2100 DAS, e conservati su NASTRI-IBM (ambiente IBM VM/CMS)

A2

dati digitalizzati in ambiente HP-9000 e conservati su Floppy da 3.5" (ambiente HP-BASIC)

 

a cui si deve aggiungere una terza categoria di dati già digitali in origine:

 

A3

dati digitali MARS-88 conservati su Floppy da 3.5" (ambiente M_88)

 

L'allegato 2 mostra la tabella complessiva dei dati digitali "grezzi". Tali dati costituiscono il patrimonio informativo primario da cui ripartire, e su cui il nuovo progetto di database on-line dovrebbe lavorare (mediante un'attività di recupero, prima, e di successivo processing, poi).

 

I dati elencati in tabella 2 non sono ancora attualmente tutti disponibili in formato digitale; infatti è incompleta la digitalizzazione di alcune campagne sismiche (es. Calabria '79 e Appenino Sud '73) che costituiscono circa un 8-10% dell'intera base dati. Si stima che il tempo richiesto per il completamento di questa operazione sia di circa 1 mese/uomo.

[ top ]

 

1.4  Procedure tecniche di sviluppo in materia di elaborazione

 

 

Dopo la creazione dell'archivio, i dati subivano un processing ad-hoc, realizzato grazie ad alcuni moduli scritti appositamente da due Partner del progetto. Il pacchetto 'CHK' (che esamina l'header, controlla e formatta i data-file e ne visualizza una versione ridotta; Corsi, 1999) e 'PARSER-DSS' che organizza i file locali, predispone le cartelle in remoto e ne esegue l'upload in ftp automatico su server remoto (Ferrari, 2000).

 

Nell'ottica di un recupero di tale archivio-dati così variamente conservato, è importante sottolineare le possibili perdite di dati dovute al degrado dei supporti fisici di memorizzazione (nastri e floppy disk: da test già fatti - recupero dati presso Uni-Bocconi - si stima tale perdita in circa 25-30% !).

 

 

Di seguito si sintetizzano i passi necessari in materia di recupero ed elaborazione:

 

 

Dati

Problema tecnico

Soluzione possibile e/o necessità segnalate

'A1'

Recupero dati digitali da Nastri-IBM

Possibilità di recuperarli tramite collaborazione (scientifica/gratuita) con il servizio A.S.I.T. della Università Bocconi già sperimentato. Si segnala che alcuni nastri presentano problemi di lettura legati al deterioramento del supporto (vedi all.2).

'A2'

Recupero dati digitali da Floppy HP-Basic

Dati recenti: uso sw 'Menu_HP' (Maistrello, '96);

Dati 'vecchi': aggiornamento di alcuni moduli di servizio, nel pacchetto 'Menu_HP' - scrittura nuovo software Basic-Hp;

'A3'

Recupero dati digitali Mars_88

Utilizzo esteso del pacchetto 'Marstool' (Corsi et al., 1990) disponibile. Ove necessario, impiego del sw originale Lennartz.

Tutti

Controllo e formattazione per la pubblicazione in DOL

Si tratta di creare nuovo software in ambiente Matlab, in sostituzione di quanto realizzato in passato con il pacchetto 'CHK' (Corsi, 1999).

Tutti

Organizzazione dati per il trasferimento via ftp al Server Cilea

Software 'Parser' disponibile (Ferrari, 2000)

 

Completamento documentazione HTML per sito web

V. paragrafo 1.5

[ top ]


1.5    Procedure tecniche di sviluppo in materia di disseminazione

 

E' stata fatta una rapida rassegna delle tecniche utilizzate da varie Istituzioni scientifiche (nazionali ed internazionali) in tema di accesso e disseminazione di dati sismici. E' stato verificato che nessun ente italiano mette in linea le forme d'onda numeriche scaricabili gratuitamente e liberamente. Le modalità e le politiche di accesso, per la gran parte, passano preliminarmente attraverso una richiesta di informazioni tra l'erogatore e l'utente (generalmente tramite compilazione di forms on-line).

Viceversa, alcune istituzioni straniere offrono tale possibilità, ad es. ETH e RENASS (vedi allegato 3).

 

In tema di Web-publishing sono state intraprese le seguenti azioni.

 

Si è riesaminato il prototipo in rete confermando la validità strategica dell'impianto complessivo. Il prototipo, infatti, per quanto limitato nelle sue funzionalità (ricordiamo che stiamo valutando un progetto interrotto), ne mostra a grandi linee i caratteri fondanti, pur nella limitatezza delle specifiche progettuali iniziali. Recentemente sono state apportati ritocchi significativi nella homepage. E' chiara l'impressione di "cantiere in stand-by", per motivi spiegati nel seguito. Si riscontrano, infatti, una serie di carenze funzionali che, una volta implementate, potrebbero sicuramente valorizzare di molto il prodotto. Queste sono:

 

E' stato aggiornato l'ipertesto descrittivo del progetto, visibile sul sito http://dssol.mi.ingv.it, con informazioni di natura istituzionale (riguardanti gli enti finanziatori delle campagne sismiche in oggetto) e di natura grafico-descrittiva (mappe per tutte le campagne crostali).

 

Sono stati recentemente ripresi i contatti con il partner progettuale fornitore di servizi Web (Cilea). Tali rapporti si erano affievoliti a causa delle difficoltà generali nella conduzione del progetto, a seguito della separazione del gruppo di ricerca a cui DOL faceva inizialmente riferimento. In seguito a ciò sono stati pianificati alcuni strumenti di ottimizzazione del sito, alcuni dei quali già attivati (ad es. l'analisi degli accessi da parte dell'amministratore di sistema: oltre 500 hits dal Giugno '02). Sono state inoltre acquisite le tabelle relazionali di campagne, profili, stazioni, etc. e le specifiche implementative, che hanno arricchito la sezione descrittiva del sito. Si sta inoltre sperimentando il modulo di interrogazione tramite interfaccia cartografica (Web-GIS). Infine siamo in attesa di una proposta di acquisizione dei codici s/w sorgente nella loro ultima versione, in vista di una possibile futura scelta "autonoma" di sviluppo del progetto.

[ top ]



2. Percorso realistico per la conclusione del progetto nell'ambito del nuovo quadro operativo e istituzionale

 

E' necessario evidenziare alcuni punti critici:

 

a)    non tutti i dati digitali grezzi saranno recuperabili (e ciò limita il carattere primario della 'completezza' del database citata tra gli 'scopi' primari del progetto);

b)   un completo archivio dei dati già corretti ed elaborati esiste, ma non è attualmente disponibile presso l'INGV (rif. IDPA-CNR);

c)    occorre comunque sviluppare s/w di vario tipo, sia per la semplice opera del 'recupero' che per completare il prototipo e valorizzarne la presenza in rete;

d)   INGV-MI è titolare del prototipo DOL-2000 (in quanto finanziatore dell'attuale versione in linea).

 

A nostro avviso per arrivare a definire un percorso realistico per la conclusione del progetto nell'ambito del nuovo quadro operativo e istituzionale si possono individuare i seguenti possibili scenari:

 

1)    Abbandono del progetto. Tale soluzione permetterebbe soltanto la realizzazione di una semplice soluzione di storage organizzato e controllato di dati su CD-ROM in modo almeno da salvaguardare quanto finora prodotto. C'è bisogno comunque di scrivere nuovo software per realizzare i primi tre steps della tabella riportata in 1.4.

Stima mesi/uomo necessari: 4.

 

2)      Una seconda ipotesi prevederebbe invece il completamento del prototipo basandosi principalmente su forze interne alla nostra sezione, inserendo nel database quanto sarà possibile recuperare dai vecchi nastri IBM  e floppy disk. Per tale soluzione occorrerà ovviamente procedere con una opera di re-styling del progetto, soprattutto creando nuovo software ad hoc in diversi ambienti (Basic-Hp, Matlab): a tale scopo si potrebbe prevedere l'utilizzo di personale a contratto (3 mesi) per la realizzazione di s/w dedicato all'elaborazione dati. Quest'ipotesi non prevede nuove implementazioni per la parte relativa alla pubblicazione sul Web dei dati.

 Stima mesi/uomo necessari: 6.

 

3)      Una terza ipotesi avrebbe come scopo quello di allineare il "nuovo-DOL" agli altri database dell'ente, insediando un gruppo di lavoro composto esclusivamente da personale INGV che riveda completamente il progetto. Tale schema ricalca quanto l'ente sta sviluppando nell'ambito del progetto SISMOS. A tale scopo sono già stati avviati alcuni contatti preliminari con il gruppo della sezione CNT di Roma che cura tale progetto. Anche quest'ipotesi non prevede nuove implementazioni per la parte relativa alla pubblicazione sul Web dei dati.

 Stima mesi/uomo necessari: 9.

 

4)    Una quarta ipotesi ricalca la precedente tranne prevedere la collaborazione di personale esterno afferente ad istituzioni scientifiche che istituzionalmente si occupano di tali tematiche ed esterne ad INGV (ad es. OGS).

 Stima mesi/uomo necessari: 18.

 

Per le soluzioni sopra riportate è implicita la continuazione della collaborazione con il Cilea (attualmente sotto contratto a tutto il 2002), che attualmente fornisce il supporto informatico alla parte relativa alla pubblicazione sul Web dei dati.

Se, al contrario, si prevedono sostanziali modifiche e potenziamenti relativamente alla fase di diffusione dell'informazione tramite interfaccia Web senza interventi esterni, occorrerà prevedere un ulteriore periodo di circa 6 mesi/uomo con competenze specifiche. Sembra opportuno in questo caso considerare l'acquisizione dei codici s/w usati per la pubblicazione sul Web della banca dati, in modo da rendere completamente autonoma la fase di manutenzione e futuro sviluppo. In tal caso bisogna tenere conto dei costi necessari per la compatibilità h/w e per le licenze dei software engine utilizzati per l'archiviazione dei dati e la loro diffusione tramite Web-GIS.

[ top ]


 

3. Conclusioni e proposte

 

Il compito della commissione DOL era il seguente:

 

Nei paragrafi precedenti si sono descritte le analisi effettuate per espletare i compiti richiesti. La commissione suggerisce di adottare la soluzione sotto riportata (punto 3 del paragrafo precedente) e cioè:

 

"allineare il "nuovo-DOL" agli altri database dell'ente, insediando un gruppo di lavoro composto esclusivamente da personale INGV che riveda completamente il progetto".

 

Tale soluzione permetterebbe di confrontarsi con realtà istituzionali INGV che nel passato hanno acquisito esperienza consolidata su tematiche simili. Anche la stima dei tempi necessari per portare a termine il progetto appare adeguata. Occorre comunque ricordare che il data set recuperabile sarà costituito da circa il 75% della base dati inizialmente disponibile e descritta in allegato 2.

 

Nel caso non fosse percorribile tale soluzione la commissione suggerisce di adottare quanto esposto al punto 2 del paragrafo precedente (completamento del prototipo basandosi principalmente su forze interne alla nostra sezione).

[ top ]


 

Riferimenti bibliografici per approfondimenti

 

AIPA (2002). Autorità per l'Informatica nella Pubblica Ammninistrazione (2002). I dati pubblici: linee guida per l'accesso, la comunicazione e la diffusione. Redazione preliminare, 8 febbraio 2002, pp. 25. Retrieved  May, 7 2002, http://www.aipa.it/servizi[3/notizie[2/dati_pubblici.pdf

Barba S., Di Giovanbattista R., Smriglio G. (1993). ISND: il database di parametri e forme d'onda. In: Atti del XII convegno nazionale GNGTS, CNR-Roma, I, 527-534.

Bernabini M. (2000). Il Progetto Crosta Profonda (CROP): nuove prospettive. In: Bollettino Geoitalia, n. 5; http://server.dst.unipi.it/fist/geoitalia5/41.htm.

CNR (1979) - P.F. Geodinamica e Energetica, U.O.OGS. Grandi scoppi 1979. Relazione OGS n. 79546; 36 pp.

Corsi A. (1994). M_MATPLT: una procedura per l'elaborazione di dati sismici multicanale su piattaforma Matlab. Rapporto CNR-IRRS, 1994; 22 pp.

Corsi A. (1999). CHK - procedura software per il controllo e la conversione di dati sismici e sismologici. Rapporto CNR-IRRS 1999; 20 pp.

E.S.F. (1990). European Geotraverse Project (EGT) 1983-1990 - Final Report.

Gee D., Artemieva I.M. Eds. (ESF - 2000).  Europrobe 1992-2000 - Special Report.

Ferrari R. (2000). Dss-On-Line: linee guida per l'acquisizione dei dati. Rapporto interno CILEA 2000; 4 pp.

Ferrari R., Maistrello M. (2000). Deep Seismic Soundings: il progetto continua. In: Bollettino Cilea n. 74, Ottobre 2000, 11-14.

Ferrari R., Miglioli P., Maistrello M., de Franco R., Corsi A. (1998). L'esplorazione sismica profonda in Italia: dati Deep Seismic Soundings in rete!  In: Atti del XVII Convegno annuale GNGTS, CNR, Nov. 1998 (CD-rom, III - Geofisica crostale) e in: Bollettino Cilea n. 63, Giugno 1998, 5-12.

Gaudiosi G., Lo Bascio D., Milano G. (2000). Crustal structure of southern campanian area from DSS and teleseismic data. In: Evoluzione Geologica e Geodinamica dell'Appennino: studi in memoria del Prof. G.Pialli, Foligno 16-18 febb. 2000. Abstract  volume, 162-164.

Gruppo Sea-Land CropMare II (1997). Wide angle reflection sea-land CROP-Mare II & LISA Project - Section Atlas. de Franco R., Caielli G., Corsi A. Editors.

GU-EU serie L 77 del 27/3/1996. Direttiva 96/9/CE relativa alla tutela giuridica delle banche di dati.

Maistrello M. (1996). Menu_Hp: una procedura unificata per la digitalizzazione, elaborazione, archiviazione, trasmissione di segnali sismici analogici, in ambiente Basic-Hp. Rapporto CNR-IRRS 1996; 68 pp.

Maistrello M. (2001). DOL-2000: l'archivio web delle registrazioni sismiche a rifrazione profonda (revisione del progetto Dss-On-Line '98). Rapporto interno INGV-MI, 2001., 15 pp.

Maistrello M., Scarascia S., Corsi A., Egger A., Thouvenot F.  (1990). EGT-'85 Southern Segment: Compilation of Data from the seismic refraction experiments in Tunisia and Pelagian Sea. open-File Report CNR-IGL, Novembre 1990; parte I: 115 pp., II: 79 tabelle.

Morelli C. (1993). Risultati di 31 anni (1956-86) di DSS e 7 anni (1986-92) di CROP in Italia. In: Atti del XII convegno annuale GNGTS, CNR-Roma, I, 3-30.

Morelli C. (1998). Prospettive aperte dalle nuove conoscenze geofisiche in profondità nella Penisola Italiana. In: Atti del XVII convegno nazionale del GNGTS, CNR, Nov. 1998;  (CD-rom, I - Geodinamica; 16 pp).

Morelli C. (2000). Contributi della geofisica della terra solida alle scienze della Terra, all'economia ed alla protezione dell'ambiente. In: Bollettino Geoitalia n.5; 3 pp.

Slejko D. (2001). Metodi e prospettive per una maggiore conoscenza della Crosta terrestre. In: CNR-Ricerca & Futuro; 19 , 73-84.



Elenco Allegati

 

1.      Elenco delle comunicazioni dei diversi Coordinatori di campagne di rilievo incluse in DOL (depositate presso M. Maistrello)

 

1.1.  Dati EGT: comunicazione di J.Ansorge e R. Freeman, ETH, Zuerich (gennaio 1990);

1.2.  Dati ESC - Gruppo Italiano Grandi Profili: comunicazione del prof. C.Morelli (Aprile 2002);

1.3.  Dati da progetti "speciali": comunicazione dell'Ing. Bolondi (AGIP) al coordinatore prof. Cassinis (Settembre '89)

1.4.  Comunicazione dr. Slejko (OGS, Maggio 2002)

 

2.      Tabella dei dati digitali del progetto DOL-2000

 

3.      Alcuni riferimenti a siti di istituzioni straniere gestori di database sismici.