CNR-IRRS
Italian National Research Council
Research Institute on Seismic Risk
Via E. Bassini,15
20133 Milano - Italy
|
CILEA
Lumbard Inter-university Consortium
for Automatic Processing
Via R. Sanzio, 4
20090 Segrate (MI) - Italy
|
D.S.S.
O
n L i n e
An interactive
Data-Base of all the seismic recordings carried out in Italy
from early ’70
by Maistrello M. (CNR-IRRS) and Ferrari R. (Cilea)
-------------------------------------------------------------------------------------------------------------------
digital active seismic data
compiled from the following sources:
D.S.S. Deep
Seismic Soundings (italian and international projects)
E.G.T. European
GeoTraverse (international
"
)
C.R.O.P. CROsta
Profonda (Sea-Land data) (international
"
)
::::::: first provisional draft :::::::
1. Objectives
As project Leader for many years in the italian
seismic refraction surveys (DSS), the Geophysical Group of the IRRS [1]
has collected from all the European Institution involved in any Italian
DSS survey, all the Italian seismic data (starting from early '70) and
organized them into seismic 'profiles'.
The old analog data have been digitized
and normalized [2], whereby the new ones(digitally recorded, [4]) have
been simply collected into the DB. Thus a very big seismic Data Archive
arose (tens of surveys, hundreds of profiles, thousands of seismic traces).
We think that this large public domain archive could be better useful if
it whould be accessible and downloadable from all the geophysicist Colleguesaround the world, using Internet facilities.
So the logical and final step of our effort, will be the design and the
realisation of a public "DSS-self-service-on-line", (of course using the
Internet resources and facilities), where the user can not only navigate
in the whole Italian seismic-data history (along the images of the many
and many international Projects carried out in the Italian peninsula),
but also download the selected data using one of the several search criteria
and the image support.The available seismic data refer only to those recorded
in Italy, from early '70 up to now [3]. Furthermore, an accurate reference
list, connected with all the main lines investigated and showing the main
results, will be available and interactively searchable.
2. The Data
There are four kinds of available data:
-
numerical [ wave-forms := seismograms, expressed
as v=v(t), downloadable ]
-
bibliographycal [ related available Reports,
already published ]
-
images [ for the selected profiles, at least
one image each ]
-
geographical [ vector-data, to allow zooming
etc. ]
[1] using CNR-G.N.D.T. funds, in the year ‘89-‘93;
[2] C.Morelli "Risultati di 31 anni (1956-86) di DSS e 7 anni (1986-92)
di CROP in Italia", GNGTS, 12°, 1993;
[3] M.Maistrello, 1996, "Menu_Hp: una procedura unificata per la digitalizzazione,
elaborazione, archiviazione e trasmissione di segnali sismici analogici,
in ambiente Basic-HP", rapporto interno CNR-IRRS, Febb. '96
[4] Lennartz Web Site (seismic "Mars" instrumentation): click
here
(the following has
to be translated, sorry....)
3. Dati numerici
Riguardano le informazioni digitali dei sismogrammi rilevati dalle numerose
stazioni dislocate sul territorio nazionale. Le stazioni sono raggruppate
in profili come riportato nell’esempio di fig. 1. DSS-ON-LINE permetterà
oltre alla ‘navigazione’ grafica sull’intera storia sismica italiana, anche
il download dei relativi dati numerici, sia come singoli sismogrammi, sia
come interi profili, o parti di essi.
Per ogni singola stazione di registrazione, i sismogrammi possono variare
in numero da uno a tre (verticale, longitudinale e trasversale): essi sono
definiti da una serie di informazioni che li caratterizzano (‘header’)
e da una serie di valori numerici (dati velocimetrici, nell’unità
di misura indicata nell’header). Alcune indicazioni di massima: il numero
dei campioni per sismogramma varia da 7000 a 15000; con un’occupazione
di circa 50-150 Kbyte/sismogramma; il numero totale dei sismogrammi attualmente
disponibile è circa 70.000, con occupazione totale circa 10 Gbyte;
la banca-dati crescerà al ritmo di circa 1 Gbyte/anno, con i dati
provenienti dalle nuove campagne di prospezione (CROP o altro).
Ogni profilo, che può essere rettilineo o ad arco, è
composto da diverse stazioni di registrazione con una elevata densità
territoriale nel caso delle rilevazioni di scoppi marini. I grandi profili
catalogati con la sigla D.S.S. (quelli con un’estensione territoriale di
100 km e oltre, impiegati per lo studio delle caratteristiche dell’intera
crosta terrestre, con profondità di indagine di più di 40
km) sul territorio italiano sono circa 100. Vi sono inoltre per ogni profilo
una serie di informazioni che caratterizzano il punto di scoppio (coordinate,
quote, tempo assoluto, carica, ed eventualmente i dati batimetrici per
gli scoppi marini) e la stazione (coordinate, quota, apparecchiatura usata
e parametri di acquisizione, accoppiamento con il terreno, ecc.). La rappresentazione
grafica dei sismogrammi nel piano Tempi-Distanze viene chiamata sezione-film.
Ogni profilo può disporre di una o più sezioni-film,
relative alle diverse componenti e/o alle diverse modalità di rappresentazione
(ampiezze di normalizzazione, filtraggio, velocità di riduzione,
ecc.).
Per ogni profilo sarà disponibile una serie di dati bibliografici
provenienti da articoli e pubblicazioni che riguardano gli studi e le ricerche
svolte a partire da quei profili, su quell’area italiana.
Oltre alle informazioni relative all’autore, al titolo, all’anno i
dati comprenderanno anche un abstract.
In aggiunta alle informazioni digitali che servono alla riproduzione dei
sismogrammi e dei profili è prevista la gestione e la visualizzazione
delle sezioni-film. In figg. 2 e 3 sono riportati due esempi di sezioni-film:
una DSS antica (bassa densità di sismogrammi) e l’altra moderna
(tratta da una campagna del CROP) con una notevole densità di sismogrammi:
in questi casi la procedura non disegnerà tutti i sismogrammi, ma
provvederà a trovare un equo compromesso per permetterne una rappresentazione
ottimale dal punto di vista grafico. Il numero totale dei film con i dati
disponibili a fine ’97 è di circa 1000.
I dati geografici riguardano le coordinate del territorio nazionale per
la selezione grafica dei profili. Non è necessaria un’accurata definizione,
vista la notevole estensione dei profili. I profili costituiranno il riferimento
principale per il recupero delle informazioni. Orientativamente potrebbero
essere necessarie circa 10000 coordinate per la definizione del territorio
Italiano in scala 1:250000.
4. Il
Sistema Informativo
Il Sistema Informativo che gestirà le informazioni conterrà
essenzialmente i seguenti tipi di dati:
-
alfa-numerici: sismogrammi, profili, scoppi, dati geografici, dati bibliografici
- raster/vector: immagini
Il dato fondamentale contenuto nel S. I. sarà il sismogramma
che è un insieme di dati numerici equidistanziati nel tempo. Poiché
l’occupazione totale in spazio disco dei sismogrammi è notevole,
è stata valutata l’ipotesi di prendere in considerazione la memorizzazione
compressa dei dati che potrebbe ridurre di circa cinque volte lo spazio
necessario alla base dati. La compressione, tuttavia, riduce il sismogramma
ad informazione elementare binaria (Binary large objects)
e quindi inibisce la possibilità di compiere analisi in rete per
analizzare le caratteristiche del segnale. Il sismogramma verrebbe semplicemente
selezionato, decompresso e reso disponibile al ricercatore. Comunque queste
diverse ipotesi verranno valutate sulla base dei risultati del prototipo.
-
Patrimonio informativo iniziale
Il prototipo da sviluppare nella fase iniziale, verrà utilizzato
per analizzare e gestire un sottoinsieme significativo dell’intera base
dati (che comprenderà i dati di tutte le registrazioni sismiche
realizzate in Italia a partire dal 1970 in poi, siano esse relative alle
campagne DSS o EGT o CROP). L’intera banca-dati avrà una consistenza
iniziale di quest’ordine di grandezza:
-
70.000 sismogrammi
-
1000 sezioni-film
-
coordinate geografiche dell’Italia in scala 1:250000
-
200 profili
-
200 scoppi
-
1000 informazioni bibliografiche
-
Aggiornamento della
banca-dati
La banca-dati verrà aggiornata una volta all’anno con l’aggiunta
di nuovi profili (o di nuova realizzazione o di vecchia data e recentemente
digitalizzati) per un totale di circa 1 GByte. Si deve inoltre considerare
un aggiornamento frequente delle informazioni bibliografiche relative ai
profili alle quali vanno sommate eventuali correzioni di sismogrammi di
profili già presenti nella base dati.
Il S.I. deve essere sottoposto a procedure di backup dopo ogni aggiornamento
semestrale della parte relativa ai sismogrammi ed a salvataggi più
frequenti per i dati bibliografici.
-
Riservatezza delle informazioni
Essendo le informazioni contenute di dominio pubblico non sono previste
particolari controlli di accesso. Il S.I. sarà accessibile da Internet
attraverso i comuni prodotti di browsing (Netscape, Microsoft Explorer
ecc..) da chiunque sia interessato alle informazioni contenute. È
possibile comunque attivare un controllo degli accessi al S. I., e ciò
avverrà sicuramente nella fase di avvio di tutto il sistema.
-
Volume dei dati risultato di una ricerca
E’ necessario valutare la mole dei dati, necessari allo sviluppo di una
ricerca, che dovranno circolare in rete. Viste le dimensioni del sistema
informativo saranno utilizzati strumenti per informare l’utente del S.I.
(prima che effettui l’operazione di scarico), sul numero di byte richiesti
e sul tempo di attesa. L’operazione di scarico dei dati verrà fatta
con le usuali operazioni di download previste da Internet.
I dati contenuti nel sistema informativo si potranno interrogare, partendo
da una visualizzazione su base geografica, nel seguente modo:
per sismogrammi:
-
Sismogrammi che appartengono ad un determinato profilo
-
Sismogrammi contenuti nei profili appartenenti ad un’area definita dall’utente
-
Sismogrammi presenti in un’area definita dall’utente (indipendentemente
dal profilo di appartenenza)
-
Singolo sismogramma
-
Per una determinata finestra temporale, dentro l'area geografica
scelta
per sezioni-film:
-
Visualizzazione dei film (immagini) con determinate caratteristiche
per bibliografia:
-
Studi e ricerche relativi ad un determinato profilo e/o una particolare
area
5. Software
e hardware
Il software che si utilizzerà per lo sviluppo del progetto è
l’ORDBMS (Object Relational Data-Base Management System) di Informix nella
versione IUS (Informix Universal Server); tale
prodotto ha le caratteristiche necessarie allo sviluppo del progetto:
-
Sistema per grandi moli di dati (circa 10 Gbyte in versione
non compressa)
-
Gestione di dati complessi (immagini, serie temporali, dati
bibliografici, pagine Web ecc.)
-
Accesso da Internet tramite protocollo WWW (World Wide Web)
I moduli necessari, oltre al motore ORDBMS,
sono:
-
Web (per l’accesso da Internet)
-
Spatial (per la gestione dei dati geografici)
-
Time series (per la gestione dei sismogrammi; potrebbe
non servire nel caso in cui si memorizzino i dati in formato compresso)
-
Text (per la gestione dei dati bibliografici)
-
Image (per la gestione dei dati raster)
Si deve inoltre considerare lo sviluppo di alcune applicazioni Java
per la gestione dell’accesso geografico.
-
Realizzazione del prototipo
Il prototipo prenderà in esame una campagna significativa (sottoinsieme
della banca-dati complessiva) realizzata dai geofisici dell’IRRS nell’Appennino
Settentrionale nell'87, comprendente 40 profili per un totale di circa
600 sismogrammi. Il prototipo servirà per studiare e mettere a punto
la struttura e le funzionalità della futura banca-dati DSS-ON-LINE.
La conclusione della fase prototipale del progetto è prevista
per Aprile 1998. Il prototipo permetterà di mettere a punto le funzionalità
dei prodotti di base scelti per la sua realizzazione. La piattaforma impiegata
è una Sun Ultra Spark con due processori da 200 MHz capace
di fornire alte prestazioni sia in fase realizzativa sia in fase di esercizio.