Information Retrieval del testo dei diari di scavo: un'applicazione
Internet attiva
Nella fase iniziale del Progetto Caere il modello di codifica
realizzato per i diari di scavo della Vigna Parrocchiale è
stato fin da subito sottoposto a test specifici, sia per verificare
la congruità della struttura progettata, sia per ottenere
indicazioni sulle possibilità di interrogazione dei testi
codificati. Successivamente si è progettato un sistema
d'interrogazione adeguato alla complessità strutturale
dei documenti codificati, che permettesse di sfruttare pienamente
le potenzialità del linguaggio di marcatura dei testi,
al fine di realizzare un'applicazione per l'interpretazione e
la ricerca dei documenti distribuibile in rete. Per realizzare
un sistema d'interrogazione "esportabile" verso Internet
si è deciso di adottare la tecnologia ASP e il linguaggio
VBSCRIPT.
La creazione di un sito Internet statico, costituito da sole pagine
in HTML è cosa piuttosto semplice. Non altrettanto può
dirsi della realizzazione di siti attivi, dove le pagine inviate
all'utente sono il risultato di scelte univoche e di selezioni
temporanee.
Grazie all'uso di VBSCRIPT e di certe sue funzioni definite Regular
Expressions, si è sviluppata un'applicazione ASP in grado
di gestire agevolmente la complessità delle relazioni tra
gli elementi del testo e di permettere l'interazione di questi
con oggetti gestiti da altri programmi, come quelli impiegati
per realizzare la cartografia digitale dello scavo. L'applicazione
sviluppata per ASP non solo ha permesso di integrare e interrogare
dati provenienti da ambienti diversi (immagini, grafici, testi
e tabelle), ma ha rappresentato il mezzo per perseguire l'obiettivo
della diffusione complessiva dell'intero progetto, soddisfacendo
così uno dei primari requisiti dell'intero Progetto Caere.
L'applicazione sviluppata è un sito Internet attivo, capace
di gestire il testo dei diari di scavo codificato in XML in funzione
delle scelte operate dall'utente su alcuni pannelli di opzioni.
Il testo può essere interrogato in base a discriminanti
multiple, di carattere cronologico, topografico, terminologico
e anche analitico. A tal fine, è stato necessario affiancare
ai testi codificati un database relazionale (Microsoft Access)
dei termini equivalenti impiegati nel testo, per indicare determinate
strutture o aree dello scavo, e delle loro relazioni topografiche
e cronologiche.