Information Retrieval del testo dei diari di scavo: un'applicazione Internet attiva

Nella fase iniziale del Progetto Caere il modello di codifica realizzato per i diari di scavo della Vigna Parrocchiale è stato fin da subito sottoposto a test specifici, sia per verificare la congruità della struttura progettata, sia per ottenere indicazioni sulle possibilità di interrogazione dei testi codificati. Successivamente si è progettato un sistema d'interrogazione adeguato alla complessità strutturale dei documenti codificati, che permettesse di sfruttare pienamente le potenzialità del linguaggio di marcatura dei testi, al fine di realizzare un'applicazione per l'interpretazione e la ricerca dei documenti distribuibile in rete. Per realizzare un sistema d'interrogazione "esportabile" verso Internet si è deciso di adottare la tecnologia ASP e il linguaggio VBSCRIPT.

La creazione di un sito Internet statico, costituito da sole pagine in HTML è cosa piuttosto semplice. Non altrettanto può dirsi della realizzazione di siti attivi, dove le pagine inviate all'utente sono il risultato di scelte univoche e di selezioni temporanee.

Grazie all'uso di VBSCRIPT e di certe sue funzioni definite Regular Expressions, si è sviluppata un'applicazione ASP in grado di gestire agevolmente la complessità delle relazioni tra gli elementi del testo e di permettere l'interazione di questi con oggetti gestiti da altri programmi, come quelli impiegati per realizzare la cartografia digitale dello scavo. L'applicazione sviluppata per ASP non solo ha permesso di integrare e interrogare dati provenienti da ambienti diversi (immagini, grafici, testi e tabelle), ma ha rappresentato il mezzo per perseguire l'obiettivo della diffusione complessiva dell'intero progetto, soddisfacendo così uno dei primari requisiti dell'intero Progetto Caere.
L'applicazione sviluppata è un sito Internet attivo, capace di gestire il testo dei diari di scavo codificato in XML in funzione delle scelte operate dall'utente su alcuni pannelli di opzioni. Il testo può essere interrogato in base a discriminanti multiple, di carattere cronologico, topografico, terminologico e anche analitico. A tal fine, è stato necessario affiancare ai testi codificati un database relazionale (Microsoft Access) dei termini equivalenti impiegati nel testo, per indicare determinate strutture o aree dello scavo, e delle loro relazioni topografiche e cronologiche.