Logo xmLeges Marker

xmLeges- Marker è uno strumento capace di convertire in formato XML-NIR un testo normativo pre-esistente. E’ particolarmente utile per il recupero del cosiddetto pregresso o comunque di testi attuali redatti con i diffusi programmi di video scrittura.

Il riconoscimento della struttura formale di un atto garantisce un recupero straordinariamente veloce e sicuro dei testi, rendendo snella un'operazione che, se svolta in modo manuale, richiederebbe una notevole quantità di risorse umane e di tempo (in particolare per i documenti articolati). I possibili errori di marcatura (molto limitati se sono rispettate le regole di redazione) sono poi eliminabili attraverso un intervento manuale.

Caratteristiche

  • Tipi di provvedimento marcati: gli atti di tipo articolato, in ambito nazionale e regionale (leggi, decreti, regolamenti, ecc.);
  • Partizioni formali riconosciute: tutte quelle dell’atto principale (intestazione, formula iniziale, articolato - da libro ad articolo, comma numerato e non, lettera e numero -, formula finale, conclusione);
  • Elementi particolari: disposizioni di modifica, testi fra virgolette, decorazione delle partizioni nei testi unici, note e avvertenze a pie' di articolo;
  • Altre operazioni: controllo di sequenza delle partizioni numerate, contenitore specifico (processing instruction) per i blocchi di testo non collocabili nella struttura, identificativo univoco degli elementi, attributi obbligatori;

Limiti attuali: commi non numerati separati da una riga vuota, rubriche nella riga successiva alla numerazione della partizione.

Estensioni Previste: provvedimenti non articolati, marcatura degli allegati.

La procedura prevede una serie di parametri per adattarsi alle varie esigenze:

  • Sorgente dei dati: schermo, disco locale, risorsa di rete;
  • Formato del documento: TXT, HTML
  • Tipo di provvedimento: legge, decreto-legge, decreto legislativo, ecc.
  • Tipo di comma: numerato, non numerato
  • Tipo di DTD: completo, base, flessibile
  • Tipo di uscita: tag inseriti nel documento, lista dei tag con posizione
  • destinazione del risultato: browser, disco locale
  • Altri: set di caratteri, sequenza delle numerazioni, livello dei messaggi, ecc.

Il parser di struttura è utilizzabile attraverso:

  • servizio Web di marcatura di documenti: accessibile alle amministrazioni aderenti, attraverso un modulo guida nell’Area Riservata del Portale NiR. Il modulo raccoglie le informazioni sui dati e sulle opzioni di elaborazione, il server attiva il parser e spedisce alla stazione il risultato;
  • modulo integrato nel NirEditor: dall’ambiente di redazione dei testi normativi in XML, il parser è richiamato direttamente all'apertura di un documento;
  • servizio di download: dall’Area Riservata del Portale NiR da parte delle amministrazioni aderenti, per l’utilizzo sui propri sistemi, sia personali che centrali. Sono disponibili le versioni per MS Windows e per Linux.
L'architettura del marcatore automatico (scritto in C/C++), che lo rende molto efficiente anche su testi con un elevato numero di articoli, è così organizzata:

  • per l'articolato è utilizzato un automa non deterministico a stati finiti (NFA), dove gli stati sono rappresentati dagli elementi della DTD-NIR e le transizioni tra gli stati sono determinate dalle regole formali di suddivisione in partizioni. Per questa parte è utilizzato il FLEX;
  • per le altre suddivisioni (intestazione, formule iniziali e finali, preambolo, ecc.) è invece utilizzato un automa probabilistico (HMM: Hidden Markov Model), dove i nodi del modello sono rappresentati da parole e gli stati associati a ciascun nodo corrispondono ai sottoelementi delle suddivisioni.

Ittig/CNR Progetto coordinato da ITTIG/CNR per facilitare l'adozione degli standard di Norme In Rete.Norme In Rete

Sottoscrivi il feed rss di xmLeges.org FEED RSS