Research project

MATRICES - Semantic Annotation over Heterogeneous Historical Documents (DUS.AD012.130)

Thematic area

Social sciences and humanities, cultural heritage

Project area

Popolazione, società, scienza, cultura e globalizzazione (DUS.AD012)

Structure responsible for the research project

Institute for research on population and social policies (IRPPS)

Project manager

FERNANDO FERRI
Phone number: 06 492724 216
Email: fernando.ferri@irpps.cnr.it

Abstract

MATRICES è un progetto interdisciplinare al quale partecipano due dipartimenti dell'Università Roma Tre e un istituto del CNR. Il Dipartimento di Ingegneria dell'Università Roma Tre contribuisce al progetto con le proprie competenze di ingegneria informatica, in particolare intelligenza artificiale e gestione dei dati; il Dipartimento di Studi Umanistici con le proprie competenze in paleografia, archivistica e storia urbana. L'Istituto di Ricerche sulla Popolazione e le Politiche Sociali del CNR contribuisce con competenze relative alla facilitazione dell'accesso all'informazione. Il progetto si avvale anche della collaborazione dell'Archivio di Stato di Roma, che fornirà il materiale archivistico su cui verrà definito lo studio di caso per la valutazione sperimentale delle soluzioni sviluppate nel progetto.

Goals

Il progetto MATRICES ha l'obiettivo specifico di sviluppare un workflow innovativo per la trascrizione e l'annotazione semantica di fonti archivistiche storiche digitalizzate, al fine di facilitare la consultazione su larga scala. Per trascrizione si intende il processo di estrazione del testo dalle immagini digitalizzate, in modo ad esempio, che risulti ricercabile e accessibile. Per annotazione semantica si intende l'identificazione automatica nel testo e nelle immagini di elementi semantici di interesse dell'utente, sotto forma principalmente di entità (come località, vie, edifici, istituzioni e persone) e specifiche relazioni (ad esempio il luogo di nascita di una persona). Trascrizione e annotazione semantica sono infatti alla base del processo di trasformazione e conservazione digitale di un archivio cartaceo e rappresentano il naturale passo successivo alla sua digitalizzazione.

Start date of activity

15/04/2021

Keywords

Annotazione Semantica, Digitalizzazione, Machine Learning

Last update: 16/07/2024