Attività di ricerca
Le attività di ricerca dell'Istituto coprono i principali aspetti della ricerca metodologica ed applicativa nel settore dell'Informatica e sono organizzate nelle seguenti linee di ricerca.
(A) Gestione e mining di grandi flussi di dati e rappresentazione e scoperta di conoscenza
Obiettivo della linea di ricerca è lo sviluppo di strumenti avanzati basati sulla combinazione di algoritmi, linguaggi, metodologie e tecniche innovative di Basi di Dati, Data Mining e rappresentazione della conoscenza per (i) gestire grandi quantità di dati sia tradizionali sia su WEB, che sotto forma di servizi (ii) scoprire contenuti "utili" memorizzati nei documenti, servizi e tracce di utilizzo, (iii) produrre nuove conoscenze e servizi.
Le attività di ricerca sono (1) lo studio e lo sviluppo di metodi di mining per dati complessi, quali grafi, alberi, sequenze, e ad alta dimensionalità (genomici, testuali), provenienti da contesti applicativi emergenti e predominanti, (2) lo studio di metodi avanzati per Sistemi Evoluti per basi di Dati, quali tecniche per l'aggregazione e sommarizzazione di dati, analisi e gestione di flussi continui di dati (data stream), gestione e interrogazione di dati XML, integrazione di dati. Tali attività sono svolte in collaborazione con gruppi di ricerca nazionali e internazionali e con aziende coinvolte ed interessate nel settore della gestione della conoscenza.
Attività specifiche riguardano la definizione di algoritmi per classificazione e identificazione di oulier in dati streaming e RFID; studio di metodi di ottimizzazione non lineare per problemi di ricerca di punti di minimo nel campo della logistica,orientati alla classificazione matematica;clustering e classificazione di documenti HTML e dati di traiettorie di oggetti in movimento; co-clustering information-theoretic per dati multi-relazionali e ad alta dimensionalità,e basato su tecniche greedy per la scoperta di complessi in reti di interazione proteina-proteina; integrazione di tecniche in una piattaforma open-source per l'analisi di log di processi basata su clustering strutturale delle tracce contenute nei log,estensione del clustering delle esecuzioni di processi che sfrutta informazioni di prestazione; compressione di dati XML,valutazione di query nel dominio compresso, integrazione di sorgenti eterogenee; tecniche di segmentazione e record matching.
(B) Sistemi ad agenti cognitivi per la robotica e fruizione intelligente di informazioni sensoriali e di servizi avanzati
L'obiettivo principale della linea di ricerca è quello di fornire strumenti e metodologie per la definizione di agenti cognitivi autonomi per la realizzazione di servizi innovativi e intelligenti quali: sistemi software che percepiscono, comprendono, imparano, ed agiscono autonomamente, sistemi di apprendimento attraverso l'interazione con l'utente e la comprensione delle sue azioni, sistemi di supporto all'analisi e alle decisioni.
Le attività sono: (1) Ideazione e sperimentazione di architetture software basate su paradigmi cognitivi; modelli gerarchici basati su reti neurali e reti bayesiane per la rappresentazione della conoscenza a differenti livelli di astrazione; (2) Applicazioni di robotica antropomorfica, sistemi di interpretazione automatica del linguaggio, di analisi delle espressioni facciali, sistemi ad agenti e metodologie di progettazione; (3) Elaborazione di flussi di informazioni sensoriali da reti wireless per il monitoraggio di scene complesse, estrazione di caratteristiche di alto livello da immagini e video.
Le attività della linea di ricerca s'inquadrano nell'ambito dell'ingegneria della conoscenza, sviluppando dal punto di vista degli agenti cognitivi le problematiche tipiche del data mining, delle ontologie, del web semantico, dei sistemi autonomi intelligenti. Inoltre azioni significative sono state intraprese nell'applicazione delle metodologie studiate in differenti domini applicativi: beni culturali, sicurezza, sistemi informativi geografici, controllo e monitoraggio ambientale, applicazioni nell'agricoltura, sistemi a supporto di utenza debole, e-learning, applicazioni biomedicali.
Attività specifiche riguardano lo studio e sviluppo di strumenti teorici e metodologici a supporto dei sistemi autonomi intelligenti, mediante tecniche di machine learning, reti neurali innovative, mappe autorganizzanti, reti bayesiane, reti bayesiane dinamiche, tecniche basate sulla latent semantic analysis, intelligenza artificiale, reti semantiche, tecniche geometriche di rappresentazione della conoscenza, sistemi multi-agente, analisi ed elaborazione delle immagini e video, reti di sensori wireless, elaborazione distribuita.
(C) Servizi intelligenti per griglie computazionali e sistemi peer-to-peer
L'obiettivo della linea di ricerca è indagare le metodologie, le tecniche e gli algoritmi necessari per far evolvere le attuali Griglie computazionali verso le Griglie intelligenti dove l'inclusione di servizi di conoscenza e dei sistemi P2P consentirà di disporre di infrastrutture orientate ai servizi che faciliteranno l'interoperabilità fra utenti, applicazioni e risorse offrendo servizi scalabili on-demand per supportare innovazione, lavoro cooperativo, problem solving e supporto alle decisioni.
Le attività sono: (1) studio e realizzazione di un sistema robusto ed efficiente per la gestione e l'esecuzione di workflow dinamici ed adattivi con l'utilizzo di algoritmi decentralizzati e auto-organizzanti di tipo P2P per la ricerca e la scoperta delle risorse da comporre. (2) studio di modelli e algoritmi per la costruzione di sistemi informativi su Griglia basati su sistemi multi-agente cooperanti attraverso reti sociali (small worlds, scale-free, etc.) in ambiente P2P; (3) progetto di ambienti intelligenti di Problem Solving (PSE) per Griglia basati su ontologie e metadati per la modellazione semantica di Grid services specializzati per la soluzione di problemi di Geoprocessing; (4) sviluppo di algoritmi ad alte prestazioni e distribuiti per il mining dei dati su griglia e sistemi P2P basati su paradigmi innovativi come le tecniche di ensemble e quelle di intelligenza collettiva per supportare la scoperta di pattern in repository di dati esistenti e/o generati dal funzionamento della Griglia; (5) sviluppo di algoritmi per l'interrogazione e il mining di dati streaming su Griglie e sistemi P2P
Attività specifiche riguardano: studio e realizzazione preliminare di un sistema per la gestione di workflow autonomici in grado di fornire una piattaforma aperta per la composizione dinamica e l'enactment di servizi capaci di evolversi e adattarsi ai cambiamenti dell'ambiente; utilizzo di tecniche di intelligenza collettiva e di computazione evolutiva per la progettazione di griglie auto-organizzanti capaci di garantire in maniera automatica la negoziazione di contratti riguardanti il livello del servizio (SLA) basandosi su parametri di qualità del servizio (QoS) specificati dagli utenti; sviluppo di un'architettura costituita da Grid Service e workflow per il supporto di nuovi algoritmi distribuiti di data mining su dati streaming evolventi con tecniche di cooperazione coevolutiva e la teoria Frattale; studio e realizzazione di un sistema distribuito data-driven per la diagnosi di comportamenti anomali che influenzano la produttività di un terminale di transhipment.
(D) Griglie computazionali pervasive per il calcolo scientifico ad alte prestazioni
Le finalità della linea di ricerca è lo sviluppo di metodologie, algoritmi e strumenti software per la realizzazione di Griglie Computazionali e sistemi cloud che forniscano servizi di calcolo ad alte prestazioni per applicazioni tecnico-scientifiche. In particolare la linea di ricerca intende realizzare algoritmi e componenti software ad alte prestazioni, adeguati all'integrazione in architetture software per griglie computazionali, con particolare riferimento a settori applicativi del Calcolo Tecnico-Scientifico, quali la simulazione di motori a basso impatto ambientale, la simulazione di flussi di interesse aerodinamico e ambientale e l'elaborazione di immagini. I settori applicativi sono stati individuati in virtù di collaborazioni e progetti congiunti con altre istituzioni scientifiche nazionali ed internazionali.
Le attività principali possono così essere sintetizzati: (1) Progettazione e sviluppo di algoritmi e software ad alte prestazioni per la simulazione computazionale e l'elaborazione di immagini; o(2) Progettazione e sviluppo di middleware per Griglie Computazionali, con particolare riferimento a problematiche di accesso e fruizione delle risorse, allocazione e comunicazione di processi concorrenti in ambienti distribuiti eterogenei; (3) Sviluppo di una piattaforma Grid per la Modellistica dei Motori a Combustione Interna, in collaborazione con il Dipartimento di Energia e Trasporti (Commissione di Studio per la Modellistica dei Motori a Combustione Interna).
(E) Sistemi di realtà virtuale altamente immersivi ed algoritmi evoluti per l'analisi di immagini
Obiettivo della linea di ricerca è lo studio e realizzazione di ambienti virtuali evoluti, capaci di fornire elevato grado di immersività ed interazione multimodale, e con caratteristiche di alta pervasività. In tale contesto, ci si propone di sviluppare nuovi modelli architetturali per ambienti di realtà virtuale ad alte prestazioni, la progettazione e realizzazione di middleware adatti allo sviluppo di applicazioni di pervasive computing. La linea di ricerca si interessa anche dello studio e implementazione di algoritmi di elaborazione di sequenze video ed immagini digitali. Dal punto di vista applicativo, attualmente uno dei settori di maggiore interesse per la commessa è quello medicale. Pertanto, molte delle attività trovano una loro finalizzazione in tale ambito, dalla realizzazione di ambienti evoluti a supporto della diagnostica per immagini ai sistemi di pervasive-healthcare.
Le attività principali riguardano: (1) la definizione di modelli architetturali adatti ad una rapida prototipazione di ambienti di pervasive computing, attraverso la identificazione e specifica di Meta-Componenti adatti alle diverse tipologie di applicazioni; (2) lo studio di tecniche ed algoritmi per l'acquisizione dati ed il reasoning su contesti incerti per applicazioni di Pervasive Healthcare e di e-health; - lo studio e la definizione di sottoattributi dell'usabilità per interfacce atte alla la manipolazione di oggetti 3D e definizione di metriche di misura, con riferimento all'approccio dello Human-Centered Computing; (3) lo studio delle problematiche di gestione semantica delle collisioni nei sistemi RFID ad elevata pervasività ed alla eventuale integrazione con reti di sensori wireless; (4) lo studio e l'implementazione di algoritmi paralleli per il direct volume rendering per sistemi di elaborazione basati su chip MultiCore; (5) costruzione di ontologie in ambito medico per il supporto alla diagnostica per immagini; (5) sviluppo di algoritmi per il trattamento di sequenze di immagini in real-time.
(F) Gestione ed integrazione di contenuti in media multidimensionali su piattaforme orientate ai servizi
Obiettivi della linea di ricerca sono lo sviluppo di moduli e strumenti per la rappresentazione dei contenuti di video ed immagini attraverso schemi di rappresentazione condivisibili e la definizione di strumenti, operatori e metriche per il retrieval assistito per contenuto di immagini e sequenze video.
Le attività di ricerca riguardano: (1) lo sviluppo di una metodologia per la descrizione dei processi di manipolazione e montaggio di documenti multidimensionali attraverso formalismi di annotazione semantica e l'utilizzo di una piattaforma CAE per l'authoring ipermediale - la metodologia è di tipo iterativa incrementale in modo tale da integrare sulla piattaforma CAE algoritmi, descrizioni, e metriche di comparazione man mano che queste sono sviluppate; (2) annotazione semiautomatica di oggetti video secondo lo standard MPEG-7; (3) realizzazione di un'interfaccia di programmazione (API) per l'accesso e manipolazione di descrittori di contenuti in formato MPEG-7; (4) sviluppo di interfacce grafiche per la navigazione di video files tramite insiemi di meta-dati strutturati che ne descrivono il contenuto visuale e semantico.
(G) Metodi e strumenti di Calcolo Evolutivo e loro applicazione a modellazione e ottimizzazione in Sistemi Complessi
Gli obiettivi della linea di ricerca sono essenzialmente due. Il primo, e più immediato, è di progettare ed implementare, in versione tanto sequenziale quanto distribuita, un insieme di tools che dopo una opportuna azione di "tuning", fatta automaticamente o manualmente per settare un ridotto numero di parametri, possano essere facilmente utilizzati per fornire soluzioni sub-ottime per l'elaborazione di dati in applicazioni di ottimizzazione, data mining, previsione, etc. Il secondo obiettivo, meno immediato perchè prevede uno studio approfondito delle principali caratteristiche dei sistemi pervasivi adattativi, si propone la definizione di specifiche euristiche evolutive e relativi operatori e la loro implementazione in algoritmi. Questi ultimi non solo devono fornire soluzioni sub-ottime per sistemi di notevole complessità come quelli pervasivi, ma devono essere in grado di modificare le soluzioni fornite in presenza di eventuali e non prevedibili modifiche al sistema stesso.
Le attività di ricerca riguardano: (1) lo sviluppo di tecniche di machine learning basate su Algoritmi Evolutivi per l'elaborazione dei dati per ottimizzazione, previsione e rule discovery; (2) lo sviluppo, la sperimentazione e la valutazione di versioni parallele e distribuite delle tecniche su indicate mediante problemi test noti in letteratura; (3) il reperimento di dati reali, provenienti dal mondo della PMI o da altri ambiti, da trattare con i suddetti tool; (4) lo studio, nell'ambito del Calcolo Evolutivo, di nuovi modelli e nuovi operatori per affrontare in maniera efficace ed efficiente problematiche di pervasive adaptation; (5) l'implementazione, la sperimentazione e la valutazione di tali nuovi algoritmi mediante problemi test; (6) il reperimento di dati relativi a problemi reali nell'ambito dei sistemi pervasivi da affrontare con le metodiche su indicate.
(H) Analisi intelligente di dati per la gestione pervasiva della sicurezza
La linea di ricerca è finalizzata allo studio ed allo sviluppo di metodi, tecniche, modelli e tecnologie per la definizione di politiche di comprehensive security. Essa si propone in particolare di studiare ed integrare varie metodologie di analisi dei dati, e allo studio di problematiche relative alla realizzazione di infrastrutture software che permettano di definire criteri adatti ad applicazioni di Homeland Security, safety nelle infrastrutture pubbliche, sicurezza informatica e protezione di dati sensibili garantendone l'integrità, la riservatezza e la disponibilità.
Le attività principali sono: (1) Analisi di dati testuali e/o complessi, con l'applicazione a problematiche di homeland Security e sicurezza informatica; (2) Outlier detection; (3) privacy-preserving OLAP, (3) alcune applicazioni significative delle tecniche di data mining nel campo della sicurezza, in particolare l'analisi di dati relativi alla frode fiscale ( in collaborazione con l'Agenzia delle Entrate) e la gestione sicura del porto di Gioia Tauro (all'interno del Distretto Tecnologico della Logistica).
(I) Modelli e tecniche di machine learning per la bio-informatica
Obiettivi della linea di ricerca sono utilizzare tecniche di intelligenza artificiale e di machine learning per l'interpretazione dei dati riguardanti sistemi biologici e lo sviluppo di applicazioni intelligenti su architetture distribuite ad alte prestazioni per l'analisi, la gestione e la simulazione di dati biologici e molecolari.
Le attività di ricerca riguardano: (1) applicazione di metodi di machine learning per la ricerca di pattern e motivi funzionali in sequenze genomiche e in strutture molecolari, il supporto al processo di identificazione di nuovi farmaci, la visualizzazione ed esplorazione di vaste collezioni di dati molecolari; (2) studio e analisi di metodologie per la valutazione di software per analisi di immagini di microarray e di metodologie di indicizzazione di immagini biomedicali basata sul contenuto; (3) sviluppo di metodologie per la creazione di spazi concettuali automaticamente indotti dai dati al fine di analizzare grandi quantità di informazioni eterogenee riguardanti l'ambito biomedico e bioinformatico; (4) modellazione e simulazione del dominio di interesse e del comportamento dei sistemi biologici attraverso tecniche di intelligenza artificiale (ontologie, sistemi multiagente).
(J) Algoritmi ed architetture evoluti per la bioinformatica
Obiettivo della linea di ricerca è lo studio e sviluppo di architetture innovative e sicure, database biologici, modelli matematici e moduli software per l'analisi dei dati genomici, proteomici e transcrittomici.
Le attività di ricerca sono: (1) progettazione e sviluppo di algoritmi per: l'analisi di dati di espressione genica di microarray, per l'individuazione di sottoinsiemi di geni regolatori che determinano la discriminazione tra stati differenti (sano/malato, risposta ai farmaci,...), la risoluzione di problemi differenziali provenienti da modelli di cinetica bio-chimica per il metabolismo energetico di cellule umane; (2) definizione di un Modello Architetturale Integrato in grado di far fronte al meglio alle esigenze dello scienziato di scienze della vita alle diverse scale di interesse, dal processore locale con componenti paralleli, al livello globale della griglia inter-organizzazioni; (3) individuazione dei livelli componenti con definizione delle specifiche computazionali di ciascuno di essi e delle relative interfacce inter-livello con particolare riferimento alla gestione della concorrenza alle differenti scale, delle istruzioni ai programmi e dalle microgriglie alle griglie globali, con possibilità di utilizzo ai livelli più alti della gerarchia approcci basati su Peer-to-Peer (P2P) e Service Oriented Architecture (SOA); (4) definizione di un modello di programmazione integrato multilivello basato su di un approccio di tipo funzionale e sperimentazione e valutazione della soluzione integrata multilivello individuata, confrontando il modello funzionale, FP Like, CHIARA, in via di completamento presso l'ICAR, con quello Haskell e con quello Microsoft F#.
(K) Progettazione e sviluppo di soft sensors per forecasting spaziale di parametri ambientali per monitoraggio non invasivo di beni architettonici.
I soft sensors per il monitoraggio non invasivo sono basati su modelli neurali di apprendimento in grado di sintetizzare il modello dei dati e sostituire i sensori reali dopo un opportuno periodo di apprendimento.
Inoltre le attività in questa area riguardano la realizzazione di una piattaforma in grado di veicolare le informazioni e gestire le interazioni tra gli attori del contesto Culturale e Territoriale al fine di consentire uno scambio di conoscenze.