Oggi aziende ed individui sono immersi all’interno di ecosistemi digitali interconnessi nei quali vengono generate enormi quantità di dati eterogenei, i così detti Big Data, ad una velocità senza precedenti. In questo scenario, gli approcci e le tecnologie per Big Data hanno lo scopo di rendere computabili problemi che vedono coinvolti grandi volumi di dati fortemente eterogeni per formato e struttura, spesso generati in maniera real-time, che non possono essere affrontati con le tecnologie informatiche esistenti.
Scopo del laboratorio è lo studio di metodi, modelli, algoritmi, approcci e linguaggi per la gestione e l’analisi di Big Data eterogenei, quali testi, immagini, video, reti, dati strutturati, dati geo-referenziati, multi-mediali e multi-dimensionali, che variano nel tempo, al fine di favorire la realizzazione di Smart Technologies innovative. Tali tecnologie sono capaci di trasformare i Big Data in Smart Data ovvero, in dati arricchiti dalla semantica esplicita, modellabile e estraibile mediante tecnologie semantiche, e dalla semantica implicita, ottenibile mediante tecniche di machine learning, intelligenza artificiale e data analytics. Inoltre, la definizione di Smart Models con metodologie basate sulla Ricerca Operativa, e valutazioni di tipo matematico per lo studio delle caratteristiche quantitative e qualitative dei dati assumono rilevanza preponderante.
Le Smart technologies rendono più efficaci ed efficienti le attività di business analytics, di supporto alle decisioni, la gestione e fruizione di contenuti, migliorano le attività di marketing e la qualità dei prodotti/servizi offerti ai propri clienti/utenti. In generale, permettono di ottimizzare tutti gli aspetti applicativi presenti nei diversi processi di business e operativi delle organizzazioni in differenti settori applicativi.

Da Big Data a Smart Data.
Le tematiche di ricerca del laboratorio insistono su due macro aree: Mathematical and Smart Models e Smart Data. Nella prima ricadono i modelli e algoritmi per la pianificazione di reti di trasporto e logistica: metodi di ottimizzazione non differenziabile e non convessa; metodi e modelli per la risoluzione di problemi di classificazione supervisionata e/o semi-supervisionata e per l’elaborazione di immagini.
Nella seconda invece, i modelli, approcci e linguaggi per la gestione semantica di dati, sia in formato strutturato, sia non strutturato: approcci per l’estrazione di informazioni dal web e da documenti, anche in linguaggio naturale; linguaggi basati su tecniche di intelligenza artificiale e machine learning per la manipolazione e l’interrogazione di dati strutturati e non strutturati; modelli e le tecniche per la gestione e l’estrazione di contenuti da social media, analisi e mining di reti complesse.
I risultati scientifici e tecnologici del laboratorio trovano applicazione in diversi campi di applicazione tra i quali il la sanità elettronica, le telecomunicazioni, il commercio elettronico, l’internet delle cose, la sicurezza.