Curriculum Data Science
Il paradigma Big Data è destinato a diventare uno dei fattori chiave dell'innovazione e della competizione a livello globale.
Con il termine Data Science si identifica un campo di studi interdisciplinare, che ha per oggetto i metodi scientifici, le procedure e i sistemi per estrarre conoscenza, comprensione e potenziali previsioni da grandi quantità di dati, sia strutturati che non, nel rispetto della privacy degli individui. Allo scopo, la Data Science impiega teorie e metodi provenienti da vari campi dell'Informatica, della Statistica e della Matematica, ed in particolare da aree quali: Algoritmi, Classificazione, Data Mining, Database, Machine Learning, Metodi Numerici, Ottimizzazione, Sicurezza.
La Data Science fornisce i presupposti scientifici per attività come:
- individuare e campionare sorgenti di dati;
- organizzare e gestire in maniera efficiente grandi quantità di dati, tenendo conto dei vincoli imposti da software, hardware e banda di comunicazione;
- costruire modelli matematici per analizzare regolarità e pattern nascosti nei dati, o anche apprendere da essi;
- garantire che raccolta, trasmissione e analisi dei dati siano condotte senza rischi per la privacy;
- creare visualizzazioni che aiutino la comprensione dei dati;
- presentare e comunicare la conoscenza ricavata dai dati.
OBIETTIVI FORMATIVI
Il Curriculum Data Science mira a fornire una solida preparazione di base sulle tecniche, e i sottostanti principi teorici, che rendono possibile l'analisi dei dati. A tale scopo, nel curriculum vengono combinate e applicate competenze provenienti da diverse aree disciplinari attive nell'Ateneo, principalmente dalle aree di Informatica, Ingegneria dell’Informazione e Statistica. In particolare, vengono offerti insegnamenti incentrati sui seguenti aspetti:
- tecniche algoritmiche per l’analisi dei dati, con particolare attenzione a strutture per grandi insiemi di dati e ai relativi aspetti teorici e pratici;
- algoritmi di data mining per la ricerca di regolarità e pattern nei dati, e strutture dati necessarie alla loro organizzazione;
- metodi crittografici per la protezione della privacy degli individui, durante tutte le fasi di raccolta, trasmissione e analisi dei dati;
- algoritmi di base e avanzati per l’apprendimento statistico, le basi della teoria dell’apprendimento computazionale, il progetto di soluzioni a problemi reali;
- tecniche di programmazione parallela e ad alte prestazioni;
- basi statistiche della regressione, classificazione e inferenza bayesiana, che sono alla base dell'apprendimento automatico;
- metodi numerici per acquisire quelle competenze del computer aided geometric design utili all'implementazione e all'uso di algoritmi specifici per la visualizzazione di dati;
- metodi di ottimizzazione, necessari per condurre efficacemente l'analisi dei dati in presenza di vincoli sulle risorse hardware e software.
SBOCCHI PROFESSIONALI PER IL LAUREATO IN DATA SCIENCE
Nella società dell'informazione, quella di Data Scientist sta emergendo naturalmente come una delle professioni più ricercate. Secondo uno studio spesso citato (McKinsey Global Institute, 2011), la domanda di data scientists nel 2018 potrebbe eccedere di 1,5 milioni la disponibilità effettiva di tali figure.
Il laureato magistrale in Data Science sarà in possesso delle competenze per rivolgersi direttamente: ad aziende che, sul territorio o in ambito globale, operano nel campo dell'analisi dei dati di mercato e della "business intelligence"; ad istituzioni che per statuto trattano grandi quantità di dati (medici, finanziari, di censo, etc.); a imprese piccole o grandi che per la gestione delle loro attività si affidano a sistemi informativi complessi.
Alcuni esempi di profili professionali emergenti che rientrano in questi ambiti sono i seguenti:
- Data Management Professional, si occupa della raccolta e gestione dei dati e della infrastruttura che supporta queste attività, in maniera simile a quanto fanno gli amministratori dei database tradizionali;
- Data Engineer, si occupa della progettazione e dello sviluppo dell'infrastruttura;
- Business Analyst, un ruolo strettamente legato all'analisi - sia in senso tradizionale che Big Data - e presentazione dei dati, inclusa la generazione di rapporti e visualizzazioni, e tutto ciò che viene generalmente indicato come "business intelligence";
- Machine Learning Analyst, si occupa di realizzare e applicare i tool di predizione e correlazione che estraggono conoscenza, regole e previsioni dai dati;
- Data-oriented Professional, chi, più ad alto livello, per un dato problema identifica i dati utili, sceglie gli strumenti di analisi appropriati e seleziona dall'informazione estratta ciò che può risultare utile alla soluzione del problema stesso.
Il laureato magistrale in Informatica può iscriversi all'Albo degli Ingegneri dell’Informazione (Albo professionale – Sezione A degli Ingegneri – Settore dell’Informazione) e accedere ai dottorati di ricerca in Informatica.