MENU

Analisi causale in Data Science

Il primo obiettivo scientifico del progetto concerne il disegno e analisi di studi sperimentali e osservazionali per l’analisi causale alla luce delle nuove sfide nella data science e nell’intelligenza artificiale. Per rispondere a quesiti di natura causale, lo strumento ideale è rappresentato dagli esperimenti randomizzati che non sempre possono essere condotti: nell’attuale era della Data Science, studi osservazionali, inclusi studi caratterizzati da dati ad elevata dimensione e strutture complesse, rappresentano una fonte preziosa per l’analisi causale, ma pongono anche nuove sfide e difficoltà.

 

ReDS ci permetterà di conseguire i seguenti obiettivi scientifici:

 

  • Sviluppo di metodi di inferenza Bayesiana parametrica e non parametrica per l’analisi causale in studi sperimentali e osservazionali con strutture di dati complesse e di elevata dimensione (es. network, longitudinali),
  • Sviluppo di metodi di conformal inference,
  • integrazione di algoritmi di apprendimento automatico predittivo con metodi statistici per effetti causali in contesti high-dimensional (es. elevato numero di confondenti),
  • sviluppo metodi per dati collezionati in presenza di (bipartite) interferenza, non-overlap o distribution shift,
  • sviluppo di strategie di identificazione e stima per dati panel e dati di serie storiche sfruttando ipotesi sui pattern (latenti) temporali e cross-sectional nei dati,
  • sviluppo di soluzioni per la quantificazione della probabilità delle cause e la causal discovery da utilizzarsi in ambito forense e genetico,
  • sviluppo di nuovi disegni per la sperimentazione on-line e nuove metodologie di analisi permetteranno di superare i limiti dei test A/B,
  • sviluppo metodi innovativi per l’analisi di studi sperimentali con complicazioni post-trattamento (noncompliance, attrition etc.).

 

Le performance e le conseguenze dell’utilizzo di algoritmi di apprendimento automatico saranno valutate attraverso lo sviluppo di protocolli basati su disegni sperimentali e metodi per la valutazione dei rischi e di inferenza causale. Ciò permetterà di valutare l’affidabilità e la generalizzabilità, identificando bias, problemi di (causal) fairness e trasparenza di algoritmi di apprendimento dai dati utilizzati come supporto alle decisioni in ambito socio-economico (es. selezione del personale) e medico (es. diagnostica per immagini).

Ultimo aggiornamento

02.11.2023

Cookie

I cookie di questo sito servono al suo corretto funzionamento e non raccolgono alcuna tua informazione personale. Se navighi su di esso accetti la loro presenza.  Maggiori informazioni