Analisi Statistica Multivariata - Modelli Statistici & R

CdL Triennale in Scienze Statistiche ed Economiche (SSE)

Autore/Autrice
Affiliazione

Ascari Roberto

Università degli Studi di Milano-Bicocca


Modelli Statistici & R è uno dei due moduli che formano l’insegnamento Analisi Statistica Multivariata. La pagina e-learning di riferimento per l’a.a. 2024/25 è raggiungibile al seguente link).

Esercizi aggiuntivi

Ulteriori esercizi relativi alla Parte 1 del corso possono essere trovati al seguente link.

Programma dettagliato del corso

Parte 1: introduzione ad R

  • Introduzione al linguaggio R: utilizzo di R come calcolatrice scientifica; introduzione agli oggetti e alle loro classi (vettori, booleani, matrici, data.frame, liste); strutture condizionali e cicli; funzioni.

  • Statistica descrittiva in R: rivisitazione dei principali argomenti di statistica descrittiva univariata e bivariata applicata a dataset, incluse rappresentazioni grafiche e loro personalizzazioni.

  • Calcolo delle probabilità in R: principali funzioni per lavorare con variabili casuali; metodi Monte Carlo per approssimare integrali e probabilità.

  • Inferenza statistica in R: studio delle proprietà degli stimatori mediante simulazioni; metodi numerici per l’analisi di verosimiglianza.

Parte 2: Modelli Statistici

  • Variabili casuali multidimensionali: funzione di densità e di ripartizione congiunte; marginalizzazione; momenti; vettore delle medie e matrice di varianze e covarianze; v.c. Normale multivariata e sue proprietà.

  • Specificazione del modello: fasi per la specificazione di un modello statistico; classificazione dei modelli.

  • Modello di regressione lineare semplice: assunzioni; interpretazione dei parametri; stima dei parametri (minimi quadrati e massima verosimiglianza); proprietà degli stimatori; teorema di Gauss-Markov; indice di determinazione lineare \(R^2\).

  • Verifica ed utilizzo del modello: verifiche di ipotesi sul valore di un singolo coefficiente; verifica di ipotesi sulla bontà del modello; utilizzo del modello per fare previsione puntuale ed intervallare.

  • Diagnostica del modello: metodi per valutare le assunzioni relative alla struttura del modello, agli errori e all’assenza di osservazioni inusuali.

  • Modello di regressione lineare multiplo: specificazione del modello in forma matriciale e sue assunzioni; interpretazione dei parametri; stima dei parametri (minimi quadrati e massima verosimiglianza); proprietà degli stimatori; teorema di Gauss-Markov; indice di determinazione multipla \(R^2\).

  • Variabili qualitative: inserimento di variabili qualitative nel modello mediante l’inserimento di dummy; interazioni.

  • Verifica di un sistema di ipotesi lineare: teoria generale e casi particolari.

  • Selezione del modello: contributo assoluto e relativo di una variabile esplicativa; indice di determinazione parziale (IDP); selezione criterion-based delle variabili esplicative tramite approccio backward, forward e stepwise; AIC e BIC.

Libri di testo

  • Albert, J. & M. Rizzo (2012). R by Example. Springer.

  • M. Grigoletto, F. Pauli, L. Ventura, Modello lineare, teoria e applicazioni con R. Giappichelli, 2017

  • J. Fox. Applied regression analysis and generalized linear models, third edition. Sage.

  • D. Piccolo, Statistica, Terza edizione, Il Mulino.