Statistica I

Esercizi 6: analisi della varianza

Author
Affiliation

Tommaso Rigon

Università degli Studi di Milano-Bicocca

Homepage

Soluzione di alcuni esercizi

Le seguenti soluzioni sono state gentilmente fornite dal tutor di Statistica I dell’A.A. 2021/2022, Alex Alborghetti, che ringrazio. Le soluzioni sono state quindi riviste dal docente, che si assume le responsabilità di eventuali sviste ed errori.

Esercizio A

È noto, dalla scomposizione della devianza totale, che vale la seguente relazione:

\mathcal{D}^2 = \underbrace{\sum_{j = 1}^k \sum_{i = 1}^{n_j}(x_{ij}-\bar{x}_j)^2}_{\mathcal{D}^2_\text{en}} + \underbrace{\sum_{j=1}^kn_j(\bar{x}_j-\bar{x})^2}_{\mathcal{D}^2_\text{tr}},

Evidentemente, dividendo per n entrambi i membri, la scomposizione risulta valida anche per le varianze. Calcoliamo quindi le due varianze e sommiamole. Abbiamo già a disposizione le varianze di ciascun gruppo, dunque si può dimostrare che:

\sigma^2_{\text{en}} = \frac{1}{n} \sum_{j=1}^k n_j\sigma_j^2 = 2679.4.

Per quanto riguarda la varianza tra i gruppi, calcoliamo anzitutto la media, si dimostri che vale la seguente relazione:

\bar{x} = \frac{1}{n} \sum_{j=1}^k n_j\bar{x}_j= 259.7.

Allora, la varianza tra i gruppi vale:

\sigma^2_{\text{tr}} = \frac{1}{n} \sum_{j=1}^kn_j(\bar{x}_j-\bar{x})^2 = 2209.0.

Pertanto, la varianza totale sarà pari a \sigma^2 = 2679.4 + 2209.0 = 4888.4. I risultati sono arrotondati al primo decimale.

Per calcolare la “correlazione” tra dieta e incremento del peso utilizziamo l’indice \eta^2, definito come:

\eta^2 = 1 - \frac{\text{devianza entro i gruppi}}{\text{devianza totale}}.

Si può dimostrare (lo si faccia per esercizio) che tale indice è equivalente al complemento ad uno del rapporto tra varianza entro i gruppi e varianza totale. Allora, con i nostri dati:

\eta^2 = 1 - 2679.4/(2679.4+2209.0) = 0.45.

C’è quindi una moderata “correlazione” tra le due variabili. Il risultato è stato arrotondato a due decimali.

Esercizio B

Le medie e le varianze dei tempi di reazione di ciascun gruppo sono state calcolate e vengono riassunte nella tabella seguente:

Gruppo \bar{x}_j \sigma^2_j
20-40 100.4 1884.2
40-60 74.8 991.4
60+ 73 308.7

(i risultati sono arrotondati al primo decimale).

La varianza tra i gruppi è interpretabile come la varianza spiegata dalle medie. La media totale è pari a \bar{x} = 84.2, allora:

\sigma^2_\text{tr} = \frac{1}{n} \sum_{j=1}^kn_j(\bar{x}_j-\bar{x})^2 = 163.9.

Considerato che a varianza totale è pari a \sigma^2 = (1/n) \sum_{i=1}^n(x_i-\bar{x})^2 = 1341.102, la proporzione di varianza spiegata è circa del 12.2\%.

Esercizio C

Per comodità, vengono calcolate e riassunte nella seguente tabella alcune quantità utili:

Gruppo \bar{x}_j \sigma^2_j
A 0.35 0.03
B 3.07 0.14
C 1.76 0.22

i risultati sono stati arrotondati a due decimali. La dipendenza in media si misura tramite l’indice \eta, cioè il complemento ad uno del rapporto tra la varianza entro i gruppi e la varianza totale. La varianza entro i gruppi può essere calcolata come segue:

\sigma^2_\text{en} = \frac{1}{n} \sum_{j=1}^k n_j\sigma_j^2 = 0.15.

Per il calcolo della varianza totale, utilizziamo la definizione: \sigma^2 = (1/n) \sum_{i=1}^n(x_i-\bar{x})^2 = 1.01, con \bar{x} = 1.65. I risultati sono arrotondati a due decimali. In conclusione, possiamo dire che i tre antidoti non sembrano avere la stessa efficacia, dato che:

\eta^2 = 1 - 0.15/1.01 = 0.85.