Statistica I
Esercizi 6: analisi della varianza
Homepage
Soluzione di alcuni esercizi
Le seguenti soluzioni sono state gentilmente fornite dal tutor di Statistica I dell’A.A. 2021/2022, Alex Alborghetti, che ringrazio. Le soluzioni sono state quindi riviste dal docente, che si assume le responsabilità di eventuali sviste ed errori.
Esercizio A
È noto, dalla scomposizione della devianza totale, che vale la seguente relazione:
\mathcal{D}^2 = \underbrace{\sum_{j = 1}^k \sum_{i = 1}^{n_j}(x_{ij}-\bar{x}_j)^2}_{\mathcal{D}^2_\text{en}} + \underbrace{\sum_{j=1}^kn_j(\bar{x}_j-\bar{x})^2}_{\mathcal{D}^2_\text{tr}},
Evidentemente, dividendo per n entrambi i membri, la scomposizione risulta valida anche per le varianze. Calcoliamo quindi le due varianze e sommiamole. Abbiamo già a disposizione le varianze di ciascun gruppo, dunque si può dimostrare che:
\sigma^2_{\text{en}} = \frac{1}{n} \sum_{j=1}^k n_j\sigma_j^2 = 2679.4.
Per quanto riguarda la varianza tra i gruppi, calcoliamo anzitutto la media, si dimostri che vale la seguente relazione:
\bar{x} = \frac{1}{n} \sum_{j=1}^k n_j\bar{x}_j= 259.7.
Allora, la varianza tra i gruppi vale:
\sigma^2_{\text{tr}} = \frac{1}{n} \sum_{j=1}^kn_j(\bar{x}_j-\bar{x})^2 = 2209.0.
Pertanto, la varianza totale sarà pari a \sigma^2 = 2679.4 + 2209.0 = 4888.4. I risultati sono arrotondati al primo decimale.
Per calcolare la “correlazione” tra dieta e incremento del peso utilizziamo l’indice \eta^2, definito come:
\eta^2 = 1 - \frac{\text{devianza entro i gruppi}}{\text{devianza totale}}.
Si può dimostrare (lo si faccia per esercizio) che tale indice è equivalente al complemento ad uno del rapporto tra varianza entro i gruppi e varianza totale. Allora, con i nostri dati:
\eta^2 = 1 - 2679.4/(2679.4+2209.0) = 0.45.
C’è quindi una moderata “correlazione” tra le due variabili. Il risultato è stato arrotondato a due decimali.
Esercizio B
Le medie e le varianze dei tempi di reazione di ciascun gruppo sono state calcolate e vengono riassunte nella tabella seguente:
Gruppo | \bar{x}_j | \sigma^2_j |
---|---|---|
20-40 | 100.4 | 1884.2 |
40-60 | 74.8 | 991.4 |
60+ | 73 | 308.7 |
(i risultati sono arrotondati al primo decimale).
La varianza tra i gruppi è interpretabile come la varianza spiegata dalle medie. La media totale è pari a \bar{x} = 84.2, allora:
\sigma^2_\text{tr} = \frac{1}{n} \sum_{j=1}^kn_j(\bar{x}_j-\bar{x})^2 = 163.9.
Considerato che a varianza totale è pari a \sigma^2 = (1/n) \sum_{i=1}^n(x_i-\bar{x})^2 = 1341.102, la proporzione di varianza spiegata è circa del 12.2\%.
Esercizio C
Per comodità, vengono calcolate e riassunte nella seguente tabella alcune quantità utili:
Gruppo | \bar{x}_j | \sigma^2_j |
---|---|---|
A | 0.35 | 0.03 |
B | 3.07 | 0.14 |
C | 1.76 | 0.22 |
i risultati sono stati arrotondati a due decimali. La dipendenza in media si misura tramite l’indice \eta, cioè il complemento ad uno del rapporto tra la varianza entro i gruppi e la varianza totale. La varianza entro i gruppi può essere calcolata come segue:
\sigma^2_\text{en} = \frac{1}{n} \sum_{j=1}^k n_j\sigma_j^2 = 0.15.
Per il calcolo della varianza totale, utilizziamo la definizione: \sigma^2 = (1/n) \sum_{i=1}^n(x_i-\bar{x})^2 = 1.01, con \bar{x} = 1.65. I risultati sono arrotondati a due decimali. In conclusione, possiamo dire che i tre antidoti non sembrano avere la stessa efficacia, dato che:
\eta^2 = 1 - 0.15/1.01 = 0.85.