In primo luogo, otteniamo la tabella di contingenza richiesta.
8.2 |
1 |
0 |
0 |
1 |
9.4 |
1 |
0 |
0 |
1 |
9.7 |
2 |
0 |
0 |
2 |
10 |
1 |
0 |
0 |
1 |
14.5 |
1 |
1 |
0 |
2 |
15.2 |
1 |
0 |
0 |
1 |
16.5 |
1 |
0 |
0 |
1 |
17.6 |
1 |
0 |
0 |
1 |
19.7 |
0 |
1 |
0 |
1 |
20 |
0 |
1 |
0 |
1 |
21.2 |
0 |
1 |
0 |
1 |
21.5 |
1 |
0 |
0 |
1 |
|
22.4 |
0 |
0 |
1 |
1 |
23 |
0 |
0 |
1 |
1 |
23.3 |
0 |
1 |
0 |
1 |
23.6 |
0 |
1 |
0 |
1 |
24.5 |
0 |
0 |
1 |
1 |
24.8 |
0 |
0 |
1 |
1 |
25.2 |
0 |
1 |
0 |
1 |
25.5 |
0 |
0 |
1 |
1 |
25.8 |
0 |
1 |
0 |
1 |
26.4 |
0 |
1 |
2 |
3 |
27.3 |
0 |
1 |
1 |
2 |
29.4 |
0 |
0 |
1 |
1 |
30.9 |
0 |
0 |
1 |
1 |
|
La tabella delle frequenze attese è invece pari a
8.2 |
0.33 |
0.33 |
0.33 |
1 |
9.4 |
0.33 |
0.33 |
0.33 |
1 |
9.7 |
0.67 |
0.67 |
0.67 |
2 |
10 |
0.33 |
0.33 |
0.33 |
1 |
14.5 |
0.67 |
0.67 |
0.67 |
2 |
15.2 |
0.33 |
0.33 |
0.33 |
1 |
16.5 |
0.33 |
0.33 |
0.33 |
1 |
17.6 |
0.33 |
0.33 |
0.33 |
1 |
19.7 |
0.33 |
0.33 |
0.33 |
1 |
20 |
0.33 |
0.33 |
0.33 |
1 |
21.2 |
0.33 |
0.33 |
0.33 |
1 |
21.5 |
0.33 |
0.33 |
0.33 |
1 |
|
22.4 |
0.33 |
0.33 |
0.33 |
1 |
23 |
0.33 |
0.33 |
0.33 |
1 |
23.3 |
0.33 |
0.33 |
0.33 |
1 |
23.6 |
0.33 |
0.33 |
0.33 |
1 |
24.5 |
0.33 |
0.33 |
0.33 |
1 |
24.8 |
0.33 |
0.33 |
0.33 |
1 |
25.2 |
0.33 |
0.33 |
0.33 |
1 |
25.5 |
0.33 |
0.33 |
0.33 |
1 |
25.8 |
0.33 |
0.33 |
0.33 |
1 |
26.4 |
1.00 |
1.00 |
1.00 |
3 |
27.3 |
0.67 |
0.67 |
0.67 |
2 |
29.4 |
0.33 |
0.33 |
0.33 |
1 |
30.9 |
0.33 |
0.33 |
0.33 |
1 |
|
Pertanto si ottiene che
\chi^2 = \frac{(1 - 0.3333)^2}{0.3333} + \frac{(0 - 0.3333)^2}{0.3333} + \cdots + \frac{(1 - 0.3333)^2}{0.3333} = 50. Di conseguenza, l’indice di connessione normalizzato è
\chi^2_\text{norm} = \frac{50}{30 \min\{25 - 1, 3 - 1\}} = \frac{50}{60} = 0.83333.
Otteniamo ora la tabella delle media e varianze condizionate
0.5 |
10 |
13.23 |
17.9001 |
179.001 |
1 |
10 |
22.70 |
13.7660 |
137.660 |
2 |
10 |
26.06 |
6.3444 |
63.444 |
Si noti che la media complessiva è pari a \bar{y} = 20.66333. Da questa tabella è quindi agevole calcolare la devianza tra i gruppi e la devianza entro i gruppi, ottenendo:
\mathscr{D}_\text{tr}^2 = 10(13.23 - 20.66)^2 + 10(22.70 - 20.66)^2 + 10(26.06 - 20.66)^2= 885.265.
Inoltre, la devianza entro i gruppi è pari a
\mathscr{D}^2_\text{en} = 179.001 + 137.660 + 63.444 = 380.105,
da cui si ottiene che \mathscr{D}^2 = 885.265 + 380.105 = 1265.37. Il rapporto di correlazione è pertanto pari a \eta^2 = \frac{\mathscr{D}_\text{tr}^2}{\mathscr{D}^2} = \frac{885.265}{1265.37} = 0.699.
Otteniamo in primo luogo alcune quantità di interesse:
\sum_{i=1}^nx_iy_i = 814.35, \qquad \sum_{i=1}^n x_i^2 = 52.5, \qquad \sum_{i=1}^ny_i^2 = 14074.57,
Inoltre, è possibile calcolare le medie aritmetiche delle due variabili precedenti:
\bar{x} = 1.166667, \qquad \bar{y} = 20.66333.
Dalle precedenti quantità, è possibile ottenere che:
\text{cov}(x,y) = 3.037778, \qquad \text{var}(x) = 0.3888889, \qquad \text{var}(y) = 42.17899.
Di conseguenza, otteniamo che \hat{\beta} = 7.811 e \hat{\alpha} = \bar{y} - 7.8111\bar{x} = 11.550. La retta di regressione è quindi disegnata nel grafico sottostante.
Inoltre, semplici calcoli portano a \rho = 0.75 e quindi R^2 = \rho^2 = 0.5626.