Statistica I

Esercizi 2: indici di posizione

Autore/Autrice
Affiliazione

Tommaso Rigon

Università degli Studi di Milano-Bicocca

Homepage

Soluzione di alcuni esercizi

Le seguenti soluzioni sono state gentilmente fornite dal tutor di Statistica I dell’A.A. 2021/2022, Alex Alborghetti, che ringrazio. Le soluzioni sono state quindi riviste dal docente, che si assume le responsabilità di eventuali sviste ed errori.

Esercizio A

È dato il vettore di osservazioni:

x = (-4,5,3,1,-1,3,-1,1,0,3,2) Ricordando la definizione di media aritmetica, si ottiene quindi che: \bar{x} = \frac{1}{n}\sum_{i=1}^nx_i = \frac{-4+5+3+\cdots + 2}{11} = 1.091

Si trova facilmente dalla definizione che \text{Me}(x) = x_{(6)} = 1. Sia f(x) una trasformazione monotona dei dati di partenza, allora \text{Me}(f(x)) = f(\text{Me}(x)).

La media, invece, gode della proprietà di linearità, tale per cui \bar{y} = a + b\bar{x}. Grazie a queste due proprietà, si possono ricavare i seguenti valori:

y \text{Me}(y) \bar{y}
e^x e^{\text{Me}(x)} = e^1 = e -
x+4 \text{Me}(x) + 4 = 5 \bar{x}+4 = 5.091
-3x+1 -3 \text{Me}(x) +1=-2 -3\bar{x}+1 = -2.273
x^2 - -

I tre spazi vuoti della tabella, invece, vanno necessariamente completati trasformando manualmente i dati e calcolando gli indici richiesti.

Si trova che \bar{y} = n^{-1}\sum_{i=1}^n e^{x_i} = 20.295, \text{Me}(x^2) = 4 e \bar{y} = n^{-1}\sum_{i=1}^n x_i^2 = 6.909. I risultati sono stati arrotondati a tre cifre decimali.

Esercizio C

La distanza di un negozio dal magazzino può essere espressa come lo scarto |x_i - a|km, dove x_i è il chilometro al quale si trova il negozio, mentre a è il chilometro al quale si trova il magazzino.

Si deve individuare quel valore a tale per cui il doppio (andata e ritorno) della somma di questi scarti viene minimizzata. Il valore a deve, pertanto, corrispondere alla mediana, che vale 134.

La distanza totale percorsa per rifornire tutti e cinque i negozi è pari a 1178km. Se avessimo posizionato il magazzino sul chilometro pari alla media, che vale 200.2km, avremmo dovuto percorrere 1319.2km.

Esercizio D

Una tipica approssimazione della media, quando i dati sono suddivisi in classi, è la seguente: \bar{x} \approx \frac{1}{n} \sum_{j=1}^k n_jm_j, dove m_j è il punto centrale del j-esimo intervallo ed n_j è la sua frequenza assoluta.

Classe Freq. cumulata Freq. Assoluta
(249, 250] 0 0
(250, 251] 15 15
(251, 252] 42 42 - 15 = 27
(252, 253] 60 60 - 42 = 18
(253, 254] 70 70 - 60 = 10
(254, 255] 71 71 - 70 = 1

Quindi, possiamo calcolare la media come:

\bar{x} \approx \frac{0\cdot249.5+15\cdot250.5+27\cdot251.5+18\cdot252.5+10\cdot253.5+1\cdot254.5}{71} = 251.866.

Invece, una comune approssimazione della mediana quando i dati sono suddivisi in classi è data da: \text{Me}(x) \approx a_{j-1} + (a_j - a_{j-1})\frac{1/2 - F(a_{j-1})}{F(a_{j})-F(a_{j-1})},

dove (a_{j-1}, a_{j}] è la classe alla quale la mediana appartiene ed F(\cdot) è la funzione di ripartizione empirica.

Nel nostro caso, la mediana, ovvero l’osservazione x_{(36)}, appartiene all’intervallo (251,252]. Sappiamo, inoltre, che F(252) = 42/71 = 0.592 e F(251) = 15/71 = 0.211. Sostituendo tutti i valori nella formula, si ricava: \text{Me}(x) \approx 251.759.

Un’approssimazione del primo quartile, quando i dati sono suddivisi in classi, è invece: Q_{0.25} \approx a_{j-1} + (a_j - a_{j-1})\frac{0.25 - F(a_{j-1})}{F(a_{j})-F(a_{j-1})}, dove (a_{j-1}, a_{j}] è la classe alla quale il primo quartile appartiene. Poiché il primo quartile apartiene all’intervallo (251,252], dato che F(252) = 0.592 e F(251) = 0.211, sostituendo questi valori nella formula troviamo che Q_{0.25} \approx 251.102.

L’approssimazione del terzo quartile quando i dati sono suddivisi si ottiene invece tramite la formula: Q_{0.75} \approx a_{j-1} + (a_j - a_{j-1})\frac{0.75 - F(a_{j-1})}{F(a_{j})-F(a_{j-1})}, dove (a_{j-1}, a_{j}] è la classe alla quale il terzo quartile appartiene.

Poiché il terzo quartile appartiene alla classe (252,253] dato che F(252) = 0.592 e F(253) = 60/71 = 0.845, sostituendo nella formula troviamo che Q_{0.75} \approx 252.625.

Esercizio H

La mediana della variabile x vale circa 17. Il primo quartile vale circa 16, il terzo 22.