Statistica I
Esame 22 Novembre 2021
Esercizio 1
In un’azienda industriale ci sono 5 diverse linee di produzione. Per ciascuna linea di produzione, viene rilevato il numero giornaliero di pezzi prodotti. La rilevazione viene ripetuta per un certo numero di giorni n_j, per j=1,\dots,5. Alcune statistiche descrittive di questo esperimento sono riportate nella seguente tabella.
Linea di produzione | A | B | C | D | E |
---|---|---|---|---|---|
Numero medio di pezzi prodotti (\bar{x}_j) | 5.9 | 9.8667 | 19.3333 | 9.5 | 3.6667 |
Deviazione standard numero pezzi prodotti | 2.0224 | 3.1170 | 3.9016 | 1.9621 | 0.9428 |
Numero di giorni (n_j) | 10 | 15 | 12 | 10 | 6 |
(Teoria) Si enunci il teorema di scomposizione della devianza.
Si calcoli il numero medio complessivo di pezzi prodotti al giorno \bar{x}, indipendentemente dalla linea di produzione.
Si calcoli la devianza tra i gruppi, la devianza entro i gruppi e la devianza totale. I gruppi in questo caso corrispondono alle varie linee di produzione.
Si calcoli il rapporto di correlazione \eta^2 e lo si interpreti nel contesto del problema.
Esercizio 2
Alle Olimpiadi di ``Tokyo 2020” un totale di n = 93 paesi sono stati premiati con almeno una medaglia di bronzo, d’argento oppure d’oro. Per ciascun paese, osserviamo tre variabili: il numero di medaglie d’oro x, il numero di medaglie d’argento y ed il numero di medaglie di bronzo z. È noto che
\sum_{i=1}^{93} x_i = 340, \quad \sum_{i=1}^{93} y_i = 338, \quad \sum_{i=1}^{93} z_i = 402. Questo significa, ad esempio, che sono state assegnate 340 medaglie d’oro in totale. Inoltre è noto che:
\sum_{i=1}^{93} x_i^2 = 5780, \quad \sum_{i=1}^{93} y_i^2 = 5268, \quad \sum_{i=1}^{93} z_i^2 = 5286,
e che:
\sum_{i=1}^{93} x_iy_i = 5213, \qquad \sum_{i=1}^{93} x_iz_i = 4930, \qquad \sum_{i=1}^{93} y_iz_i = 4727.
Si calcolino il numero medio di medaglie d’oro \bar{x}, d’argento \bar{y} e di bronzo \bar{z} relativo a questo insieme di n = 93 paesi. Si ottenga quindi il numero medio della somma di medaglie d’oro e d’argento \bar{w}, avendo definito la variabile w_i = x_i + y_i, per i =1,\dots,n.
Si ottenga la matrice di varianza / covarianza e la matrice di correlazione relativa alle variabili x, y e z.
Si calcoli la varianza \text{var}(w) della variabile w definita al punto (a).
Si consideri il modello di regressione x_i = \alpha + \beta z_i + \epsilon_i, per i=1,\dots,n, dove z (variabile esplicativa) è il numero di medaglie di bronzo mentre x (variabile risposta) è il numero di medaglie d’oro. Si calcolino le stime ai minimi quadrati \hat{\alpha} e \hat{\beta}.
Si interpretino le stime dei parametri \hat{\alpha} e \hat{\beta}, ottenute tramite minimi quadrati, facendo riferimento a questo specifico contesto applicativo.
Si ottenga un indice di adattamento per il modello stimato. Si calcoli inoltre il valore della varianza dei residui.
L’Italia ha ottenuto 20 medaglie di bronzo. Quante medaglie d’oro sono previste dal modello? Sapendo quindi che l’Italia ha vinto 10 medaglie d’oro, quanto vale il residuo corrispondente?
Esercizio 3
Siano x_1, \dots, x_n dei dati aventi dei pesi w_1,\dots,w_n. Si supponga inoltre che x_{n+1} e w_{n+1} siano una nuova coppia di dati. La media aritmetica ponderata è pari a
\bar{x}_{n} = \frac{1}{\tilde{w}_n}\sum_{i=1}^n w_i x_i, \qquad \tilde{w}_n = \sum_{i=1}^n w_i.
Si ottenga una formula ricorsiva per la media aritmetica ponderata. In altri termini, si esprima la media ponderata aggiornata \bar{x}_{n+1} in funzione della media ponderata precedente \bar{x}_n, della somma dei pesi \tilde{w}_n, del nuovo dato x_{n+1} e del corrispondente peso w_{n+1}.
La media (ponderata) degli esami di uno studente è \bar{x}_n = 25, per un totale di \tilde{w}_n = 72 crediti formativi. In un nuovo esame da w_{n+1} = 12 crediti, lo studente ottiene il voto x_{n+1} = 30. Qual è la nuova media \bar{x}_{n+1}?