Statistica I

Esame 24 Gennaio 2025

Autore/Autrice
Affiliazione

Tommaso Rigon

DEMS

Problema 1

È stato analizzato il contenuto di argento (% Ag) di alcune monete bizantine rinvenute a Cipro. Nove di queste monete appartenevano alla prima coniazione del regno di re Manuele I Comneno (1143-1180), sette alla seconda coniazione avvenuta alcuni anni dopo, quattro alla terza coniazione ancora successiva, e altre sette a una quarta coniazione. Ci si è chiesti se vi fossero differenze significative nel contenuto di argento tra le monete coniate all’inizio e alla fine del regno di Manuele. I dati, divisi per gruppi e ordinati per periodo, sono riportati nel seguito.

## 5.9 6.8 6.4 7 6.6 7.7 7.2 6.9 6.2
## 6.9 9 6.6 8.1 9.3 9.2 8.6
## 4.9 5.5 4.6 4.5
## 5.3 5.6 5.5 5.1 6.2 5.8 5.8
  1. Disegnare l’istogramma della variabile argento, considerando tutte le n = 27 osservazioni (indipendentemente dai gruppi). Scegliere un numero adeguato di intervalli e motivare la scelta.

  2. La distribuzione della variabile marginale argento (indipendentemente dai gruppi) è bimodale? Motivare la risposta.

  3. Si calcoli un indice di asimmetria per la variabile argento, considerando tutte le n = 27 osservazioni (indipendentemente dai gruppi).

  4. Per ciascun gruppo della variabile argento, calcolare mediana, primo e terzo quartile, individuare eventuali valori anomali e confrontare i boxplot.

  5. Determinare se esistono differenze tra le medie della variabile argento nei diversi gruppi utilizzando indici statistici appropriati e commentare i risultati.

Riferimento bibliografico: Hendy, M.F. and Charles, J.A. (1970) The production techniques, silver content and circulation history of the twelfth-century Byzantine Trachy. Archaeometry, 12, 13-21.

Problema 2

Il FantaSanremo è un gioco online basato sul Festival di Sanremo, la celebre competizione musicale italiana. Si tratta di un “fantasy game” ispirato a giochi come il Fantacalcio, ma incentrato sui cantanti in gara al Festival. I partecipanti formano una squadra scegliendo n = 7 artisti tra quelli in gara, assegnando loro un budget fittizio. Ogni giocatore ha un budget virtuale (di solito 100 Baudi, la moneta del gioco) per “comprare” i cantanti che vuole inserire nella sua squadra. Ogni cantante ha un valore in Baudi, determinato dalla sua popolarità e dalle aspettative.

Di seguito sono indicati i costi dei cantanti (in “Baudi”, la moneta del gioco) per le due squadre.

squadra 1 squadra 2
17 (Fedez) 13 (Simone Cristicchi)
16 (Coma_Cose) 12 (Modà)
14 (Francesca Michielin) 18 (Giorgia)
16 (Noemi) 15 (Rose Villain)
13 (Simone Cristicchi) 18 (Elodie)
12 (Joan Thiele) 12 (Emis Killa)
12 (Lucio Corsi) 12 (Sarah Toscano)
  1. Calcolare il rapporto di concentrazione di Gini per la squadra 1 e per la squadra 2.

  2. Disegnare le curve di Lorenz corrispondenti e confrontarle.

  3. Interpretare i risultati ottenuti nei due punti precedenti.

  4. In questo esempio specifico, sarebbe stato possibile confrontare la concentrazione tra i Baudi della squadra 1 e squadra 2 utilizzando la varianza? Perché?

  5. Supponiamo di redistribuire il budget totale all’interno della squadra, assegnando ai cantanti lo stesso valore medio, ovvero 100 / 7 = 14.286 baudi. Come cambierebbero il rapporto di concentrazione di Gini e la curva di Lorenz per questa ipotetica squadra?

  6. Si supponga che in una futura edizione del FantaSanremo la valuta “Baudi” venga sostituita con una nuova moneta, gli “Amedei”, dove 1 Baudo equivale a 50 Amedei. Ogni squadra avrebbe quindi un budget di 5,000 Amedei, e i costi dei cantanti sarebbero convertiti nella nuova valuta. Quanto valgono i rapporti di concentrazione di Gini per le due squadre in questa nuova valuta? Si osservano variazioni rispetto ai rapporti calcolati in Baudi?

  7. (Teoria) Sia x_1, \dots, x_n un insieme di dati. Consideriamo i dati trasformati y_1, \dots, y_n, definiti come y_i = a + b x_i per i = 1, \dots, n, dove a e b sono due numeri reali arbitrari. Dimostrare che \text{var}(y) = b^2 \text{var}(x).

Problema 3

  1. Sia x_1,\dots,x_n un insiemi di dati. Si dimostri che \bar{x} = \arg\min_{\alpha \in \mathbb{R}}\sum_{i=1}^n(x_i - \alpha)^2.
  2. Inoltre si dimostri per n = 2 che \min_{\alpha \in \mathbb{R}}\sum_{i=1}^n|x_i - \alpha| = \sum_{i=1}^n|x_i - \text{Me}|