Inferenza statistica

L’inferenza statistica è il processo grazie al quale dai risultati osservati su di un campione si traggono conclusioni su tutta la popolazione.

Stimatore e stima
Sia k un generico parametro, indice statistico determinato su di una data popolazione, della popolazione considerata. Attraverso lo studio del campione si cerca di definire la statistica che meglio rappresenti k. Tale statistica viene definita stimatore ed il valore che assume costituisce una stima del parametro k.
Dato che le stime fornite da ogni stimatore sono diverse al variare del campione è necessario che lo stimatore sia:

  • corretto: il suo valore deve essere uguale al parametro che si vuole studiare
  • efficiente: la sua varianza deve essere minore a quella di un qualsiasi altro stimatore
  • consistente: all’aumentare di n tende con probabilità pari ad 1 al valore esatto del parametro che si vuole stimare.

Distribuzione di campionamento
Si definisce distribuzione di campionamento di una statistica una distribuzione teorica di probabilità ottenuta estraendo da una popolazione tutti i possibili campioni di dimensione n, calcolando per ognuno il valore della statistica considerata ed associando ad ogni valore ottenuto la rispettiva probabilità di verificarsi

Le distribuzioni di campionamento sono la base per eseguire l’inferenza statistica.

Le distribuzioni di campionamento delle medie si possono generare nel seguente modo:

  1. Consideriamo una popolazione formata da N unità il cui il carattere in esame abbia media aritmetica pari a $\displaystyle \mu$ e deviazione standard uguale a $\displaystyle \sigma$.
  2. Estraiamo da tale popolazione infiniti campioni di numerosità n e per ognuno dei quali calcoliamo la media aritmetica \[\overline{x}_{i}\]
  3. Il risultato è un insieme infinito di medie aritmetiche riferite a campioni di numerosità n
  4. Se conosciamo ciascuna \[\overline{x}_{i}\] come osservazione individuale è possibile costruire una distribuzione di frequenza definita Distribuzione di campionamento delle medie dei campioni di numerosità n

Proprietà delle distribuzioni di campionamento delle medie

  1. La media della distribuzione di campionamento delle medie è uguale alla media della popolazione \[\overline{x}_{i}=\mu\]
  2. La deviazione standard è uguale \[S=\frac{\sigma }{\sqrt{n}}\]tale parametro è detto errore standard ed è una misura della precisione della stima campionaria della media aritmetica della popolazione (misura dell’errore campionario delle medie aritmetiche)
  3. La forma è approssimativamente normale, a condizione che il carattere sia distribuito normalmente nella popolazione oppure n sia sufficientemente grande \[n\geq 30\]