Distribuzioni statistiche

La Statistica si occupa dell’analisi di un certo fenomeno relativo a un certo gruppo di soggetti (popolazione) sulla base della rilevazione completa delle informazioni (censimento). Tali informazioni grezze vengono sintetizzate tramite delle tabelle e analizzate tramite opportuni indici statistici.

  • Variabile statistica (carattere): caratteristica che viene presa in esame in un certo studio statistico (esempi: altezza, età, sesso, titolo di studio, peso, colore degli occhi, reddito). Può essere discreta o continua.
  • Modalità: modo di manifestarsi di una variabile statistica;
  • Unità statistica: singola unità elementare su cui vengono osservati i caratteri oggetto di studio (esempi: studente, famiglia, reddito di una persona, ecc.)
  • Popolazione: insieme di unità statistiche omogenee rispetto a una o più caratteristiche (esempi:studenti dell’Università di Milano, residenti nella regione Lazio, popolazione delle famiglie italiane)

Distribuzioni statistiche – Frequenze assolute e frequenze relative
Se in una popolazione formata da k elementi, una variabile discreta X assume n modalità distinte

\[\left \{ x_{1}, x_{2},…, x_{n} \right \}\]

in modo che la modalità $\displaystyle x_{1}$ si presenta $\displaystyle k_{1}$ volte, la modalità $\displaystyle x_{2}$ si presenta $\displaystyle k_{2}$ volte, … , la modalità $\displaystyle x_{n}$ si presenta $\displaystyle k_{n}$ volte, è possibile rappresentare questi dati mediante una tabella (Tab. 1) del tipo:

Tale tabella si chiama distribuzione di frequenza della variabile X, le quantità

$\displaystyle k_{i}\, \, per\, \, i=1,2,…,n$

si chiamano frequenze assolute e sono numeri interi tali che:\[\sum_{i=1}^{k}i_{k}=k,\, \, \, \, 0\leq k_{i}\leq k\] mentre le quantità $\displaystyle \frac{k_{i}}{k}$ si dicono frequenze relative e sono tali che:

$\displaystyle \sum_{i=1}^{n}\frac{k_{i}}{k}=1, \, \, con\, \, 0\leq \frac{k_{i}}{k}\leq 1$

Se la variabile X è continua allora si usa suddividere i valori assunti dalla variabile in classi di modalità riferendo la distribuzione delle frequenze agli elementi che appartengono ad una data classe. I metodi maggiormente usati per suddividere in classi i valori assunti dalla variabile X sono il metodo delle classi equi-ampie e quello delle classi equi-frequenti. In questo caso i dati si possono rappresentare come nella tabella 2.

tabelle2_statistica

 

Frequenze cumulate e funzione di ripartizione per distribuzioni discrete

Frequenze cumulate:
Numero di unità statistiche con valori di

\[X\leq x_{i}\]

\[frequenze\, \, cumulate\, \, \left ( x_{i} \right )=\sum_{k=1}^{i}n_{k}\]

Funzione di ripartizione empirica:
La funzione di ripartizione

\[F\left ( x_{i} \right )\]

di una variabile X – proporzione di unità statistiche con valori di \[X\leq x_{i}\]

è:

\[F\left ( x_{i} \right )=\sum_{k=1}^{i}f_{k}\]

 

Avvertenza
Si possono costruire tabelle anche con frequenze assolute o relative cumulate o in percentuale.