Qual è la differenza tra la deviazione standard della popolazione e la deviazione standard del campione?
Risposta:
Nella formula per una deviazione standard della popolazione, dividi per la dimensione della popolazione #N#, mentre nella formula per la deviazione standard del campione, dividi per #n-1# (la dimensione del campione meno una).
Spiegazione:
If #mu# è la media della popolazione, la formula per la deviazione standard della popolazione dei dati della popolazione #x_{1},x_{2},x_{3},ldots, x_{N}# is
#sigma=sqrt{frac{sum_{k=1}^{N}(x_{k}-mu)^{2}}{N}}#.
If #bar{x}# è la media di un campione, la formula per la deviazione standard del campione dei dati del campione #x_{1},x_{2},x_{3},ldots, x_{n}# is
#s=sqrt{frac{sum_{k=1}^{n}(x_{k}-bar{x})^{2}}{n-1}}#.
Il motivo per cui è stato fatto è in qualche modo tecnico. In questo modo la varianza del campione #s^{2}# un cosiddetto stimatore imparziale per la varianza della popolazione #sigma^{2}#. In effetti, se la dimensione della popolazione è davvero grande e stai facendo molti, molti campioni casuali della stessa dimensione #n# da quella grande popolazione, la media di molti, molti valori di #s^{2}# avrà una media molto vicina al valore di #sigma^{2}# (e, per quanto riguarda una prospettiva teorica, la media di #s^{2}# come "variabile casuale" sarà di preciso #sigma^{2}#).
I tecnicismi per cui questo è vero implicano molta algebra con somme e di solito non vale il tempo speso per gli studenti principianti.