QNA > C > Cos'è Un Intervallo Di Confidenza In Termini Profani?

Cos'è un intervallo di confidenza in termini profani?

L'intervallo di confidenza è un modo per mostrare qual è l'incertezza all'interno di una certa statistica. Per esempio, se selezioniamo un campione di 100 persone da (100k) che hanno votato nelle elezioni tenute negli USA, per il candidato A e il candidato B e se vogliamo calcolare il numero approssimativo di persone che hanno votato per il candidato A. Come lo faremo? Cercheremo di trovarlo osservando un campione di popolazione dalla popolazione totale.

Se ora selezioniamo un campione (campione 1) di 100 persone e la sua media risulta essere 74%. Se ora selezioniamo un altro campione (campione 2) di 100 persone da (100k) che hanno votato per il candidato A, sarà diverso dalla media che abbiamo calcolato sopra a causa di un errore di campionamento casuale.

Ora ripetiamo questo ancora e ancora. Ogni volta, la media del campione sarà probabilmente diversa dalla media precedente. Quindi come si fa a sapere la media della popolazione? La risposta a questo è "Intervalli di confidenza"; ti dice l'intervallo più probabile della media o della percentuale della popolazione sconosciuta.

Se calcoliamo un intervallo di confidenza del 95% per ogni campione, allora il 95% degli intervalli del campione conterrà la media della popolazione (la media effettiva di 100k popolazione). All'aumentare della dimensione del campione, l'intervallo diminuisce e la media del campione si avvicina alla media della popolazione perché si diminuisce l'errore standard aumentando la dimensione del campione (l'"errore standard" è la deviazione standard divisa per la radice quadrata della dimensione del campione). In altre parole, significa fondamentalmente la quantità che ci aspettiamo che la media del campione fluttui per una data dimensione del campione a causa di un errore di campionamento casuale. L'ho spiegato più chiaramente nell'immagine qui sotto.

Nota: Nell'esempio precedente abbiamo usato i termini "sicuro" e "intervallo" nella forma di (+/-). Quando si stima un parametro della popolazione usando statistiche campionarie che non saranno mai perfette; ci sarà sempre un certo errore rappresentato da - Point Estimate (+/-) Margin of Error.

Formula per calcolare l'intervallo di confidenza:

main-qimg-54ca72885cb209f92dc718ba2fe65c88 main-qimg-7439b971a63410b1675083fc11771250-mzj

Nota nell'immagine sopra che appena la media di un campione esce dalla linea tratteggiata, non è più nel suo intervallo. Ci saranno momenti in cui avremo un campione che non è rappresentativo della media della popolazione. Nell'immagine qui sopra il campione 7 non contiene mentre tutti gli altri sì. Così possiamo dire che i nostri campioni 4 e 7 non contengono la media della popolazione o che i campioni 4 e 7 non sono rappresentativi della popolazione complessiva. Lasciate che ve lo illustri più chiaramente con un esempio qui sotto.

Nota: L'intervallo di confidenza NON è la probabilità che la media della popolazione si trovi all'interno dell'intervallo ma significa che c'è il 95% di probabilità che il campione si trovi nella regione ombreggiata.

Esempio: Customer Service Drain

Situazione:

  • I negozi di mattoni e malta come Best Buy, Barnes & Noble, ecc. hanno difficoltà a gestire la pratica dello "show - rooming" per cui i clienti entrano nel negozio, esaminano gli articoli, se ne vanno, e poi vanno online per trovare un prezzo più conveniente dove ci sono meno costi generali. Questi sono "falsi clienti". I venditori passano del tempo con clienti che non hanno intenzione di comprare nulla nel negozio, il che porta ad un tempo improduttivo.
  • Il management di un'azienda ha determinato che se meno del 15% delle 8 ore giornaliere dei venditori viene speso con i "falsi clienti", allora lo show - rooming, pur essendo una seccatura, non è un problema.

Q. Per determinare se l'attuale show - rooming è davvero un problema in base agli standard dell'azienda, 125 addetti alle vendite sono selezionati a caso per misurare i loro tempi di servizio con falsi clienti.

  • Assumiamo che = 1958 secondi, ẍ(media del campione) = 3661.5, n = 125
  • Errore standard della media = 1958/√125 = 175.13

intervallo di confidenza del 95% - 3661.5 (+/-) 1.96(175.13) = 3661.5 (+/-) 343.25

main-qimg-203a8d231b78011c2b8156def048d94e

Conclusione: il 15% del tempo di un venditore era (0.15*3600 = 4320 secondi) ma siamo sicuri al 95% che il venditore spende tra 3318.25 secondi & 4004.75 secondi interagendo con i "falsi clienti" ogni giorno di 8 ore, quindi possiamo concludere che i falsi clienti non sono un drenaggio abbastanza grande da giustificare qualsiasi cambiamento di politica in quanto l'intervallo di tempo calcolato è inferiore al valore critico del tempo che è 4320(3600*8*15%).

Di Aleris

È un'opzione fattibile modificare un'immagine ROM direttamente invece di compilare? :: Come spiegare facilmente la parola ontologia? Qual è un esempio di ontologia o analisi ontologica
Link utili