Cos'è il punteggio F2 nell'apprendimento automatico?
Immaginiamo ora di considerare il richiamo due volte più importante della precisione nel nostro modello. Consideriamo una rete neurale convoluzionale nel dominio medico, che valuta le mammografie e rileva i tumori. Consideriamo molto peggio mancare un tumore che dare un falso allarme per un tumore inesistente.
Usando le stesse cifre dell'ultimo esempio, immaginiamo di eseguire il modello su dieci mammografie. Il modello rileva un tumore in sei delle mammografie e dà il via libera a quattro mammografie. Più tardi scopriamo che dei sei tumori rilevati, uno era un falso allarme, in altre parole, un falso positivo. Delle quattro mammografie pulite, due contenevano davvero un tumore ed erano falsi negativi. I numeri tp, fp, tn e fn sono gli stessi dell'ultimo esempio, e quindi anche la precisione e il richiamo. Poiché stiamo pesando il richiamo come due volte più importante della precisione, dobbiamo usare la formula per il punteggio F2. Impostando β = 2, otteniamo: Dal momento che abbiamo ponderato maggiormente il richiamo, e il modello ha una buona precisione ma un richiamo scarso, il nostro F-score è sceso da 0,77 a 0,74 rispetto all'esempio del raccoglitore di mele, dove precisione e richiamo erano ponderati allo stesso modo. Questo mostra come il punteggio F2 può essere usato quando il costo di un falso positivo non è lo stesso di un falso negativo. Questo è uno scenario comune quando si usa l'IA per l'assistenza sanitaria.
Articoli simili
- Cos'è la complessità del modello nell'apprendimento automatico?
- Cos'è un set di dati di allenamento e un set di dati di test nell'apprendimento automatico? Quali sono le regole per selezionarli?
- Che rapporto hanno i modelli grafici probabilistici (PGM) con l'apprendimento automatico?
- Come usa Google l'apprendimento automatico?