K-Means Clustering Algorithm
Il metodo dell’anello in k-means prevede l’esecuzione di un clustering k-means sul dataset per un determinato intervallo di valori k, ad esempio da uno a dieci. Quindi, si calcola un punteggio medio per ogni cluster per ogni valore k. Il punteggio di distorsione di solito viene trovato sommando le distanze quadratiche da ciascun punto al suo centro designato.
Utilizzo del Campionamento di Cluster
Il campionamento di cluster viene comunemente impiegato nella ricerca di marketing. In situazioni in cui i ricercatori non possono ottenere informazioni sull’intera popolazione ma possono acquisire informazioni sui gruppi, il campionamento di cluster diventa una scelta realizzabile. Ad esempio, un ricercatore potrebbe essere interessato ai dati relativi alle tasse sulle città della Florida.
Algoritmi di Clustering Disponibili
Esistono numerosi algoritmi di clustering che possono essere utilizzati per raggiungere l’obiettivo di clustering data la natura soggettiva del processo. Ogni metodologia utilizza un insieme diverso di regole per determinare la "similarità" tra i punti dati. In realtà, sono conosciuti più di cento algoritmi di clustering.