K-means (MacQueen, 1967) es una técnica de análisis cluster que trata de establecer una partición en K grupos o clusters sobre un conjunto de N objetos {O1 ,...,ON } de los que disponemos de una información multivariante P-dimensional. Partiendo de la matriz de datos XN×P , la función que se pretende minimizar en el proceso de clasificación es la suma total de cuadrados de los errores (TESS), cuya expresión viene dada por:
TESSk = \(\Sigma\) E2 (k) = \(\Sigma\)\(\Sigma\)I (Oi c Ck) e2i (k) (1)
siendo 2 E(k ) la suma de cuadrados de los errores (ESS) para el cluster Ck , I[ ] Oi ⊂ Ck =1 si el objeto Oi ha sido asignado a Ck , [ ] ⊂ = 0 Oi Ck I si Oi no ha sido asignado a Ck , y 2 i(k) e la distancia euclídea al cuadrado de cada objeto al centroide de Ck :