Podemos decir en tonces que, en general, los valores \(x_k\) no están distribuidos según \(f_{X}(x)\). Para conseguir que \(X_k\sim f_{X}(x)\) tenemos dos opciones que anulan el término \((1-\epsilon)^k\left[f_{X_0}-f_{X} (x)\right]\). La primera es que los valores iniciales ya estén distribuidos según \( f_{X}(x)\), esto es, \(f_X (x)=f_{X_0}(x_0)\). La segunda opción es que el término \((1-\epsilon)^k\)sea nulo. Puesto que \(0<\epsilon\leq1\) ocurre que \((1-\epsilon)^k\)decrece monotonamente con \(k\), de manera que esperamos que \(\lim_{k\rightarrow\infty} f_{X_k}(x_k)=f_X(x)\).  Así que conviene esperar un cierto número de pasos del algortimo antes de emepezar a almacenar los valores de la variable aleatoria \(X\). Cuanto esperar dependerá del valor de \(\epsilon \) de cada problema. A esta espera se le conoce como termalización.