La primera opción que se considera cuando se presentan valores anómalos es eliminarlos, pero esta practica es poco recomendable sin antes contextualizar la realidad del estudio, por ejemplo estos datos nos pueden estar mostrando interesantes comportamientos que en ultimas pueden ser documentados. Si, no se encuentra alguna relación entre estos datos y el estudio, se recomienda lo siguiente:
- Omitir los registros que presente valores perdidos.
- Omitir las variables que tiene tiene exceso de valores perdidos.
- Forzar a convertir estos valores dentro del rango de no atipicidad este puede ser dentro de las +- 3 desviaciones estándar con respecto a la media o (Q1,Q2 ) +- 1.5* IQR.
- Pronosticar los valores anómalos analizando la estructura y la secuencia de los registros y variables.
- Reemplazar los valores anómalos por registros valederos, siempre y cuando la cantidad a cambiar sea pequeña.
Comentarios