|
|
No importa cómo esté diseñado
un programa o cuán hábilmente se use. Si se alimenta
mala información, se obtendrá resultados incorrectos
o falsos. Desafortunadamente, los datos que se usan satisfactoriamente
en las aplicaciones de línea comercial operacionales pueden
ser basura en lo que concierne a la aplicación data warehousing.

Los datos "sucios" pueden presentarse
al ingresar información en una entrada de datos (por ejemplo,
"Sitsemas S. A." en lugar de "Sistemas S. A."
) o de otras causas. Cualquiera que sea, la data sucia daña
la credibilidad de la implementación del depósito
completo. A continuación, en la Figura N° 23 se muestra
un ejemplo de formato de ventas en el que se pueden presentar
errores.
Afortunadamente, las herramientas de limpieza
de datos pueden ser de gran ayuda. En algunos casos, puede crearse
un programa de limpieza efectivo. En el caso de bases de datos
grandes, imprecisas e inconsistentes, el uso de las herramientas
comerciales puede ser casi obligatorio.
Decidir qué herramienta usar es importante
y no solamente para la integridad de los datos. Si se equivoca,
se podría malgastar semanas en recursos de programación
o cientos de miles de dólares en costos de herramientas.