Procesar listas negras con DataQualityTools

Las listas negras como por ejemplo las listas Robinson son una parte esencial del marketing directo. Cuidarlas no resulta nada difícil. Y con ayuda de DataQualityTools, las listas negras también se podrán procesar sin problemas.

Las listas Robinson, para más detalles podrá consultar el artículo 'Listas Robinson', suelen ser un buen recurso para cumplir con el deseo de determinados destinatarios de no recibir publicidad y en esto incluso ahorraremos dinero. Además, con las listas negras propias también podremos excluir nuestros competidores, nuestros empleados o, en el caso de captación de nuevos clientes nuestros clientes propios, como destinatario de determinadas campañas de marketing directo.

Para poder procesar las listas negras se requiere un programa capaz de efectuar una búsqueda de duplicados tolerante a errores entre dos tablas, como por ejemplo los DataQualityTools, disponibles en www.DataQualityApps.es. Mediante la búsqueda de duplicados entre dos tablas podremos además sincronizar listas de direcciones, por ejemplo para evitar que se vuelva a enviar publicidad a las direcciones que ya hayamos incluido en una campaña de marketing directo anterior o para transferir mediante el resultado de comparación informaciones como por ejemplo el número de teléfono o el número de cliente de una lista de direcciones a otra. Las opciones de aplicación de la búsqueda de duplicados entre dos tablas son diversas. Y con DataQualityTools, la búsqueda de duplicados entre dos tablas se hace en un momento.

Para ello proceda de la siguiente manera:

  1. Si previamente no lo ha hecho, descargue DataQualityTools desde www.DataQualityApps.es. Instale el programa y solicite una activación de prueba. Ahora podrá trabajar con el programa durante una semana sin restricciones.
  2. La función que necesitamos se encuentra en el menú dentro del bloque 'Comparación entre dos tablas'. Aquí seleccionamos 'Comparación usando la dirección de correo'.
  3. Después de haber activado esta función, aparecerá en pantalla la administración de projecto. Aquí debe crear un proyecto nuevo con cualquier nombre y a continuación haga clic en el botón 'siguiente'.
  4. En el siguiente paso abrimos con ayuda del botón 'abrir fichero' el fichero con los datos a procesar. En cambio, con los servidores de base de datos (MS SQL Server, MySQL, Oracle, IBM DB2 o PostgreSQL), en primer lugar debemos seleccionar el servidor de base de datos correspondiente del listado de selección 'formato / acceso a'. A continuación debemos introducir el nombre del servidor de base de datos. Después de hacer clic en el botón 'conectar con el servidor' debemos introducir los datos de acceso. La selección de la base de datos deseada y de la tabla de ahí resultante resulta finalmente de los correspondientes listados de selección.
  5. A continuación debemos indicar al programa que información encontrará en que columna de la tabla, por ejemplo, en que columna se encuentra la calle o el nombre de la ciudad. Para ello, siempre debemos seleccionar de las listas con los nombres de las columnas de la tabla el campo de datos que se ajusta mejor a la denominación que se muestra en el lado izquierdo. El programa efectúa automáticamente una preasignación de esta asignación de campos mediante los nombres de columnas. Como querremos buscar duplicados usando la dirección postal, debemos indicar para todos los elementos de la dirección postal todas aquellas columnas de la tabla a procesar donde esté guardada esta información. Podemos comprobar el resultado de la asignación de campos con ayuda de 'controlar la asignación de campos', que se encuentra en la parte derecha de la pantalla.
  6. La tabla que acabamos de indicar al programa es la tabla donde querremos que se busquen los duplicados. Si más adelante en el fichero original se borran los duplicados encontrados, entonces el proceso de borrar se hará justamente en esta tabla. Aparte de esto, debemos indicar al programa una segunda tabla, la lista negra. De ésta por principio nunca se borrarán registros. Está protegida contra escritura. Para poder indicar la segunda tabla, haga clic en el botón 'siguiente'. Con esto accedemos a un diálogo que tiene la misma apariencia que el diálogo anterior y que se acciona de la misma manera. Indique aquí la tabla con la lista negra y ejecute la asignación de campos de forma totalmente análoga a la primera tabla.
  7. Mediante el botón 'siguiente' accedemos al diálogo donde se configura la propia función. Aquí debemos ante todo indicar el valor umbral de la máxima desviación admisible entre dos direcciones. Además podremos excluir determinados elementos de la dirección postal del proceso de comparación. Obviamente debemos indicar en la asignación de campos previamente realizada una columna de la tabla a procesar para cada elemento de la dirección postal que deseamos incluir en la comparación. Nota: Las dos tablas entre las cuales querremos hacer la búsqueda de duplicados pueden tener estructura totalmente distinta. Por ejemplo, puede que en una tabla el número de la calle esté puesto en la misma columna que la calle y en la otra tabla esta información esté puesta en dos columnas separadas. Aquí lo único importante es que con la asignación de campos para estas dos tablas indiquemos las tres columnas.
  8. Haciendo clic en el botón 'siguiente', iniciamos la búsqueda de duplicados. Después de muy poco tiempo se muestra un resumen de los resultados. Si el programa ha encontrado duplicados entre las tablas a procesar, entonces, haciendo clic en el botón 'OK' accedemos al diálogo con las funciones que nos permiten procesar el resultado. Por lo demás, deberíamos seleccionar un valor umbral del grado de concordancia más bajo y reiniciar la comparación.
  9. En el diálogo con las funciones que nos permiten procesar el resultado se encuentra arriba del todo un botón con la inscripción 'retoques manuales'. Aquí el resultado de la comparación se expone en forma de tabla. Y aquí los registros que deben ser borrados estarán marcados con una cruz roja, ésta se podrá eliminar cuando sea necesario.
  10. Finalmente debemos procesar el resultado. Por ejemplo, podríamos borrar directamente del fichero original aquellos registros que se hayan marcado para ser borrados. Para ello solamente necesitamos hacer clic en el botón 'borrar en el fichero original'.

También podríamos ejecutar la búsqueda de duplicados entre dos tablas con DeduplicationWizard, disponible en www.DataQualityApps.es. Este únicamente puede procesar ficheros Excel e incluye solo las funciones más básicas de DataQualityTools.

Nota: También existe un video tutorial para DeduplicationWizard que nos introduce en el manejo del programa mediante una muestra de comparación de duplicados dentro de una tabla.

Para saber como se usa DeduplicationWizard para la búsqueda de duplicados en una lista de direcciones, podrá consultar el artículo 'Búsqueda de duplicados con DeduplicationWizard'. Y en el artículo 'Búsqueda de duplicados temporizada con BatchDeduplicator' podrá consultar como automatizar la búsqueda de duplicados.

Autor: Thomas Hainke