Identificar y eliminar datos duplicados rápidamente

En promedio, una base de datos contiene registros duplicados entre un 8% y 10%. Estos datos duplicados generan desperdicios e ineficiencia, y nublan su capacidad para obtener una vista única y precisa de sus clientes.

Melissa es la solución más poderosa y precisa del mercado para combatir el problema de detección y eliminación de datos duplicados. Lo que diferencia a Melissa del resto es su capacidad de análisis inteligente para comprender los diversos componentes de las direcciones de domicilio nacionales e internacionales. Al combinar un profundo conocimiento de los formatos de direcciones y técnicas avanzadas de coincidencia aproximada, MatchUp le brindará la capacidad de identificar y fusionar datos, así como eliminar incluso los datos duplicados más difíciles de detectar.

  • Obtenga la capacidad de eliminar datos duplicados y desorden que impiden un análisis claro de los datos de sus clientes
  • Aumente la precisión de su base de datos, ahorrando tiempo y dinero
  • Reduzca los gastos de envío de correo mediante la eliminación de datos duplicados haciendo uso de tecnología de comparación avanzada
Encuentre coincidencias en sus datos

Pruebe encontrar registros duplicados utilizando los códigos de coincidencia de MatchUp.

Probar MatchUp ahora

Cómo funciona MatchUp

MatchUp emplea un código de coincidencia para determinar si dos registros deben considerarse duplicados. Este código puede ser predefinido o uno que se haya creado utilizando el editor de código de coincidencia.

Los siguientes componentes de Matchcode (tipos de datos) están disponibles para su uso en la identificación de duplicados:

  • Prefijo
  • Nombre de pila
  • Segundo nombre
  • Apellido
  • Sufijo
  • Género
  • Primero / Apodo
  • Medio / Apodo
  • Departamento / Título
  • Empresa
  • Acrónimo de la empresa
  • Número de calle
  • Calle pre-direccional
  • Nombre de la calle
  • Sufijo de calle
  • Calle Post-direccional
  • PO Box™
  • Calle secundaria
  • Dirección
  • ciudad
  • Provincia/Estado
  • ZIP9
  • Zip5
  • Zip + 4®
  • Código postal
  • País
  • Teléfono / fax
  • Dirección de correo electrónico
  • Número de tarjeta de crédito
  • Fecha
  • Numérico
  • Proximidad
  • Identificación general
Datos Duplicados - Cómo funciona MatchUp
Datos Duplicados - Coincidencia difusa

Coincidencia difusa

MatchUp combina un profundo conocimiento y dominio de los datos de contacto de Melissa con más de 20 algoritmos de coincidencia aproximada para detectar y eliminar datos duplicados rápidamente de su base de datos.

MatchUp emplea los siguientes algoritmos de coincidencia aproximada para identificar registros duplicados de "coincidencia no exacta":

  • Phonetex
  • Soundex
  • Containment
  • Frequency
  • Fast Near
  • Accurate Near
  • Frequency Near
  • UTF-8 Near
  • Vowels Only
  • Consonants Only
  • Alphas Only
  • Numerics Only
  • MD Keyboard
  • Jaro
  • Consonants Only
  • Alphas Only
  • Numerics Only
  • MD Keyboard
  • Jaro
  • Jaro-Winkler
  • n-Gram
  • Needleman-Wunch
  • Dice’s Coefficient
  • Smith-Waterman-Gotoh
  • Jaccard Similarity Coefficient
  • Overlap Coefficient
  • Longest Common Substring
  • Double MetaPhone

Fusión Global/Depuración

La edición mundial de MatchUp es compatible con 12 países, incluidos Canadá, Alemania, Reino Unido y Australia. La capacidad avanzada de MatchUp para reducir y eliminar datos duplicados, le permite ver a través de equivalentes diacríticos, hasta caracteres latinos, e interpretar palabras clave que son iguales pero que se escriben de manera diferente (por ejemplo: Alemania y DEU).

Datos Duplicados - Fusión Global/Depuración
Datos Duplicados - Escenarios de coincidencia únicos

Escenarios de coincidencia únicos

MatchUp cuenta con algunos atributos únicos que pueden emplearse para ayudar a identificar y eliminar datos duplicados de distintas formas interesantes.

1. Sobrevivencia para la creación de Golden Record

MatchUp puede seleccionar los mejores elementos de varios registros para sobrevivir a la consolidación. Ideal para la creación de Golden Records para obtener una vista única del cliente. Disponible en Microsoft SQL Server Integration Services (SSIS) y Pentaho PDI.

2. Correspondencia de proximidad

El algoritmo patentado de distancia de MatchUp utiliza coordenadas de latitud-longitud y umbrales de proximidad para identificar registros duplicados que están geográficamente cerca. Por ejemplo, al usar estos atributos de ubicación, MatchUp puede detectar registros coincidentes en diferentes direcciones (como en una compañía con dos entradas diferentes) pero dentro de una distancia específica entre sí.

3. Registros en la misma dirección

MatchUp tiene la capacidad de identificar y consolidar registros y solicitudes que provienen de una misma dirección para comprender mejor las relaciones, el ciclo de vida y las necesidades de los clientes. Igualmente, MatchUp puede juntar varias cuentas comerciales en "familias corporativas" para desarrollar una visión más amplia y evaluar mejor la relación total de ventas. Esta característica también se puede utilizar para eliminar datos duplicados y correo innecesario que se entrega al mismo hogar con el propósito de reducir costos de impresión, producción y envío desperdiciados.

Formas de detectar y eliminar datos duplicados

MatchUp ofrece tres métodos de operación (o formas de hacer coincidir los registros):

1. Lea/escriba deduplicados

Compare los registros en una o más bases de datos a la vez. Cada grupo único tendrá un registro que recibirá un estado de “salida”; los otros registros coincidentes recibirán un estado de “datos duplicados”. Ideal para hacer coincidir bases de datos completas a la vez.

2. Eliminación de duplicados

Permite detectar coincidencias en tiempo real al comparar cada registro a medida que se recibe (como en un formulario web o en un centro de llamadas) con la principal base de datos existente. Si el registro entrante no es un duplicado, se permite agregar a la base de datos.

3. Eliminar duplicados híbridos

Proporciona una combinación de los dos primeros métodos, con la opción de personalizar el proceso para que se compare un registro entrante contra un pequeño grupo de posibles coincidencias. Con la deduplicación híbrida, usted puede almacenar claves de coincidencia como propietario. Ideal para la entrada de datos en tiempo real o el procesamiento por grupos de listas completas.

Datos Duplicados - Formas de detectar y eliminar datos duplicados

Recursos útiles

Video

Coincidencia de datos / Matchup

Ver video
Video

Coincidencia

Ver video