Identifiziert und entfernt Dubletten - MatchUp®

Im Durchschnitt enthält eine Datenbank 8% - 10% Dubletten. Diese Duplikate führen zu Verschwendung und Unwirksamkeit, aber über anpassbare Kriterien in MatchUp® erhalten Sie eine einzige, exakte Sicht auf jeden Kunden.

Melissas MatchUp® ist die leistungsfähigste, genaueste und schnellste Lösung auf dem Markt, um das Problem der Dubletten in Dateien zu bekämpfen. Was es von den anderen unterscheidet, ist seine intelligente Analysefähigkeit, um die verschiedenen Komponenten von nationalen und internationalen Adressen zu verstehen und zu analysieren. Durch die Kombination von fundiertem Domainwissen über internationale Adressformate und fortschrittlichen Fuzzy-Matching-Techniken haben Sie mit MatchUp® die Möglichkeit, selbst die am schwierigsten zu erkennenden Dubletten zu identifizieren und zusammenzuführen.

  • Genauere, umfassende Ansicht Ihrer Kundendaten
  • Identifizierung von mehreren Datensätze, die zu einer Adresse gehören - spart Zeit und Geld
  • Reduzierung von Porto- und Versandkosten, da durch MatchUp® Dubletten vermieden werden
Testen Sie unsere Dublettenprüfung!
Testen Sie unsere Dublettenprüfung Jetzt testen!

Wie MatchUp® funktioniert

Mit MatchUp® können Sie Dubletten in Ihren Datenbanken identifizieren und durch Zuordnungsregeln, sogenannte Matchchodes, herausfinden, ob die zu einem Haushalt, einem Unternehmen oder einer Organisation gehören. MatchUp® verwendet einen vordefinierten Matchcode oder einen, den Sie mit dem Matchcode-Editor selbst erstellt haben. Dieser Matchcode kann aus über 35 Komponenten beliebig kombiniert werden.

Zur Identifizierung von Dubletten stehen folgende Matchcode-Komponenten (Datentypen) zur Verfügung: +

  • Präfix
  • Vorname
  • zweiter Vorname
  • Nachname
  • Suffix
  • Geschlecht
  • Erster/Spitzname
  • Zweiter/Spitzname
  • Abteilung/Titel
  • Unternehmen
  • Abkürzung der Firma
  • Hausnummer
  • Straße prä-direktional
  • Straßenname
  • Straßensuffix
  • Straße Postdirektional
  • Postfach
  • Adresszusatz
  • Adresse
  • Stadt
  • Bundesland/Provinz
  • ZIP9
  • ZIP5
  • ZIP+4
  • Postleitzahl
  • Land
  • Telefonnummer/Faxnummer
  • E-Mail-Adresse
  • Kreditkartennummer
  • Datum
  • Numerisch
  • Nachbarschaft
  • Allgemeine Identität
Data Deduplication - How MatchUp Works - Germany
Data Deduplication - Fuzzy Matching - Germany

Fuzzy Matching

MatchUp® kombiniert Melissas fundiertes Domainwissen über Kontaktdaten mit über 20 Fuzzy-Matching-Algorithmen, um ähnliche Datensätze abzugleichen und die Datenbank schnell zu entlasten.

MatchUp® verwendet die folgenden Fuzzy-Matching-Algorithmen, um "nicht genau übereinstimmende" Dubletten zu identifizieren: +

  • Phonetex
  • Soundex
  • Containment
  • Häufigkeit
  • Fast Near
  • Accurate Near
  • Frequency Near
  • UTF-8 Near
  • Nur Vokale
  • Nur Konsonanten
  • Nur alphabetische Buchstaben
  • Nur Nummern
  • MD Keyboard
  • Jaro
  • Jaro-Winkler
  • N-Gramm
  • Needleman-Wunsch
  • Dice-Koeffizient
  • Smith-Waterman-Gotoh
  • Jaccard-Koeffizient
  • Overlap Coefficient
  • Longest Common Substring
  • Double MetaPhone

Globale Zusammenführung

Die World Edition von MatchUp® unterstützt 12 Länder, darunter Kanada, Deutschland, Großbritannien und Australien. MatchUp's® fortgeschrittene Deduplizierung kann diakritische Gegenstücke zu lateinischen Zeichen erkennen und Schlüsselwörter interpretieren, die identisch sind, jedoch unterschiedlich geschrieben sind (z.B. Deutschland und DEU).

Data Deduplication - Global Merge / Purge & Deduping - Germany
Data Deduplication - Unique Matching Scenarios - Germany

Einzigartige Matching-Möglichkeiten

MatchUp® verfügt über einige einzigartige Attribute, mit deren Hilfe Dubletten auf interessante Weise identifiziert werden können.

1. Survivorship/Golden Record

+

Automatisierte und intelligente Auswahl des “Golden Records” über die Bewertung der Datenqualität und andere Algorithmen. Verfügbar in Microsoft SQL Server Integration Services (SSIS) und Pentaho PDI.

2. Proximity Matching

+

Der patentierte Distanz-Algorithmus von MatchUp® verwendet Breiten- und Längengrade, um Dubletten zu identifizieren, die räumlich nah beieinander liegen. Mithilfe von Standortattributen kann MatchUp® beispielsweise übereinstimmende Datensätze an verschiedenen Adressen (z.B. einem Unternehmen mit zwei verschiedenen Eingängen) erkennen und verlinkt diese Beziehung mit einer Toolbox von Fuzzy-Algorithmen und match thresholds.

3. Householding

+

Wenn ein Kunde drei oder vier Kataloge von Ihnen an einem Tag erhält, weil ihn alle Erwachsenen in dem Haushalt auf Ihrer Website bestellt haben, hinterlässt dies einen schlechten Eindruck. Mit MatchUp® können Sie Datensätze in Ihren Datenbanken identifizieren, die zu einem Haushalt, einem Unternehmen oder einer Organisation gehören. Die Versandkosten reduzieren sich, denn überzählige Aussendungen werden hinfällig. MatchUp® führt mehrere Datensätze, die zu einem Empfänger gehören, in einen einzigen zusammen und gibt Ihnen die notwendigen Informationen, um den damit verknüpften Gesamtumsatz zu ermitteln.

Drei Möglichkeiten, Dubletten aus Ihren Daten zu entfernen

1. Lesen/Schreiben

+

Vergleicht Datensätze in einer oder mehreren Datenbanken gleichzeitig. Jede einzelne Gruppe erhält einen Datensatz, der einen „Output“-Status erhält. Die anderen passenden Datensätze erhalten einen „Dubletten“-Status. Eignet sich ideal für das Zusammenführen, Bereinigen und Unterdrücken bestehender Daten in der Stapelverarbeitung.

2. Inkrementelle Dublettenentfernung

+

Vergleicht jeden eingehenden Datensatz mit einer Datenbank, die bereits verarbeitete Datensätze beinhaltet. Eignet sich ideal für die Dateneingabe in Echtzeit. Wenn der eingehende Datensatz neu ist, wird er der bestehenden Datenbank hinzugefügt.

3. Hybride Dublettenentfernung

+

Gibt Ihnen die Flexibilität, den Prozess dann anzupassen, wenn in Ihrer Umgebung eine interne Schlüsselspeicherung oder kleinere Einheiten von Datensätzen verglichen werden müssen. Ideal für Dateneingabe in Echtzeit oder zur Stapelverarbeitung.

Data Deduplication - Three Ways to Dedupe Your Data - Germany

Fordern Sie eine Testversion an

Für eine kostenlosen Test der Dublettenprüfung bitte einfach das Formular ausfüllen!

  • 30 Tage kostenfreie Testversion
  • Uneingeschränkter technischer Support
  • 120-Tage ROI Versprechen

Hilfreiche Ressourcen

Video

MatchUp® - A Data Matching & Record Linking Engine

Video hier ansehen
Whitepaper

Golden Records are Key to Solid Data Quality

Whitepaper hier herunterladen