Identifiziert und entfernt Dubletten - MatchUp®

Im Durchschnitt enthält eine Datenbank 8% - 10% Dubletten. Diese Duplikate führen zu Verschwendung und Unwirksamkeit, aber über anpassbare Kriterien in MatchUp® erhalten Sie eine einzige, exakte Sicht auf jeden Kunden.

Melissas MatchUp® ist die leistungsfähigste, genaueste und schnellste Lösung auf dem Markt, um das Problem der Dubletten in Dateien zu bekämpfen. Was es von den anderen unterscheidet, ist seine intelligente Analysefähigkeit, um die verschiedenen Komponenten von nationalen und internationalen Adressen zu verstehen und zu analysieren. Durch die Kombination von fundiertem Domainwissen über internationale Adressformate und fortschrittlichen Fuzzy-Matching-Techniken haben Sie mit MatchUp® die Möglichkeit, selbst die am schwierigsten zu erkennenden Dubletten zu identifizieren und zusammenzuführen.

  • Genauere, umfassende Ansicht Ihrer Kundendaten
  • Identifizierung mehrerer Datensätze, die zu einer Adresse gehören - spart Zeit und Geld
  • Reduzierung von Porto- und Versandkosten, da durch MatchUp® Dubletten vermieden werden
Testen Sie unsere Dublettenprüfung!
Testen Sie unsere Dublettenprüfung Jetzt testen!

Wie MatchUp® funktioniert

Mit MatchUp® können Sie Dubletten in Ihren Datenbanken identifizieren und durch Zuordnungsregeln, sogenannte Matchchodes, herausfinden, ob die zu einem Haushalt, einem Unternehmen oder einer Organisation gehören. MatchUp® verwendet einen vordefinierten Matchcode oder einen, den Sie mit dem Matchcode-Editor selbst erstellt haben. Dieser Matchcode kann aus über 35 Komponenten beliebig kombiniert werden.

Zur Identifizierung von Dubletten stehen folgende Matchcode-Komponenten (Datentypen) zur Verfügung: +

  • Präfix
  • Vorname
  • zweiter Vorname
  • Nachname
  • Suffix
  • Geschlecht
  • Erster/Spitzname
  • Zweiter/Spitzname
  • Abteilung/Titel
  • Unternehmen
  • Abkürzung der Firma
  • Hausnummer
  • Straße prä-direktional
  • Straßenname
  • Straßensuffix
  • Straße Postdirektional
  • Postfach
  • Adresszusatz
  • Adresse
  • Stadt
  • Bundesland/Provinz
  • ZIP9
  • ZIP5
  • ZIP+4
  • Postleitzahl
  • Land
  • Telefonnummer/Faxnummer
  • E-Mail-Adresse
  • Kreditkartennummer
  • Datum
  • Numerisch
  • Nachbarschaft
  • Allgemeine Identität
So funktioniert Melissa's Lösung MatchUp®
Jetzt kostenlose Demo anfordern!
Nutzung von Fuzzy-Matching-Algorithmen

Fuzzy Matching

MatchUp® kombiniert Melissas fundiertes Domainwissen über Kontaktdaten mit über 20 Fuzzy-Matching-Algorithmen, um ähnliche Datensätze abzugleichen und die Datenbank schnell zu entlasten.

MatchUp® verwendet die folgenden Fuzzy-Matching-Algorithmen, um "nicht genau übereinstimmende" Dubletten zu identifizieren: +

  • Phonetex
  • Soundex
  • Containment
  • Häufigkeit
  • Fast Near
  • Accurate Near
  • Frequency Near
  • UTF-8 Near
  • Nur Vokale
  • Nur Konsonanten
  • Nur alphabetische Buchstaben
  • Nur Nummern
  • MD Keyboard
  • Jaro
  • Jaro-Winkler
  • N-Gramm
  • Needleman-Wunsch
  • Dice-Koeffizient
  • Smith-Waterman-Gotoh
  • Jaccard-Koeffizient
  • Overlap Coefficient
  • Longest Common Substring
  • Double MetaPhone

Globale Zusammenführung

Die World Edition von MatchUp® unterstützt 12 Länder, darunter Kanada, Deutschland, Großbritannien und Australien. MatchUp's® fortgeschrittene Deduplizierung kann diakritische Gegenstücke zu lateinischen Zeichen erkennen und Schlüsselwörter interpretieren, die identisch sind, jedoch unterschiedlich geschrieben sind (z.B. Deutschland und DEU).

Die World Edition von MatchUp® unterstützt 12 Länder
Jetzt unverbindindlich & kostenlos testen!
Matching-Möglichkeiten: Survivorship/Golden Record, Proximity Matching, Householding

Einzigartige Matching-Möglichkeiten

MatchUp® verfügt über einige einzigartige Attribute, mit deren Hilfe Dubletten auf interessante Weise identifiziert werden können.

1. Survivorship/Golden Record

+

Automatisierte und intelligente Auswahl des “Golden Records” über die Bewertung der Datenqualität und andere Algorithmen. Verfügbar in Microsoft SQL Server Integration Services (SSIS) und Pentaho PDI.

2. Proximity Matching

+

Der patentierte Distanz-Algorithmus von MatchUp® verwendet Breiten- und Längengrade, um Dubletten zu identifizieren, die räumlich nah beieinander liegen. Mithilfe von Standortattributen kann MatchUp® beispielsweise übereinstimmende Datensätze an verschiedenen Adressen (z.B. einem Unternehmen mit zwei verschiedenen Eingängen) erkennen und verlinkt diese Beziehung mit einer Toolbox von Fuzzy-Algorithmen und match thresholds.

3. Householding

+

Wenn ein Kunde drei oder vier Kataloge von Ihnen an einem Tag erhält, weil ihn alle Erwachsenen in dem Haushalt auf Ihrer Website bestellt haben, hinterlässt dies einen schlechten Eindruck. Mit MatchUp® können Sie Datensätze in Ihren Datenbanken identifizieren, die zu einem Haushalt, einem Unternehmen oder einer Organisation gehören. Die Versandkosten reduzieren sich, denn überzählige Aussendungen werden hinfällig. MatchUp® führt mehrere Datensätze, die zu einem Empfänger gehören, in einen einzigen zusammen und gibt Ihnen die notwendigen Informationen, um den damit verknüpften Gesamtumsatz zu ermitteln.

Drei Möglichkeiten, Dubletten aus Ihren Daten zu entfernen

1. Lesen/Schreiben

+

Vergleicht Datensätze in einer oder mehreren Datenbanken gleichzeitig. Jede einzelne Gruppe erhält einen Datensatz, der einen „Output“-Status erhält. Die anderen passenden Datensätze erhalten einen „Dubletten“-Status. Eignet sich ideal für das Zusammenführen, Bereinigen und Unterdrücken bestehender Daten in der Stapelverarbeitung.

2. Inkrementelle Dublettenentfernung

+

Vergleicht jeden eingehenden Datensatz mit einer Datenbank, die bereits verarbeitete Datensätze beinhaltet. Eignet sich ideal für die Dateneingabe in Echtzeit. Wenn der eingehende Datensatz neu ist, wird er der bestehenden Datenbank hinzugefügt.

3. Hybride Dublettenentfernung

+

Gibt Ihnen die Flexibilität, den Prozess dann anzupassen, wenn in Ihrer Umgebung eine interne Schlüsselspeicherung oder kleinere Einheiten von Datensätzen verglichen werden müssen. Ideal für Dateneingabe in Echtzeit oder zur Stapelverarbeitung.

DDrei Möglichkeiten, Dubletten aus Ihren Daten zu entfernen
Fordern Sie eine Testversion für die Dublettenprüfung an

Fordern Sie eine Testversion an

Für eine kostenlosen Test der Dublettenprüfung bitte einfach das Formular ausfüllen!

  • 30 Tage kostenfreie Testversion
  • Uneingeschränkter technischer Support
  • 120-Tage ROI Versprechen
Jetzt kostenlose Testversion anfordern!

Hilfreiche Ressourcen

Video Video:  Data Match Up

Data Match

Video hier ansehen
Video Video: MatchUp – A Data Matching & Record Linking Engine

MatchUp® - A Data Matching & Record Linking Engine

Video hier ansehen
Whitepaper Whitepaper: Golden Records are Key to Solid Data Quality

Golden Records are Key to Solid Data Quality

Whitepaper hier herunterladen

Frequently Asked Questions

Was ist eine Dublettenprüfung?

Als Dublettenprüfung bezeichnet man die Identifizierung und Zusammenführung von doppelten Datensätzen (oder auch Duplikate). Dafür haben wir eigens über 20 Fuzzy-Matching-Algorithmen entwickelt.

Welche Vorteile bietet die Dublettenprüfung?

  • Umfassende Ansicht Ihrer Kundendaten
  • Einsparung von Zeit & Geld durch die Beseitigung von doppelten Datensätzen
  • Reduzierung von Porto- und Versandkosten

Wie funktioniert die Dublettenprüfung? Und wie kann ich diese nutzen?

Die Dublettenlösung nennt sich MatchUp® und ist einfach in Ihr System integrierbar. Diese Lösung identifiziert Dubletten in Ihren Datenbanken und fügt diese, durch sogenannten Matchcodes (Zuordnungsregeln), zusammen. Sie haben die Möglichkeit einen vordefinierten Matchcode auszuwählen oder sich selbst einen zu erstellen. Dafür stehen Ihnen 35 Komponenten zur Verfügung. Außerdem gibt es eine erweiterte Technologie, die es ermöglicht Datensätze zu einem „Golden Record“ zu konsolidieren.

Die Dublettenprüfung können Sie ganz einfach, mit vorinstallierten Fuzzy-Algorithmen, on-premise implementieren. Die Lösung können Sie sowohl im Echtzeit-Modus als auch im Batch (Stapelverarbeitung) einsetzen. Alternativ können Sie uns Ihre Datei auch zur Verfügung stellen und wir bereinigen diese als Dienstleistung (Service Bureau) für Sie.

Für welche Länder kann ich Melissa‘s Dublettenprüfung nutzen?

Die World Edition von MatchUp® unterstützt 12 Länder, darunter Kanada, Deutschland, Großbritannien und Australien. Eine Übersicht finden Sie hier.