快速识别和消除重复记录

一个数据库平均包含8-10%的重复记录。这些重复记录会导致浪费和效率低下,并影响您获得单一、准确的客户视图的能力。

Melissa是市场上解决重复记录问题非常强大、非常准确的数据匹配和删除解决方案,其与众不同之处在于它的智能解析能力,能够理解和解析国内和国际地址的各种组成部分。通过结合国际地址格式的深度专业领域知识和先进的模糊匹配技术,MatchUp使您能够识别和合并/清除哪怕是最难以发现的重复记录。

  • 消除妨碍形成清晰客户视图的杂乱数据和重复记录
  • 提高您的数据库的准确性,为您节省时间和资金
  • 通过使用先进的匹配技术消除重复记录,以减少邮费和邮寄成本
我们用MatchUp比先前使用的其它软件多识别了10%以上的重复记录。 EDA公司Scott Campbell

MatchUp如何工作?

MatchUp利用一个匹配代码来确定是否应将两条记录视为重复记录。MatchUp使用一个预先定义的匹配代码,或使用客户用匹配代码编辑器创建的一个代码。

下列匹配代码组件(数据类型)可用于识别重复记录:

  • 前缀
  • 中名
  • 后缀
  • 性别
  • 名/昵名
  • 中名/昵名
  • 部门/职务
  • 公司
  • 公司首字母缩略名
  • 街道编号
  • 街道预定向
  • 街道名称
  • 街道后缀
  • 街道后定向
  • 邮政信箱™
  • 二级街道
  • 地址
  • 城市
  • 州/省
  • ZIP9
  • ZIP5
  • ZIP+4®
  • Postal Code
  • 邮政编码
  • 国家
  • 电话号码/传真号码
  • 电子邮件地址
  • 信用卡号
  • 日期
  • 数字
  • 邻近度
  • 一般身份
Data Deduplication - How MatchUp Works
Data Deduplication - Fuzzy Matching

模糊匹配

MatchUp结合了Melissa在联系人数据专业领域的深度知识与20多种模糊匹配算法,以匹配相似数据,对客户数据库进行快速去重。

MatchUp运用下列模糊匹配算法来识别“非精确匹配”的重复记录:

  • Phonetex
  • Soundex
  • 包含
  • 频次
  • 快接近
  • 精确接近
  • 频次接近
  • UTF-8接近
  • 仅元音
  • 仅辅音
  • 仅字母
  • 仅数字
  • MD键盘
  • Jaro
  • 字符串相似度
  • n-Gram
  • Needleman-Wunch
  • Dice系数
  • Smith-Waterman-Gotoh
  • Jaccard相似系数
  • 重叠系数
  • 最长公共子串
  • 双语音匹配

全球合并/清除和删除

世界版MatchUp支持包括加拿大、德国、英国和澳大利亚在内的12个国家。MatchUp的高级删除功能能够识破拉丁字符的发音同等物,解释含义相同但拼写不同的关键词(比如,德国和DEU)。

Data Deduplication - Global Merge / Purge & Deduping
Data Deduplication - Unique Matching Scenarios

独特的匹配场景

MatchUp具有某些独特的属性,可采用一些有趣的方式利用其帮助识别重复记录。

1.黄金记录创建的生存

Matchup能够从多条记录中选择最好的元素来进行整合,非常适合为单一客户视图创建黄金记录。可用于Microsoft SQL Server集成服务(SSIS)和Pentaho数据集成。

2.邻近度匹配

MatchUp的专利距离算法使用经纬度坐标和邻近度阈值来识别地理位置靠近的重复记录。例如,使用位置属性,MatchUp可以检测到不同地址(例如,一个有两个不同入口的公司)之间在规定距离内的匹配记录。

3.家庭关系

MatchUp能够识别和合并属于同一家庭成员的记录,以便更好地了解客户关系、生命周期和需求。您也可以使用MatchUp将多个业务账户整合到“企业家族”中,以构建洞察力,更好地评估总体销售关系。也可以利用家庭关系来消除不必要的多次邮寄给同一住户,以减少打印、制作和邮资浪费。

三种方式删除您的重复数据

MatchUp提供三种操作方法(或匹配记录方式):

1.读取/写入删除

同时对比一个或多个数据库中的记录。每个唯一的群组将有一条记录,接收一个“输出”状态;其它匹配的记录接收一个“重复”状态。非常适合一次匹配整个数据库。

2.增量删除

通过将每条记录(如来自web表单或呼叫中心)与现有的主数据库进行实时匹配。如果传入的记录不是重复记录,则可以将其添加到数据库中。

3.混合删除

结合前两种方法,并具有自定义流程的灵活性,以便根据一小部分潜在匹配的集群匹配传入的记录。使用混合删除法,您可以以专有的方式存储匹配键。非常适合与实时数据输入或批处理整个列表。

Data Deduplication - Three Ways to Dedupe Your Data

准备开始了吗?

开始咨询

今天就提高你的客户数据质量。

联系我们
探索API

发现Melissa应用程序接口(APIs),代码和文档示例。

了解更多
试用列表软件

使用我们的在线数据清理应用程序或Excel插件。

开始免费试用
使用我们的服务局

全方位服务数据处理,以清理、去重和富集。

请将文档发送给我们

有用的资源

视频

数据匹配/匹配

现在观看
视频

匹配

现在观看
白皮书

黄金记录是数据质量的关键

现在阅读