[发明专利]识别质量管理有效
申请号: | 201780046543.9 | 申请日: | 2017-07-14 |
公开(公告)号: | CN109844785B | 公开(公告)日: | 2023-01-24 |
发明(设计)人: | C·鲍威尔;J·廷德尔;B·沃尔什;S·戴维斯 | 申请(专利权)人: | 安客诚有限责任公司 |
主分类号: | G06Q10/10 | 分类号: | G06Q10/10;G06Q30/02;G16H10/60;G06F16/215 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 陈斌 |
地址: | 美国阿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 质量管理 | ||
识别质量管理系统和方法被用于为包含关于对象的数据结构的数据库确定最终组质量评分(FGQG),其中FGQG是表明在数据库内发生的识别的质量的单个数字分数。使用包含至少三个分量的加权算法来计算FGQG:由字符串距离计算确定的字符串质量分数(SQS);由地址置信码确定的输入质量分数(IQS);以及评估关键字段以确定分组质量的链接质量分数(LQS)。该系统和方法允许跨整个数据库的对识别质量的确定而不是使用采样和外推,并且从而导致更高质量的结果,并且因为该系统和方法是客观的,所以其允许在跨竞争的识别质量解决方案之间进行识别质量的比较。
技术领域
本发明的领域是确定应用于对象数据库(诸如包含各自属于人、家庭、商业等的数据结构的数据库)的识别解决方案的质量。
背景技术
数据“识别”可以被定义为一种过程,通过该过程,数据库中的数据结构的集合(诸如记录)被识别为关于同一对象,并且因此那些数据结构被放置在同一组中。例如,给定包含数亿个记录的营销数据库,其中每条记录都关于个人客户,识别可被应用以确定这些记录中的某些记录实际上关于同一客户,即使那些记录中的数据可能不相同。在一个简单的例子中,数据识别可被用于确定都具有相同的地址的名为Jimmy Smith的人和名为JamesR.Smith的人实际上是同一个人,即使对于这个人在数据库中存在两条单独的记录。其他具体的例子包括识别记录关于同一个人,即使那些记录包含不同的姓氏(诸如当一个女人在结婚后更改她的姓氏时)、具有不同地址但相同或相似名字的人(诸如体现在近期的搬家)以及由于个人收入或兴趣的变化而具有不同“倾向”(例如,对特定产品或服务或产品或服务的类别喜爱)的人。识别不仅限于客户,并且可被应用于家庭、商业或任何其他对象类,其中数据库包含可能关于同一对象的多条记录或其他数据结构。
继续营销数据库的例子,高质量组可包括特征,诸如足够相似的商业名称和联系信息;足够相似的地址信息;以及其他信息相似性(诸如电话号码、帐号和电子邮件帐户)。相比之下,低质量组以此类数据的差异为特征,其中可行的现存信息不足以确认记录实际上一起属于同一组。低质量组的特征可包括完全不相似的商业名称或联系信息(诸如完全不同的商业名称)、完全相似的地址信息(诸如具有不同套房号、公寓号、街道号、街道名、邮政编码或ZIP+4码的记录)或不足的或不同的其他现存信息(诸如不同的或缺失的电话号码、帐号或电子邮件帐号)。
数据识别在许多行业中具有重要价值。例如,在营销数据库关于客户的情况下,数据识别提供有效的客户标识以创建客户的“单一视图”,从而增加零售商与该客户的互动将为该客户带来积极体验的机会,并且从而推动零售商的销售增长。使用这种单一视图,零售商更好地理解了其与客户的关系,可以能够通过更多的营销渠道与客户接触,并且可以更准确地标识将被客户视为合乎需要的交叉销售机会。营销人员通常不确切地知道他们的客户是谁,因此他们往往无法有效地接触他们的目标受众。随着营销技术的改进,营销人员逐渐认识到,线上营销渠道(电子邮件、社交媒体、网站等)和线下营销渠道(诸如店内营销)实际上是一个单一的营销生态系统;数据识别提高了营销人员利用这些新技术的能力。
准确的数据识别带来了许多挑战。举例来说,那些挑战包括如下:信息(诸如关于客户的信息)可能处于不断变化的状态;
实现识别解决方案可能成本高昂;用于处理诸如客户之类的数据对象的商业策略(即,商业“规则”)可能随时间不断地修改,因此在每次变更之后需要对数据识别解决方案进行变更;创建包含所有必要信息以执行合理准确的识别的初始数据库可能成本高昂,因为该初始数据库可能在许多情况下包含数亿条记录或甚至更多;并且事实是对识别解决方案的每次变更必须被全面地测试和审计,以确保变更实际上不会对识别结果产生负面影响。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安客诚有限责任公司,未经安客诚有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780046543.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于引导人类执行的库存任务的自适应过程
- 下一篇:使用协作图的协作者推荐
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理