[发明专利]数据泛化方法、装置、设备和介质有效
申请号: | 201910015940.0 | 申请日: | 2019-01-08 |
公开(公告)号: | CN109740161B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 周环宇;冯欣伟;余淼 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/247 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 泛化 方法 装置 设备 介质 | ||
本发明实施例公开了一种数据泛化方法、装置、设备和介质,涉及数据处理技术领域。该方法包括:根据各检索项中的词语,对包括待泛化的目标检索项和历史检索项的检索项集进行分组;根据分组结果,从历史检索项中确定所述目标检索项的泛化检索项。本发明实施例提供了一种数据泛化方法、装置、设备和介质,实现了对待泛化的检索项进行合理和广泛的泛化。
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种数据泛化方法、装置、设备和介质。
背景技术
表述同一语义的检索项(query)往往具有不止一种表述形式,如何尽可能多的挖掘这些表述形式就是对query的泛化。
当前对query的泛化主要是基于同义词进行关键词的替换。
然而,尽管使用关键词替换能够解决一部分的泛化,但是这些泛化还不够全面。毕竟关键词替换可以解决的问题的是有限的,但是人总可能想出一些意想不到的提问方式。
此外,关键词替换在特定主语情况下也可能出现错误。比如在绝大多数情况下“谁”和“哪个人”是等义的。但是比如对于“2018足球世界杯冠军是谁”,泛化为“2018足球世界杯冠军是哪个人”显然是不合适的。
发明内容
本发明实施例提供一种数据泛化方法、装置、设备和介质,以实现对待泛化的检索项进行合理和广泛的泛化。
第一方面,本发明实施例提供了一种数据泛化方法,该方法包括:
根据各检索项中的词语,对包括待泛化的目标检索项和历史检索项的检索项集进行分组;
根据分组结果,从历史检索项中确定所述目标检索项的泛化检索项。
第二方面,本发明实施例还提供了一种数据泛化装置,该装置包括:
分组模块,用于根据各检索项中的词语,对包括待泛化的目标检索项和历史检索项的检索项集进行分组;
泛化模块,用于根据分组结果,从历史检索项中确定所述目标检索项的泛化检索项。
第三方面,本发明实施例还提供了一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的数据泛化方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的数据泛化方法。
本发明实施例通过根据各检索项中的词语,对包括待泛化的目标检索项和历史检索项的检索项集进行分组,从而实现对目标检索项的广泛泛化。通过根据分组结果,从历史检索项中确定所述目标检索项的泛化检索项,从而使得泛化检索项符合用户提问逻辑,避免直接替换导致泛化的检索项不合理的情况。
附图说明
图1为本发明实施例一提供的一种数据泛化方法的流程图;
图2是本发明实施例二提供的一种数据泛化方法的流程图;
图3是本发明实施例三提供的一种数据泛化方法的流程图;
图4是本发明实施例四提供的一种数据泛化方法的流程图;
图5是本发明实施例四提供的一种数据泛化方法的另一种流程描述示意图;
图6是本发明实施例五提供的一种数据泛化装置的结构示意图;
图7为本发明实施例六提供的一种设备的结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910015940.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于人工智能语义分析的任务发布方法
- 下一篇:文本表示方法、装置及介质
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置