[发明专利]一种数据处理方法、装置、设备及介质在审
申请号: | 202110094371.0 | 申请日: | 2021-01-23 |
公开(公告)号: | CN114791973A | 公开(公告)日: | 2022-07-26 |
发明(设计)人: | 蒋卓;林绍令 | 申请(专利权)人: | 北京猎户星空科技有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F40/242;G06F40/247;G06F40/279;G06F40/194 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 张恺宁 |
地址: | 100025 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 设备 介质 | ||
本发明公开了一种数据处理方法、装置、设备及介质,用以解决现有在特定的业务场景下所确定的同义词不适合该指定业务场景、可利用率低的问题。由于预先根据适用指定业务场景的业务词语及业务词语对应的同义词,确定该指定业务场景的业务词典。后续在确定目标同义词的过程中,根据待处理语句中包含的目标词语以及预先配置的业务词典中包含的每个业务词语,确定该目标词语匹配的业务词语,并根据该业务词语对应的同义词,即可确定目标词语对应的第一同义词,使得后续根据该目标词语对应的第一同义词,所确定的目标同义词可以充分适用于指定业务场景,一定程度上满足用户在指定业务场景的需求,有利于提高目标同义词在指定业务场景下的利用率。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种数据处理方法、装置、设备及介质。
背景技术
当用户在使用搜索引擎进行搜索时,比如店铺搜索、商品搜索等,为了能够确定用户所输入的语句(query)中包含的词语的同义词,并将与该同义词相匹配的网页也包含在搜索结果中召回,会用到基于同义词的query扩展,即在利用query进行搜索的同时也利用query的同义词进行搜索。为了在搜索引擎中应用该技术,同义词的挖掘是非常重要的基础工作。
现有技术中,为了实现同义词的挖掘,在获取到用户输入待处理语句之后,获取该待处理语句中包含的目标词语。根据预先配置的词向量库,确定目标词语的同义词。
对于该种方法,由于其直接根据词语的词向量之间的相似度,确定同义词,该同义词没有考虑到当前智能设备所在的业务场景,使得确定的同义词可能不适合实际应用场景,可利用率低。
发明内容
本发明实施例提供了一种数据处理方法、装置、设备及介质,用以解决现有在特定的业务场景下所确定的同义词不适合该指定业务场景、可利用率低的问题。
本发明实施例提供了一种数据处理方法,所述方法包括:
获取智能设备采集的待处理语句中包含的目标词语;
根据所述智能设备对应的业务词典,确定所述目标词语匹配的业务词语,并将所述业务词语对应的同义词,确定为所述业务词语对应的目标词语的第一同义词,其中,所述业务词典中包含适用指定业务场景的业务词语及所述业务词语对应的同义词;
根据所述目标词语的第一同义词,确定目标同义词。
本发明实施例提供了一种数据处理装置,所述装置包括:
获取单元,用于获取智能设备采集的待处理语句中包含的目标词语;
处理单元,用于根据所述智能设备对应的业务词典,确定所述目标词语匹配的业务词语,并将所述业务词语对应的同义词,确定为所述业务词语对应的目标词语的第一同义词,其中,所述业务词典中包含适用指定业务场景的业务词语及所述业务词语对应的同义词;
确定单元,用于根据所述目标词语的第一同义词,确定目标同义词。
本发明实施例提供了一种电子设备,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如上述所述数据处理方法的步骤。
本发明实施例提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述数据处理方法的步骤。
在本发明实施例中,预先根据适用指定业务场景的业务词语及业务词语对应的同义词,确定该指定业务场景的业务词典。后续在确定目标同义词的过程中,根据待处理语句中包含的目标词语以及预先配置的业务词典中包含的每个业务词语,确定该目标词语匹配的业务词语,并根据该业务词语对应的同义词,即可确定目标词语对应的第一同义词,使得后续根据该目标词语对应的第一同义词,所确定的目标同义词可以充分适用于指定业务场景,一定程度上满足用户在指定业务场景的需求,有利于提高目标同义词在指定业务场景下的利用率。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京猎户星空科技有限公司,未经北京猎户星空科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110094371.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种稀疏存储单元内部物品的定位方法
- 下一篇:流体帆绿色高效自动发电机组