[发明专利]日语关键词组生成方法、装置、电子设备、存储介质有效
| 申请号: | 202010279327.2 | 申请日: | 2020-04-10 |
| 公开(公告)号: | CN111506704B | 公开(公告)日: | 2023-09-12 |
| 发明(设计)人: | 梅陈;申思;肖铨武 | 申请(专利权)人: | 上海携程商务有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36 |
| 代理公司: | 上海隆天律师事务所 31282 | 代理人: | 潘一诺 |
| 地址: | 200335 上海市长*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 日语 关键 词组 生成 方法 装置 电子设备 存储 介质 | ||
1.一种日语关键词组生成方法,其特征在于,包括:
自第一系统获取第一日语关键词;
自搜索系统获取用户输入的日语检索信息;
根据所述日语检索信息获取第二日语关键词;
根据所述日语检索信息提取关键词模板,包括:根据所述日语检索信息提取多个候选关键词模板,根据提升度筛选所述候选关键词模板,以生成频繁项集,根据所述频繁项集内各候选关键词模板的第一回报参数,确定关键词模板,其中,提升度lift(x,y)根据如下公式计算:
所述提升度可以根据支持度和置信度计算,其中,支持度support(x,y)根据如下公式计算:
置信度confidence(x,y)和confidence(y,x)根据如下公式计算:
将所述第一日语关键词和第二日语关键词加入一日语字典;以及
根据所述日语字典及所述关键词模板生成日语关键词组。
2.如权利要求1所述的日语关键词组生成方法,其特征在于,所述第一日语关键词包括第一日语位置名称、第一日语兴趣点名称及第一日语酒店名称;所述第二日语关键词包括第二日语位置名称、第二日语兴趣点名称及第二日语酒店名称,所述第一系统为提供酒店服务的线上系统。
3.如权利要求2所述的日语关键词组生成方法,其特征在于,所述日语关键词组用于发送至所述搜索系统,所述搜索系统响应于用户实时输入的日语检索信息与所述日语关键词组的匹配度,向用户提供所述第一系统的链接。
4.如权利要求1至3任一项所述的日语关键词组生成方法,其特征在于,
所述自第一系统获取第一日语关键词包括:
自所述第一系统直接获取第一日语关键词;和/或
对所述第一系统获取的日语词组进行分词获取所述第一日语关键词,
对应地,所述根据所述日语检索信息获取第二日语关键词包括:
对所述日语检索信息进行分词获取所述第二日语关键词。
5.如权利要求4所述的日语关键词组生成方法,其特征在于,所述关键词模板用作对所述日语词组和/或所述日语检索信息进行分词的分词模型。
6.如权利要求1至3任一项所述的日语关键词组生成方法,其特征在于,所述根据所述日语字典及所述关键词模板生成日语关键词组包括:
根据所述第一系统及所述搜索系统的历史数据,确定用于生成所述日语关键词组的第一准日语关键词;
根据所述关键词模板及第一准日语关键词,自所述日语字典中查找第二准日语关键词,所述第一准日语关键词及所述第二准日语关键词的组合符合所述关键词模板;
至少将所述第一准日语关键词及所述第二准日语关键词按所述关键词模板组合为日语关键词组。
7.一种日语关键词组生成装置,其特征在于,包括:
第一获取模块,用于自第一系统获取第一日语关键词;
第二获取模块,用于自搜索系统获取用户输入的日语检索信息;
第三获取模块,用于根据所述日语检索信息获取第二日语关键词;
提取模块,用于根据所述日语检索信息提取关键词模板,包括:根据所述日语检索信息提取多个候选关键词模板;根据提升度筛选所述候选关键词模板,以生成频繁项集;根据所述频繁项集内各候选关键词模板的第一回报参数,确定关键词模板;其中,提升度lift(x,y)根据如下公式计算:
所述提升度可以根据支持度和置信度计算,其中,支持度support(x,y)根据如下公式计算:
置信度confidence(x,y)和confidence(y,x)根据如下公式计算:
添加模块,用于将所述第一日语关键词和第二日语关键词加入一日语字典;以及
生成模块,用于根据所述日语字典及所述关键词模板生成日语关键词组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海携程商务有限公司,未经上海携程商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010279327.2/1.html,转载请声明来源钻瓜专利网。





