[发明专利]日语关键词组生成方法、装置、电子设备、存储介质有效
| 申请号: | 202010279327.2 | 申请日: | 2020-04-10 |
| 公开(公告)号: | CN111506704B | 公开(公告)日: | 2023-09-12 |
| 发明(设计)人: | 梅陈;申思;肖铨武 | 申请(专利权)人: | 上海携程商务有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36 |
| 代理公司: | 上海隆天律师事务所 31282 | 代理人: | 潘一诺 |
| 地址: | 200335 上海市长*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 日语 关键 词组 生成 方法 装置 电子设备 存储 介质 | ||
本发明提供一种日语关键词组生成方法、装置、电子设备、存储介质,日语关键词组生成方法包括:自第一系统获取第一日语关键词;自搜索系统获取用户输入的日语检索信息;根据所述日语检索信息获取第二日语关键词;根据所述日语检索信息提取关键词模板;将所述第一日语关键词和第二日语关键词加入一日语字典;以及根据所述日语字典及所述关键词模板生成日语关键词组。本发明提供的日语关键词组生成方法及装置对日语字典进行补充同时提高关键词组与用户搜索信息的匹配度。
背景技术
随着互联网技术的发展,越来越多的用户会选择使用搜索引擎,进行酒店等产品的检索,并通过搜索引擎提供的匹配结果,对酒店等产品进行线上预订。随着酒店预订的国际化趋势,用户可在酒店预订网站上订购国内外各种酒店。目前,对于国内的酒店预订平台可以向搜索引擎的日本站点提供搜索关键词,以吸引越来越多的国际用户通过国内的酒店预订平台进行酒店预订。提供的关键词与用户的搜索信息越接近,搜索引擎提供的内容就越接近用户的意图,用户的点击率或下单率就越高。提供精准的关键词可以有效的提高国内的酒店预订平台的酒店预订点击率或下单率。
目前,搜索引擎的日本站点的用户多是日本本地用户,这部分用户一般使用日语进行酒店的检索。而现有的开源的日语字典较少。同时,现有技术存在如下问题,1)日语中的假名太多,一个词可以有多种写法;2)现有的开源的日语分词模型效果并不理想;3)目前并没有日语的关键词模板,需要提取有效的关键词模板;4)已有的日语字典较少,需要进一步完善字典。
由此,如何解决上述问题,在对日语字典进行补充的同时提高的关键词组与用户搜索信息的匹配度是本领域技术人员亟待解决的问题。
发明内容
本发明为了克服上述现有技术存在的缺陷,提供一种日语关键词组生成方法、装置、电子设备、存储介质,以解决或缓解上述现有技术存在的缺陷。
根据本发明的一个方面,提供一种日语关键词组生成方法,包括:
自第一系统获取第一日语关键词;
自搜索系统获取用户输入的日语检索信息;
根据所述日语检索信息获取第二日语关键词;
根据所述日语检索信息提取关键词模板;
将所述第一日语关键词和第二日语关键词加入一日语字典;以及
根据所述日语字典及所述关键词模板生成日语关键词组。
在本发明的一些实施例中,所述第一日语关键词包括第一日语位置名称、第一日语兴趣点名称及第一日语酒店名称;所述第二日语关键词包括第二日语位置名称、第二日语兴趣点名称及第二日语酒店名称,所述第一系统为提供酒店服务的线上系统。
在本发明的一些实施例中,所述日语关键词组用于发送至所述搜索系统,所述搜索系统响应于用户实时输入的日语检索信息与所述日语关键词组的匹配度,向用户提供所述第一系统的链接。
在本发明的一些实施例中,所述自第一系统获取第一日语关键词包括:
自所述第一系统直接获取第一日语关键词;和/或
对所述第一系统获取的日语词组进行分词获取所述第一日语关键词,
对应地,所述根据所述日语检索信息获取第二日语关键词包括:
对所述日语检索信息进行分词获取所述第二日语关键词。
在本发明的一些实施例中,所述关键词模板用作对所述日语词组和/或所述日语检索信息进行分词的分词模型。
在本发明的一些实施例中,所述根据所述日语检索信息提取关键词模板包括:
根据所述日语检索信息提取多个候选关键词模板;
根据提升度筛选所述候选关键词模板,以生成频繁项集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海携程商务有限公司,未经上海携程商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010279327.2/2.html,转载请声明来源钻瓜专利网。





