[发明专利]槽位填充方法及装置在审
申请号: | 202010014059.1 | 申请日: | 2020-01-07 |
公开(公告)号: | CN111274368A | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 游程;苏少炜;陈孝良;常乐 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/253;G06F40/242;G06F40/289;G06F40/295;G06F40/30 |
代理公司: | 北京竹辰知识产权代理事务所(普通合伙) 11706 | 代理人: | 聂鹏 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 填充 方法 装置 | ||
本公开公开了一种槽位填充方法、装置、电子设备和计算机可读存储介质。其中方法包括:根据第一用户指令确定用户意图;获取所述用户意图对应的槽位及所述槽位对应的槽位词典;根据所述槽位词典中的词语抽取所述第一用户指令中包含的命名实体;获取所述命名实体的上下文信息;根据所述上下文信息将所述命名实体填充在对应的槽位中。本公开实施例通过获取命名实体的上下文信息,根据命名实体的上下文信息,将所述命名实体填充在对应的槽位中,能够精确定位槽位,避免误填充。
技术领域
本公开涉及人工智能技术领域,特别是涉及一种槽位填充方法、装置和计算机可读存储介质。
背景技术
非定向领域的对话定制系统一直是自然语言处理(Natural LanguageProcessing,NLP)领域的热门问题,在该场景下,系统只能依据用户提供的少量样本话术进行意图识别,完成槽位填充。因此,如何基于少量样本在泛化的用户语句中进行槽位填充一直是一个比较关键的问题。
在现有技术中,根据槽位对应的词典构建词典树,对用户语句进行正向最大匹配提取,然后直接将词填入词典对应的槽位。例如:北京明天的天气怎么样?天气意图含有两个槽位地点和时间,分别对应地点词典和时间词典两个词典,然后从用户语句中获得北京这个地点直接填入地点槽位,获得明天这个时间直接填入时间槽位。
但是上述方法存在以下缺陷:
(1)一些情况下提取出的词其实并不对应槽位。例如:订机票意图涉及到出发时间槽位,对应时间词典。订一张明天的机票,这种情况下明天在时间词典中,可以直接填入出发时间槽位。但是,明天给我订一张机票,明天同样在时间词典中,但是不能填入出发时间槽位。
(2)无法解决一词典多槽位问题。例如:订机票意图涉及到出发城市和目的城市两个槽位,但是都对应到同一个地点词典,这时通过词典正向最大匹配识别出的地点无法准确定位到是哪一个槽位。
发明内容
提供该发明内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本公开解决的技术问题是提供一种槽位填充方法,以至少部分地解决现有技术中不能精确定位槽位的技术问题。此外,还提供一种槽位填充装置、槽位填充硬件装置、计算机可读存储介质和槽位填充终端。
为了实现上述目的,根据本公开的一个方面,提供以下技术方案:
一种槽位填充方法,包括:
根据第一用户指令确定用户意图;
获取所述用户意图对应的槽位及所述槽位对应的槽位词典;
根据所述槽位词典中的词语抽取所述第一用户指令中包含的命名实体;
获取所述命名实体的上下文信息;
根据所述上下文信息将所述命名实体填充在对应的槽位中。
进一步的,所述获取所述命名实体的上下文信息,包括:
根据所述命名实体对所述第一用户指令进行分词处理,得到分词结果;
根据所述分词结果获取位于所述命名实体前面的词语和后面的词语,将所述前面的词语和后面的词语作为所述命名实体的上下文信息。
进一步的,所述根据所述上下文信息将所述命名实体填充在对应的槽位中,包括:
将所述上下文信息组成语句;
根据所述语句确定与所述命名实体匹配的槽位;
将所述命名实体填充在所述匹配的槽位中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010014059.1/2.html,转载请声明来源钻瓜专利网。