[发明专利]一种文本语义理解的方法和相关装置有效
申请号: | 202010010698.0 | 申请日: | 2020-01-06 |
公开(公告)号: | CN111274823B | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 张兆银;李直旭;陈志刚 | 申请(专利权)人: | 科大讯飞(苏州)科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘晓菲 |
地址: | 215000 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 语义 理解 方法 相关 装置 | ||
本申请公开了一种文本语义理解的方法和相关装置,该方法包括:首先,获取待语义理解的目标文本;然后,提取目标文本的语义信息,基于语义信息同时获得目标文本的领域类型、槽值类型和对应的槽值;最后,基于目标文本的领域类型、槽值类型和对应的槽值,对目标文本进行文本语义理解。由此可见,通过提取目标文本的语义信息,充分挖掘领域类型与槽值类型、对应的槽值之间的关系,充分利用槽值类型和对应的槽值的预测辅助领域类型的预测,以便同时获得目标文本的领域类型、槽值类型和对应的槽值,能够大大提升待语义理解的目标文本的文本语义理解效果,从而提升用户体验。
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种文本语义理解的方法和相关装置。
背景技术
语义理解作为自然语言处理技术领域中最重要环节,广泛应用于智能对话系统,智能问答系统等。具体地,针对用户输入的文本,语义理解模块能准确地判断出该文本所属的领域以及其关键词槽,以便系统回复与之相应的文本;例如,文本“我想去XX广场”所属的领域为“导航”,其关键词槽为目的地“XX广场”。
目前,文本语义理解采用序列标注方法,即,针对领域类型下槽值类型和对应的槽值训练序列标注模型,序列标注模型拆分成“领域类型预测”和“槽值类型和对应的槽值预测”两个独立的子模块;其中“领域类型预测”用于预测文本所属的领域,“槽值类型和对应的槽值预测”用于预测文本的关键词槽。
发明人经过研究发现,上述序列标注方法虽然既能预测领域类型,又能预测槽值类型和对应的槽值,但是,预测领域类型和预测槽值类型、对应的槽值是独立的,即,未利用槽值类型和对应的槽值的预测辅助领域类型的预测,使得文本语义理解的效果不如人意,导致用户体验较差。
发明内容
有鉴于此,本申请实施例提供一种文本语义理解的方法和相关装置,能够大大提升待语义理解的目标文本的文本语义理解效果,从而提升用户体验。
第一方面,本申请实施例提供了一种文本语义理解的方法,该方法包括:
获取待语义理解的目标文本;
提取所述目标文本的语义信息,基于所述语义信息同时获得所述目标文本的领域类型、槽值类型和对应的槽值;
基于所述目标文本的领域类型、槽值类型和对应的槽值,对所述目标文本进行文本语义理解。
可选的,所述提取所述目标文本的语义信息,基于所述语义信息同时获得所述目标文本的领域类型、槽值类型和对应的槽值,具体为:
利用语义理解模型提取所述目标文本的语义信息,基于所述语义信息同时获得所述目标文本的领域类型、槽值类型和对应的槽值;所述语义理解模型是基于不同领域下训练文本、训练文本的领域类型、槽值类型和对应的槽值,训练多任务生成式模型获得的。
可选的,所述语义理解模型包括输入端和输出端;所述输入端包括字向量层和编码层,所述输出端包括解码层。
可选的,所述利用语义理解模型提取所述目标文本的语义信息,基于所述语义信息同时获得所述目标文本的领域类型、槽值类型和对应的槽值,包括:
基于所述目标文本和所述字向量层,获得所述目标文本的字向量;
基于所述目标文本的字向量和所述编码层,提取所述目标文本的语义信息获得所述目标文本的语义向量;
基于所述目标文本的语义向量和对应的所述解码层,获得所述目标文本的领域类型、槽值类型和对应的槽值。
可选的,所述基于所述目标文本的字向量和所述编码层提取所述目标文本的语义信息,获得所述目标文本的语义向量,包括:
将所述目标文本的字向量输入所述编码层,获得所述目标文本的隐层向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞(苏州)科技有限公司,未经科大讯飞(苏州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010010698.0/2.html,转载请声明来源钻瓜专利网。