[发明专利]自然语言知识学习及装置在审
申请号: | 201611185192.3 | 申请日: | 2016-12-20 |
公开(公告)号: | CN106649706A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 单波 | 申请(专利权)人: | 北京云知声信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京尚伦律师事务所11477 | 代理人: | 张俊国 |
地址: | 100191 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自然语言 知识 学习 装置 | ||
技术领域
本发明涉及语音处理技术领域,尤其涉及一种自然语言知识学习及装置。
背景技术
相关技术中,可与用户语音交互的电子设备都会设置一个自然语音知识数据库。自然语言知识数据库是VUI(语音交互界面)产品中的非常重要的部分,它存储的是向用户提供语音交互体验的知识。以往VUI产品中的知识库维护,要么是出厂前设定好而一成不变的,要么是由产品生产商在云端进行维护更新。当接收到用户输入的自然语言信息时,在知识数据库中查找与自然语言信息对应的反馈内容,但是该自然语言知识数据库如果需要修改,则需要采用其它低效的交互手段进行修改,如数据库改写操作或GUI输入等,用户体验不佳。
发明内容
本发明实施例提供一种自然语言知识学习方法及装置,用以实现根据用户输入的自然语言信息自动更新自然语言知识数据库。
根据本发明实施例的第一方面,提供一种自然语言知识学习,主要用于VUI产品,包括:
接收用户输入的自然语言信息;
当检测到所述自然语言信息满足预设要求时,对所述自然语言信息的内容进行解析;
根据解析结果确定所述自然语言信息是否合格;
当确定所述自然语言信息合格时,根据所述自然语言信息的内容更新所述电子设备的自然语言知识数据库。
在该实施例中,当接收到用户输入的自然语言信息时,若检测到自然语言信息满足预设要求,则确定自然语言信息是否合格,在自然语言信息合格时,根据该自然语言信息的内容自动更新电子设备的自然语言知识数据库,这样,使得电子设备可以根据输入的自然语言信息自动学习,不需要人为更新自然语言知识数据库,从而减少了用户操作,提升了用户的使用体验,同时使得语音交互产品具有了自学习的能力,随着产品被使用的次数增多,其所具备的知识会更加丰富。
在一个实施例中,所述预设要求包括以下任一项:
所述自然语言信息的句式为预设句式;
所述自然语言信息中包含预设关键词;
所述自然语言信息与上一次接收到的自然语言信息之间存在上下文关联。
在该实施例中,预设要求可以是自然语言信息的句式为预设句式,如自然语言信息的句式为定义性的陈述句,例如a是b。预设要求还可以是自然语言信息中包含预设关键词,如特定的命令词,例如记住。当然,预设要求还可以是自然语言信息与上一次接收到的自然语言信息之间存在上下文关联,如用户之前说了一个问句,当前这句恰好是问题的回答。
在一个实施例中,所述根据解析结果确定所述自然语言信息是否合格,包括:
确定所述自然语言信息的内容中是否包括非法关键词;
当所述内容中包含非法关键词时,确定所述自然语言信息不合格;
当所述内容中不包含非法关键词时,对所述内容的语义进行解析;
根据所述内容的语义确定所述自然语言信息是否合格。
在该实施例中,在根据自然语言信息的内容更新自然语言知识数据库之前,还需要确定自然语言信息是否合法,具体地,可以判断自然语言信息的内容中是否包含非法关键词,如一些政治敏感词,不健康词汇等,如果包含非法关键词则确定自然语言信息不合格,不能够根据该自然语言信息更新自然语言知识数据库。当然,还可以根据自然语言信息的内容的语义确定自然语言信息是否合格。如接收到自然语言信息“李晓明不是人”,该自然语言信息的内容中不包含非法关键词,但是整个内容的语义是不文明的,此时,也可以确定自然语言信息不合格。
在该实施例中,在根据自然语言信息的内容更新知识数据库之前,还需要确定自然语言信息是否合格。不合格的自然语言信息主要包含两种:第一种非法信息,政治敏感、恐怖主义、种族歧视、违法、黄赌毒、不文明等都是非法信息;第二种是违背客观事实的虚假信息,如“地球是方的”、“刘德华是女的”。要实现上面两种不合格自然语言信息的检测,一般用关键词或语义分析的方法来实现。如检测到关键词“法轮功”,则判定该自然语言信息非法。接收到自然语言信息“李晓明不是人”,虽然该自然语言信息的内容中不包含非法关键词,但是整个内容的语义是不文明的,此时,也可以确定该自然语言信息不合格。
在一个实施例中,所述根据所述自然语言信息的内容更新所述电子设备的自然语言知识数据库,包括:
确定所述自然语言知识数据库中是否存在与所述自然语言信息的内容相关的历史内容;
当确定所述自然语言知识数据库中不存在所述历史内容时,将所述自然语言信息的内容转换为与电子设备对应的目标自然语言内容,并记录所述目标自然语言内容;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京云知声信息技术有限公司,未经北京云知声信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611185192.3/2.html,转载请声明来源钻瓜专利网。