[发明专利]低精度问题的归类方法、智能终端及计算机可读存储介质有效
申请号: | 201911330731.1 | 申请日: | 2019-12-20 |
公开(公告)号: | CN111177379B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 陈栋梁;熊友军 | 申请(专利权)人: | 深圳市优必选科技股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 李莉 |
地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 精度 问题 归类 方法 智能 终端 计算机 可读 存储 介质 | ||
本申请公开了一种低精度问题的归类方法、智能终端及计算机可读存储介质,该低精度问题的归类方法包括:获取到目标问题匹配到的多个候选主问题;对每一候选主问题对应的主似问题集合表进行数据分析,以放大多个候选主问题之间的差别;获取到目标问题与放大差别后的每一候选主问题的相似度,以将目标问题归类为与其相似度最高的候选主问题。通过上述方式,本申请通过放大多个候选主问题的差别,以能够将低精度问题准确地归类到多个高精度单独匹配的候选主问题中与之相似度最高的那一个候选主问题中,从而能够丰富相应问答系统的语料库,并增强其差异化识别处理能力。
技术领域
本申请涉及低精度问题归类的技术领域,尤其涉及一种低精度问题的归类方法、智能终端及计算机可读存储介质。
背景技术
问答系统,简称FAQ(Frequently Asked Questions)系统,是信息检索的一种高级形式,能够更加准确地理解用户用自然语言提出的问题,并通过检索问答知识库返回简洁、准确的匹配答案。相较于搜索引擎,问答系统能更好地理解用户提问的真实意图,且能够进一步更有效地满足用户的信息检索需求。问答系统是目前人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向。
FAQ系统为了增强自动应答的健壮性,一是需要给库中已有的问题增加相似问,增强已有问题的泛化能力,二是对于那些库中所有问题都不能与之匹配并回答的用户问题,需要在库中增加新的问题和答案。
其中,对于那些含有不可舍弃的价值,但需要经过提炼后才能使用的低精度问题,因其可能会与多个高精度单独匹配的主问题相匹配,而存在匹配错误的可能,故而需要准确地将其归类为其中最为匹配的高精度单独匹配的主问题,以能够获取到准确的答案。
发明内容
本申请提供了一种低精度问题的归类方法、智能终端及计算机可读存储介质,该低精度问题的归类方法能够有效解决低精度问题无法准确归类为多个高精度单独匹配的主问题中最为匹配的一个的问题。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种低精度问题的归类方法,其中,该低精度问题的归类方法包括:获取到目标问题匹配到的多个候选主问题;对每一候选主问题对应的主似问题集合表进行数据分析,以放大多个候选主问题之间的差别;获取到目标问题与放大差别后的每一候选主问题的相似度,以将目标问题归类为与其相似度最高的候选主问题。
其中,获取到目标问题匹配到的多个候选主问题的步骤之后,对每一候选主问题对应的主似问题集合进行数据分析,以放大多个候选主问题之间的差别的步骤之前,还包括:获取到每一候选主问题的主似问题集合表。
其中,对每一候选主问题对应的主似问题集合表进行数据分析,以放大多个候选主问题之间的差别的步骤包括:对每一候选主问题对应的主似问题集合表进行切词,并进行词频统计,以放大多个候选主问题之间的差别;获取到目标问题与放大差别后的每一候选主问题的相似度,以将目标问题归类为与其相似度最高的候选主问题的步骤包括:根据词频统计获取到每一候选主问题的分词在其主似问题集合中的平均击中量,以将目标问题归类为平均击中量最高的候选主问题。
其中,根据词频统计获取到每一候选主问题的分词在其主似问题集合中的平均击中量,以将目标问题归类为平均击中量最高的候选主问题的步骤包括:根据词频统计获取到每一候选主问题的分词在其主似问题集合中的平均击中量以及相应的坐标;对目标问题进行切词,以计算并统计目标问题的分词在每一候选主问题的主似问题集合上的相对坐标值;如果平均击中量最高的候选主问题的平均击中量比平均击中量第二和第三之和更高,且相对坐标值在预设区间阈值之间时,将目标问题归类为平均击中量最高的候选主问题。
其中,根据词频统计获取到每一候选主问题的分词在其主似问题集合中的平均击中量以及相应的坐标分布的步骤包括:根据词频统计获取到每一候选主问题的分词在其主似问题集合中的平均击中量,以及每一候选主问题的主似问题集合中每一问题的分词对应的平均击中量的均值和方差,以进一步计算出每一候选主问题的分词在其主似问题集合中的坐标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市优必选科技股份有限公司,未经深圳市优必选科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911330731.1/2.html,转载请声明来源钻瓜专利网。