[发明专利]一种答案检测方法及装置在审
申请号: | 202210068692.8 | 申请日: | 2022-01-20 |
公开(公告)号: | CN114416952A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 张竞翱;李长亮 | 申请(专利权)人: | 北京金山数字娱乐科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/126;G06F40/216;G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 刘晓楠 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 答案 检测 方法 装置 | ||
1.一种答案检测方法,其特征在于,包括:
获取待处理文档和待查询问题中每个词单元对应的字形信息;
将所述待处理文档、所述待查询问题以及所述字形信息作为输入集输入答案检测模型,获得所述输入集的编码向量;
根据所述编码向量确定所述待处理文档中所述待查询问题对应的答案检测结果并输出。
2.根据权利要求1所述的答案检测方法,其特征在于,所述答案检测模型包括向量编码模块以及概率预测模块;
相应的,所述将所述待处理文档、所述待查询问题以及所述字形信息作为输入集输入答案检测模型,获得所述输入集的编码向量,包括:
将所述待处理文档、所述待查询问题以及所述字形信息作为输入集输入所述向量编码模块进行编码处理,生成所述输入集的编码向量。
3.根据权利要求2所述的答案检测方法,其特征在于,所述将所述待处理文档、所述待查询问题以及所述字形信息作为输入集输入所述向量编码模块进行编码处理,生成所述输入集的编码向量,包括:
将所述待处理文档、所述待查询问题以及所述字形信息作为输入集输入所述向量编码模块;
其中,所述向量编码模块对所述待处理文档以及所述待查询问题进行编码处理,生成所述输入集的第一编码子向量,对所述字形信息进行编码处理,生成所述输入集的第二编码子向量,并将所述第一编码子向量和所述第二编码子向量进行求和,生成所述输入集的编码向量。
4.根据权利要求2所述的答案检测方法,其特征在于,所述将所述待处理文档、所述待查询问题以及所述字形信息作为输入集输入答案检测模型中的向量编码模块进行编码处理,生成所述输入集的编码向量,包括:
将所述待处理文档、所述待查询问题输入所述向量编码模块进行编码处理,生成所述待处理文档、所述待查询问题中每个词单元对应的字向量及分割向量,对所述字向量及分割向量进行求和,生成第一编码子向量;以及,
将所述字形信息输入所述向量编码模块进行编码处理,生成所述待处理文档、所述待查询问题的第二编码子向量;
将所述第一编码子向量和所述第二编码子向量进行求和,生成所述输入集的编码向量。
5.根据权利要求2所述的答案检测方法,其特征在于,所述根据所述编码向量确定所述待处理文档中所述待查询问题对应的答案检测结果并输出,包括:
将所述编码向量输入所述概率预测模块,获得所述输入集中每个词单元对应的概率预测结果;
根据所述概率预测结果确定所述待处理文档中所述待查询问题对应的答案检测结果并输出。
6.根据权利要求5所述的答案检测方法,其特征在于,所述根据所述概率预测结果确定所述待处理文档中所述待查询问题对应的答案检测结果并输出,包括:
将概率预测结果中起始位置的概率分布中概率最大的词单元在所述待处理文档中的位置作为所述答案检测结果的起始位置;
将概率预测结果中结束位置的概率分布中概率最大的词单元在所述待处理文档中的位置作为所述答案检测结果的结束位置;
将所述起始位置以及结束位置之间的词单元作为所述答案检测结果并输出。
7.根据权利要求1所述的答案检测方法,其特征在于,所述获取待处理文档和待查询问题中每个词单元对应的字形信息,包括:
在文档的字形信息查询库查询待处理文档及待查询问题中每个词单元对应的字形信息。
8.根据权利要求1所述的答案检测方法,其特征在于,所述字形信息包括字体、字号、字色、背景色、在待处理文档中的位置坐标中的至少一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山数字娱乐科技有限公司,未经北京金山数字娱乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210068692.8/1.html,转载请声明来源钻瓜专利网。