[发明专利]一种基于匹配度进行内容匹配的智能问答系统有效
申请号: | 202211074234.1 | 申请日: | 2022-09-02 |
公开(公告)号: | CN115470332B | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 周欣;司惠菊;魏娟;谢仁强;石丽;郭雪飞;董江;席楠;翟畅;徐静;周露 | 申请(专利权)人: | 中国气象局机关服务中心;北京合众鼎成科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/36;G06F40/30 |
代理公司: | 北京知元同创知识产权代理事务所(普通合伙) 11535 | 代理人: | 刘元霞 |
地址: | 100081 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 匹配 进行 内容 智能 问答 系统 | ||
1.一种基于匹配度进行内容匹配的方法,所述方法包括:
获取用户输入的原始查询内容,对所述原始查询内容进行格式处理以获取经过格式处理的查询内容;
确定所述经过格式处理的查询内容与文本内容库内多个文本段落中每个文本段落的候选段落匹配度,将候选段落匹配度大于第一匹配度阈值的文本段落确定为候选段落;
在每个候选段落中选择与所述经过格式处理的查询内容相关联的答案片段,并确定所述经过格式处理的查询内容与每个答案片段的答案片段匹配度;
基于所述候选段落匹配度和答案片段匹配度,确定所述经过格式处理的查询内容与答案片段的匹配度;以及
基于所述经过格式处理的查询内容与答案片段的匹配度,从多个答案片段中选择与所述经过格式处理的查询内容相关联的至少一个目标答案;
其中,所述基于所述候选段落匹配度和答案片段匹配度,确定所述经过格式处理的查询内容与答案片段的匹配度,包括:
对所述答案片段匹配度进行对数平滑处理,以获得经过平滑处理的匹配度/
基于候选段落匹配度和经过平滑处理的匹配度/确定所述经过格式处理的查询内容与答案片段的匹配度s:
其中f为对数平滑函数;
其中,基于所述经过格式处理的查询内容与答案片段的匹配度,从多个答案片段中选择与所述经过格式处理的查询内容相关联的至少一个目标答案,包括:
按照所述经过格式处理的查询内容与答案片段的匹配度的降序顺序对答案片段进行排序,以生成排序列表;
获取预设的提取参数N,从所述排序列表中选择匹配度最大的N个答案片段;
将匹配度最大的N个答案片段中匹配度大于第二匹配度阈值的至少一个答案片段确定为目标答案。
2.根据权利要求1所述的方法,所述对所述原始查询内容进行格式处理以获取经过格式处理的查询内容,包括:
获取用于对原始查询内容进行格式处理的内容处理规则;
基于内容处理规则对所述原始查询内容进行格式处理以获取经过格式处理的查询内容。
3.根据权利要求1所述的方法,在获取用户输入的原始查询内容之前还包括,
将所述文本内容库内多个文档中的每个文档按照自然段进行切分,以获得多个自然段;
确定每个文档中的多级标题,将每级标题和与标题相关联的至少一个自然段构成文本段落。
4.根据权利要求3所述的方法,还包括,
确定每个文本段落中的字符数量;
将字符数量大于字符数量阈值的文本段落确定为待处理的文本段落;
将待处理的文本段落进行分割,直到经过分割所获得的任意文本段落的字符数量均小于或等于字符数量阈值为止。
5.根据权利要求1所述的方法,所述确定所述经过格式处理的查询内容与文本内容库内多个文本段落中每个文本段落的候选段落匹配度,包括:
使用Bert预训练的语言表征模型Bert1确定所述经过格式处理的查询内容query的语义特征编码uq:
uq=Bert1(querty)
使用Bert预训练的语言表征模型Bert1确定每个文本段落pj的语义特征编码
计算所述经过格式处理的查询内容与文本内容库内多个文本段落中第j个文本段落的候选段落匹配度
其中,0j≤na,j为自然数,na为文本内容库内文本段落的数量。
6.根据权利要求1所述的方法,在将候选段落匹配度大于第一匹配度阈值的文本段落确定为候选段落后,将候选段落构成候选段落集合:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国气象局机关服务中心;北京合众鼎成科技有限公司,未经中国气象局机关服务中心;北京合众鼎成科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211074234.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体装置及其制作方法
- 下一篇:一种物流中转车及其定向轨道
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法