[发明专利]一种筛选问答对并实时更新问答库的方法及系统在审
| 申请号: | 201410743891.X | 申请日: | 2014-12-08 |
| 公开(公告)号: | CN104679815A | 公开(公告)日: | 2015-06-03 |
| 发明(设计)人: | 崇伟峰 | 申请(专利权)人: | 北京云知声信息技术有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
| 代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 杨立 |
| 地址: | 100191 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 筛选 答对 实时 更新 问答 方法 系统 | ||
1.一种筛选问答对并实时更新问答库的方法,包括以下步骤:
步骤1,将客服聊天记录解析成标准格式的聊天记录;
步骤2,从标准格式的聊天记录中筛选出问答对;
步骤3,根据问答对的问题和答案,检查合法问答对库中是否存储有相同的合法问答对,若是,执行步骤4;否则,执行步骤5;
步骤4,更新所述合法问答对库中所述合法问答对的统计信息,并更新与所述合法问答对对应的复述问答对库中的复述问答对的统计信息,结束处理;
步骤5,根据所述问答对中的问题和答案,查找复述问答组库中的复述问题组和复述答案组,得到与问答对对应的问题ID和答案ID,根据问题ID和答案ID,检查复述问答对库中是否存储有问题ID和答案ID组成的复述问答对,若是,执行步骤6;否则,执行步骤7;
步骤6,根据所述问答对中的问题和答案在合法问答对库中创建新的合法问答对,并更新与新的合法问答对对应的复述问答对库中的复述问答对的统计信息,结束处理;
步骤7,计算问答对中问题和答案的匹配程度值,将所述匹配程度值与预设阈值相比较,根据比较结果创建新的合法问答对或候选问答对,结束处理。
2.根据权利要求1所述的筛选问答对并实时更新问答库的方法,其特征在于,步骤7具体为,
如果匹配程度值大于预设阈值,则执行步骤8;否则,执行步骤9;
步骤8,根据所述问答对中的问题和答案在合法问答对库中创建新的合法问答对,同时在复述问答组库中创建新的复述问题组和复述答案组,并根据新的复述问题组中的问题ID和复述答案组的答案ID在复述问答对库中创建新的复述问答对,将新的合法问答对链接到新的复述问答对,结束处理;
步骤9,将所述问答对作为候选问答对,并存储到候选问答对库中,结束处理。
3.根据权利要求1所述的筛选问答对并实时更新问答库的方法,其特征在于,
合法问答对库存储合法问答对ID、问题、答案和合法问答对的统计信息,所述合法问答对的统计信息包括出现的次数,厂家,时间,对应的复述问答对的ID;
复述问答组库存储复述问答组ID、复述问答组类型和复述问答组内容;复述问答组的类型包括复述问题组和复述答案组;
每组复述问题组中存储有若干个问题,所述若干个问题为语义相同的问题;
每组复述答案组中存储有若干个答案,所述若干个答案为语义相同的答案;
复述问答对库存储复述问答对ID、复述问题组ID、复述答案组ID和复述问答对的统计信息,所述复述问答对的统计信息包括出现的次数、厂家、时间。
4.根据权利要求1所述的筛选问答对并实时更新问答库的方法,其特征在于,在进行阈值比较之后,还可以对步骤5中问题ID和答案ID没有组成过复述问答对的问答对,作进一步处理,
根据复述问题组和复述答案组同时出现的频率和相对概率对所述问答对进行有效性检测,若有效,执行步骤8;
否则,检测所述问答对中的问题和答案是否为非问答语句,若是非问答语句,则丢弃所述问答对;否则,执行步骤9。
5.根据权利要求1所述的筛选问答对并实时更新问答库的方法,其特征在于,在步骤2和步骤3之间还包括对筛选出的问答对进行过滤处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京云知声信息技术有限公司;,未经北京云知声信息技术有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410743891.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种搜索结果排序方法及装置
- 下一篇:过滤应用内容的方法和系统





