[发明专利]一种利用刻画因果依赖关系和时序影响机制增强答案质量排序的评判方法有效
申请号: | 201710334063.4 | 申请日: | 2017-05-12 |
公开(公告)号: | CN107203600B | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 吴飞;汤斯亮;段新宇;肖俊;赵洲;庄越挺 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/289;G06F40/35;G06N3/04 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 张法高;傅朝栋 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 刻画 因果 依赖 关系 时序 影响 机制 增强 答案 质量 排序 评判 方法 | ||
本发明公开了一种利用刻画因果依赖关系和时序影响机制来提高答案质量排序的评判方法。包括如下步骤:1)把每个问题及其按照时间先后顺序排序的答案作为训练数据集;2)对训练集中的文本通过Paragraph2Vec模型进行无监督学习,得到文本表达模型,并分别构建问题和答案的隐性表达;3)将问题与答案之间的因果依赖关系和答案与答案之间的时序影响机制引入传统的长短时记忆模型;4)基于问题与答案的隐性表达,使用学习后所得到的问答排序模型对问题的候选答案进行排序。相比一般的答案质量评判方法,本发明进一步发掘答案与答案之间基于时序的相互影响,揭示高质量答案的形成规律。本发明在答案质量排序中所取得的性能较传统的基于文本和语义关联性的评判方法更好。
技术领域
本发明涉及问答文本检索,尤其涉及一种利用刻画因果依赖关系和时序影响机制增强答案质量排序方法。
背景技术
问答检索是具有现实意义的重要技术领域,而依据问答文本的语义关联性对其进行排序是这一领域中的一项重要技术。这项技术在检索过程中,对问题与其每一个候选答案的关联性高低进行排序,并将排序结果展现给用户,在答案质量排序应用中有巨大的价值。
传统的答案质量排序方法,一般先为问答数据学习一个语义空间,再将问题与答案分别映射在该语义空间中,形成相应的特征向量。之后使用一个人工指定的关联性度量函数或者机器学习的方法计算问题和每一个候选答案间的关联性,最后再依照关联性高低对答案质量进行排序。这种方法将语义空间中的特征向量作为问答数据的表示,仅考虑问题答案之间的语义关联性(即本文中所说的“因果依赖关系”),而忽略了同一问题下候选答案之间的时序影响,因此难以挖掘答案之间原本存在的复杂影响机制。
利用刻画因果依赖关系和时序影响机制增强答案质量排序方法能够有效弥补上述传统方法中的不足。本方法在传统的长短时记忆模型中引入了问答数据中常见的问题与答案之间的因果依赖关系以及答案与答案之间的时序影响机制。相比一般的答案质量评判方法,本发明不仅局限于问题和答案之间的语义关联度,还进一步发掘答案之间基于时序的相互影响,揭示高质量答案的形成规律。
发明内容
本发明的目的在于解决现有技术中存在的问题,并提供一种利用刻画因果依赖关系和时序影响机制增强答案质量排序的评判方法。本发明所采用的具体技术方案如下:
利用刻画因果依赖关系和时序影响机制增强答案质量排序的评判方法,包括如下步骤:
1)构建排序用的问答训练数据集:将每个问题及其按照时间先后顺序排序的答案作为训练数据集;
2)对训练样本进行分词操作并去除训练样本中的噪音,使用Paragraph2Vec模型对处理后的问答数据进行无监督学习,得到文本表达模型,并利用文本表达模型分别构建问题与答案在语义空间中的隐性表达;
3)基于问题和答案在语义空间中的隐性表达,将问题与答案之间的因果依赖关系和答案与答案之间的时序影响机制引入长短时记忆模型进行学习,得到问答排序模型;
4)使用学习后所得到的问答排序模型对新问题下的候选答案进行排序:基于问题和答案在语义空间中的隐性表达,使用问答排序模型对问题与每一个答案的关联性进行评分,根据关联性评分的高低对问题的候选答案进行分数排序,最后输出答案质量排序结果。
上述步骤可具体采用如下实现方式:
所述的步骤1)包括:
1)对于任意问题qi∈Q,i∈{1,2,…N},其中N为问题集Q中问题的数量,从答案集A中得到其候选答案ai,1,ai,2,ai,3…ai,K分别对应的发布时间Ti,1,Ti,2,Ti,3…Ti,K,其中K为问题qi下候选答案的数量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710334063.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:高催化效率的纤维素酶突变体及其基因和应用
- 下一篇:一种两轴纳型精太阳敏感器