[发明专利]一种面向在线问答平台的基于深度强化学习的问题标注方法在审
申请号: | 201811615274.6 | 申请日: | 2018-12-27 |
公开(公告)号: | CN109710741A | 公开(公告)日: | 2019-05-03 |
发明(设计)人: | 兰秉良 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510260 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向在线问答平台的基于深度强化学习的问题标注方法,基于深度神经网络和强化学习技术,构建模型,并在设计模型奖励的时候,在保证标注准确性的同时,创新性地加入衡量问题标签多样性的指标,同时考虑到尾标签效应,即在标注时复杂详细描述的长标签,从而使得标签能更深层次,更详细地描述问题。本发明综合考虑的标签的准确性,多样性,以及减少尾标签效应对问题标注的影响,并通过引入深度神经网络提高了强化学习模型训练的效率和准确性,并且能在一定置信度下保证匹配的误差范围。本发明的方案将能对问答平台中海量和问题和标签进行准确多样的匹配。 | ||
搜索关键词: | 强化学习 标注 标签 神经网络 在线问答 尾标签 匹配 多样性 创新性地 模型训练 设计模型 问答平台 综合考虑 置信度 构建 保证 衡量 引入 奖励 | ||
【主权项】:
1.一种面向在线问答平台的基于深度强化学习的问题标注方法,其特征在于,包括以下步骤:S1:利用MDP马尔科夫决策过程对问题构建Q‑learning强化学习模型;S2:搭建深度神经网络优化训练Q值;所述的Q值表示Q‑learning强化学习模型中在状态s动作后获取的得分奖励;S3:利用训练集训练深度强化学习模型;S4:根据深度强化学习模型输出结果对问题进行标签标注。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811615274.6/,转载请声明来源钻瓜专利网。