[发明专利]一种基于深度学习的问答社区问题路由方法有效
申请号: | 201910122563.0 | 申请日: | 2019-02-18 |
公开(公告)号: | CN109871439B | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 董守斌;叶超;董守玲;胡金龙;袁华 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F30/27;G06Q50/00;G06N3/04 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 问答 社区 问题 路由 方法 | ||
1.一种基于深度学习的问答社区问题路由方法,其特征在于,包括以下步骤:
1)通过对社区问答的文本内容进行分词,利用词向量技术,获取单词的词向量表示;
2)根据用户的历史回答记录,构建用户档案;
3)利用深度学习根据用户档案分别学习用户兴趣预测模型、用户能力预测模型、用户响应度预测模型;
用户兴趣预测模型的训练方式如下:
模型输入为问题文本,经过词嵌入后得到文本中所有单词的词向量;模型隐含层采用CNN,通过卷积核获得卷积层特征;模型输出层采用SoftMax拟合用户的回答概率,用户回答该问题则为1,否则为0;
用户能力预测模型的训练方式如下:
模型输入为问题文本,经过词嵌入后得到文本中所有单词的词向量,然后将所有单词的词向量求和得到问题的词向量,并将该词向量作为隐含层输入;隐含层采用DNN;输出层采用加权逻辑回归拟合用户回答的评分,未回答用户评分设为0;
用户响应度预测模型的训练方式如下:
模型输入为问题文本,经过词嵌入后得到文本中所有单词的词向量,然后将所有单词的词向量求和得到问题的词向量,并将该词向量作为隐含层输入;隐含层采用DNN;输出层采用加权逻辑回归拟合用户回答问题时间与问题发布时间的间隔的倒数,未回答设为0;
4)根据步骤3)学习到的模型获取用户特征,进而根据用户特征训练打分模型;
5)利用步骤3)学习的用户兴趣预测模型、用户能力预测模型、用户响应度预测模型及步骤4)训练的打分模型,进行问题路由。
2.根据权利要求1所述的一种基于深度学习的问答社区问题路由方法,其特征在于:在步骤1)中,提取社区问题的文本内容,使用常用分词工具进行分词,这样就将数据分解成文档-词的形式;利用词向量工具在数据集上训练得到单词的词向量。
3.根据权利要求1所述的一种基于深度学习的问答社区问题路由方法,其特征在于:在步骤2)中,根据社区的历史数据,提取用户历史回答的相关信息,包括问题的文本、问题的发布时间、回答的得分和回答的时间,构建用户档案。
4.根据权利要求1所述的一种基于深度学习的问答社区问题路由方法,其特征在于:在步骤5)中,给定一个新问题,根据步骤3)学习的“用户兴趣预测模型”、“用户能力预测模型”、“用户响应度预测模型”,得到每个用户的兴趣值、能力值和响应度特征,然后将这些特征输入到步骤4)训练的打分模型,得到每个用户的得分,最后根据得分排序,产生推荐用户列表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910122563.0/1.html,转载请声明来源钻瓜专利网。