[发明专利]一种对话文本情感摘要的生成方法在审
申请号: | 201310693047.6 | 申请日: | 2013-12-17 |
公开(公告)号: | CN103617158A | 公开(公告)日: | 2014-03-05 |
发明(设计)人: | 李寿山;林莉媛;王中卿;周国栋 | 申请(专利权)人: | 苏州大学张家港工业技术研究院 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/21 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 唐灵;常亮 |
地址: | 215600 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 对话 文本 情感 摘要 生成 方法 | ||
1.一种对话文本情感摘要的生成方法,该对话文本为英文对话文本,其特征在于,包括:
1)将英文对话文本进行分句处理;
2)将步骤1)中获得的句子进行分词处理,获取单词特征;
3)抽取步骤2)中具有情感词的句子,标记成情感特征,并根据单词特征和情感特征构建句子的特征向量;
4)采用余弦算法计算向量间的相似度;
5)根据所得相似度计算句子间的转移概率;
6)采用PageRank算法获取句子的权值;
7)根据所述句子的权值进行排序,抽取句子,获得摘要。
2.根据权利要求1所述的生成方法,其特征在于:所述步骤1)中是按所述英文对话文本中的结束标志进行分句,所述结束标志为句话、感叹号、问号或省略号中的一种。
3.根据权利要求1所述的生成方法,其特征在于:所述步骤2)中分词处理是据英文句子的空格,将一个句子分成各个单词。
4.根据权利要求1所述的生成方法,其特征在于:所述步骤3)具体包括步骤:
3.1)提供一情感词词典;
3.2)根据步骤2)获得的单词特征,将句子中可能成为情感词的单词与所述情感词词典进行匹配查找,以检测句子中的情感词,当检测到情感词,在该句子后增加“OPINION”特征作为情感特征;
3.3)将所获得的单词特征和情感特征结合构建句子的特征向量。
5.根据权利要求1所述的生成方法,其特征在于:所述步骤4)中余弦算法计算向量间的相似度具体为:
根据公式进行计算,其中,所述f(i→j)表示两个向量间的相似度,ui和uj表示两个句子的特征向量。
6.根据权利要求1所述的生成方法,其特征在于:所述步骤5)具体为:
根据公式进行计算,其中,p(i→j)表示句子i到句子j的转移概率,f(i→j)和f(i→k)为两个句子特征向量间的相似度。
7.根据权利要求1所述的生成方法,其特征在于:所述步骤6)具体为:
根据公式进行计算,其中,所述S(uj)表示句子j的权值,所述μ=0.85为惩罚因子,p(j→i)为上述句子间的转移概率。
8.根据权利要求1所述的生成方法,其特征在于:所述步骤7)具体包括:
7.1)按照所述句子的权值大小,分别选择出符合预设数量,且权值较大句子;
7.2)由选择的所述的句子组成对话文本的情感摘要。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学张家港工业技术研究院,未经苏州大学张家港工业技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310693047.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于Hadoop的微博热点话题提取方法
- 下一篇:治疗失眠的中药