[发明专利]一种自动生成文本方法以及相关装置有效
申请号: | 201810185592.7 | 申请日: | 2018-03-07 |
公开(公告)号: | CN108664465B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 陈海林 | 申请(专利权)人: | 珍岛信息技术(上海)股份有限公司 |
主分类号: | G06F40/186 | 分类号: | G06F40/186;G06F40/30;G06F18/22 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 200083 上海市虹*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 生成 文本 方法 以及 相关 装置 | ||
1.一种自动生成文本方法,其特征在于,包括:
对原始文本进行分句处理得到多个候选句子;
对所有所述候选句子根据相似度计算处理确定每个候选句子与其他候选句子的相似度,得到相似度矩阵;
根据获取的关键词和所述相似度矩阵进行整数规划建模处理,得到整数规划模型,并使用所述整数规划模型执行近似求解操作,得到整数规划结果;
根据所述整数规划结果,从所有所述候选句子中抽取得到多个目标句子和所有所述目标句子的位置顺序,得到目标文本;
其中,根据所述整数规划结果,从所有所述候选句子中抽取得到多个目标句子和所有所述目标句子的位置顺序,得到目标文本,包括:
s.t.part1:
yi,j∈{0,1},i,j=1,2,...,n;
xi∈{0,1},i=1,2,...,n;
s.t.part2:
Yij∈{0,1},i=1,2,..,,j=1,2,..,m;
其中,si表示第i个候选句子;gaini,j表示将第i个候选句子和第j个候选句子中所有的实体在两个候选句子之间的决策转移值相加得到的两个候选句子之间的结构相似度,xj=1表示句子Sj包含在自动生成的目标文本内,xj=0表示Sj不在自动生成的目标文本内,yi,j=1表示句子Si和Sj放在相邻的位置,yi,j=0表示句子Si和Sj未放在相邻的位置,Yi,j=1表示第i个关键字wi在Sj内,Yi,j=0表示i个关键字wi不在Sj内。
2.根据权利要求1所述的自动生成文本方法,其特征在于,对所有所述候选句子根据相似度计算处理确定每个候选句子与其他候选句子的相似度,得到相似度矩阵,包括:
对所有所述候选句子进行语义预测处理,根据语义预测处理的结果确定每个候选句子与其他候选句子的语义相似度,得到语义相似度矩阵;
根据获取的关键词和所述相似度矩阵进行整数规划建模处理,得到整数规划模型,并使用所述整数规划模型执行近似求解操作,得到整数规划结果,包括:
根据获取的所述关键词和所述语义相似度矩阵进行整数规划建模处理,得到整数规划模型,并使用所述整数规划模型执行近似求解操作,得到整数规划结果。
3.根据权利要求2所述的自动生成文本方法,其特征在于,对所有所述候选句子进行语义预测处理,根据语义预测处理的结果确定每个候选句子与其他候选句子的语义相似度,得到语义相似度矩阵,包括:
对所有所述候选句子进行语义预测处理,得到每个候选句子的语义向量;
根据每个候选句子的语义向量与其他候选句子的语义向量确定每个候选句子与其他候选句子的语义相似度,得到所述语义相似度矩阵。
4.根据权利要求3所述的自动生成文本方法,其特征在于,对所有所述候选句子进行语义预测处理,得到每个候选句子的语义向量,包括:
通过语义预测工具结合训练语料进行训练模型处理,得到语义预测模型;
通过所述语义预测模型预测所有所述候选句子的语义分布,得到每个候选句子的语义向量。
5.根据权利要求4所述的自动生成文本方法,其特征在于,根据每个候选句子的语义向量与其他候选句子的语义向量确定每个候选句子与其他候选句子的语义相似度,得到所述语义相似度矩阵,包括:
根据每个候选句子的语义向量与其他候选句子的语义向量进行余弦相似度计算,得到对应的余弦相似度;
将所有所述余弦相似度作为所述语义相似度,得到所述语义相似度矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珍岛信息技术(上海)股份有限公司,未经珍岛信息技术(上海)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810185592.7/1.html,转载请声明来源钻瓜专利网。