[发明专利]生成式文本摘要系统和方法在审
申请号: | 202110276136.5 | 申请日: | 2021-03-15 |
公开(公告)号: | CN113407709A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 宋凯强;王秉卿 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 任一方;周学斌 |
地址: | 德国斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 文本 摘要 系统 方法 | ||
1.一种用于生成式文本摘要模型的方法,包括:
接收输入文本数据集;
为将被选择以包括在文本摘要中的一个或多个候选单词扩大搜索空间,其中使用最佳优先搜索算法对搜索空间内包括的所述一个或多个候选单词进行排名;和
使用软界限单词奖励(SBWR)算法对将包括在文本摘要中的所述一个或多个候选单词重新排名,其中当文本摘要超过预测长度阈值时,SBWR算法将递减的奖励值应用于所述一个或多个候选单词,并且其中当文本摘要在预测长度阈值以下时,SBWR算法将增加的奖励值应用于所述一个或多个候选单词。
2.根据权利要求1所述的方法,其中当文本摘要等于预测长度阈值时,SBWR算法选择所述一个或多个候选单词。
3.根据权利要求1所述的方法,其中SBWR算法使用以下公式操作:。
4.根据权利要求1所述的方法,进一步包括:使用sigmoid函数使递减的奖励值和增加的奖励值平滑。
5.根据权利要求1所述的方法,进一步包括:使用被训练来选择将包括在文本摘要中的所述一个或多个候选单词的值来对递减的奖励值和增加的奖励值进行缩放。
6.根据权利要求1所述的方法,当输入文本数据集超过预定义长度阈值时,对所述一个或多个候选单词进行重新排名。
7.根据权利要求1所述的方法,进一步包括:计算BP标准化,所述BP标准化将惩罚应用于不满足预测长度阈值的所述一个或多个候选单词。
8.根据权利要求7所述的方法,其中通过将简短惩罚的对数值与长度标准化评分函数相加来计算所述BP标准化。
9.根据权利要求8所述的方法,其中所述简短惩罚被设计成使得生成式文本摘要模型不从输入文本数据集产生短翻译。
10.根据权利要求8所述的方法,其中,所述简短惩罚包括将简短惩罚降低到零的复制率值。
11.根据权利要求1所述的方法,进一步包括:使用变换器神经模型来训练生成式文本摘要模型。
12.根据权利要求11所述的方法,其中所述变换器神经模型包括编码器机器学习算法和解码器机器学习算法。
13.根据权利要求12所述的方法,进一步包括:将输入文本数据集输入到编码器机器学习算法;以及向解码器机器学习算法输入目标摘要文本数据集。
14.根据权利要求13所述的方法,其中所述变换器神经模型使用一个或多个源标记来确定用于一个或多个目标摘要标记的概率值。
15.根据权利要求14所述的方法,其中所述变换器神经模型基于以下等式使用所述一个或多个源标记来确定用于所述一个或多个目标摘要标记的概率值:。
16.一种可操作来采用生成式文本摘要模型的系统,包括:
存储器,可操作来存储输入文本数据集;
处理器,可操作用于:
为将被选择以包括在文本摘要中的一个或多个候选单词扩大搜索空间,其中使用最佳优先搜索算法对搜索空间内包括的所述一个或多个候选单词进行排名;和
使用软边界单词奖励(SBWR)算法对将包括在文本摘要中的所述一个或多个候选单词重新排名,其中当文本摘要超过预测长度阈值时,SBWR算法将递减的奖励值应用于所述一个或多个候选单词,并且其中当文本摘要在预测长度阈值以下时,SBWR算法将增加的奖励值应用于所述一个或多个候选单词。
17.根据权利要求16所述的系统,其中当文本摘要等于预测长度阈值时,SBWR算法选择所述一个或多个候选单词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110276136.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于背面平面视图薄片制备的方法和系统
- 下一篇:马达控制装置