[发明专利]动态宽度最大化解码方法、文本生成方法及存储介质有效

专利信息
申请号: 202210547659.3 申请日: 2022-05-18
公开(公告)号: CN114925659B 公开(公告)日: 2023-04-28
发明(设计)人: 陈峥;陶锐文 申请(专利权)人: 电子科技大学
主分类号: G06F40/126 分类号: G06F40/126;G06F40/216;G06F40/289;G06F16/335;G06N3/045;G06N3/047;G06N3/08
代理公司: 苏州德萃知识产权代理有限公司 32629 代理人: 官玉梅
地址: 610000 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 动态 宽度 最大化 解码 方法 文本 生成 存储 介质
【权利要求书】:

1.一种动态宽度最大化解码方法,应用于文本生成过程中,其特征在于,该方法包括如下步骤:

根据语言模型处理模块生成的概率分布集合,选择候选集,具体包括:根据搜索宽度K限制候选集的数量;根据概率过滤参数P,从每个候选集的生成的概率分布中选择核心字符;

计算选择得到字符对应的生成该字符候选序列的概率序列得分;

选择得分最大的K个候选序列作为输出文本,其中K为搜索宽度;此外,

对于每个候选序列最多选择K个候选集;

当候选序列由于概率过滤参数P的过滤而小于搜索宽度K时,不进行补齐;

对于语言模型输出的概率分布集合,从中选择最后一个字符的概率分布d:

(i)从概率分布d中选择n个概率最大的字符,并限制这些字符的概率和小于P,n的大小由P决定,其中n为正整数,P为0-1之间的一个数;

(ii)以搜索宽度K截取K个字符W;

(iii)对于K个字符W中的每个字符w:计算序列的信息分数,信息分数为所有字符信息量之和的平均值。

2.根据权利要求1所述的动态宽度最大化解码方法,其特征在于:

按照搜索宽度和候选集计算得到的分数对候选序列进行更新。

3.根据权利要求1至2任意一项所述的动态宽度最大化解码方法,其特征在于:

所述语言模型处理模块为Transformer语言模型处理模块。

4.一种文本生成方法,其特征在于:所述文本生成方法为密码猜测集生成方法;并且,在生成密码猜测集的过程中还包括如下步骤:

1)文本预处理步骤:采用文本词条化工具对数据集进行文本预处理,所述文本预处理包括数据清洗、文本转码或编码;

2)语言模型处理步骤:根据文本预处理的结果,训练语言模型处理模块,生成下一可能字符的概率表;

3)波束搜索解码步骤:根据权利要求1至3任意一项所述的动态宽度最大化解码方法,利用语言模型处理模块的输出结果动态调整解码时波束搜索的宽度,并从中采样以生成候选集;

4)碰撞步骤:清洗数据集,将生成的密码猜测集与密码测试集进行匹配碰撞。

5.一种存储介质,该存储介质上存储有计算机代码,其特征在于:处理器通过读取该存储介质上的计算机代码,以执行权利要求1~3任意一种所述的动态宽度最大化解码方法,或权利要求4所述的文本生成方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210547659.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top