[发明专利]一种句读预测方法、装置、电子设备和存储介质在审
申请号: | 202211191760.6 | 申请日: | 2022-09-28 |
公开(公告)号: | CN115640811A | 公开(公告)日: | 2023-01-24 |
发明(设计)人: | 王愈;陈明;李健;武卫东 | 申请(专利权)人: | 北京捷通华声科技股份有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06N3/048;G06N3/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100193 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 句读 预测 方法 装置 电子设备 存储 介质 | ||
1.一种句读预测方法,其特征在于,包括:
获取待处理文本;
生成所述待处理文本中各个字符的字向量;
将所述字向量输入预先训练的句读预测模型中进行处理,得到所述字向量的隐藏状态;其中,所述句读预测模型包括输入门模块、遗忘门模块、停顿间隔累计模块和输出门模块;通过所述输入门模块及遗忘门模块基于当前时间步输入的字向量、上一时间步输出的隐藏状态及上一时间步输出的细胞状态更新得到当前时间步的细胞状态;通过停顿间隔累计模块基于所述当前时间步输入的字向量、所述上一时间步输出的隐藏状态及当前时间步的停顿间隔累计计数得到当前时间步的间隔距离信息;通过所述输出门模块基于所述当前时间步输入的字向量、所述上一时间步输出的隐藏状态、所述当前时间步的细胞状态、所述当前时间步的间隔距离信息得到当前时间步的隐藏状态;
根据所述句读预测模型输出的各个所述字向量的隐藏状态,得到待处理文本中各个字符的句读预测结果。
2.根据权利要求1所述的方法,其特征在于,所述通过停顿间隔累计模块基于所述当前时间步输入的字向量、所述上一时间步输出的隐藏状态及当前时间步的停顿间隔累计计数得到当前时间步的间隔距离信息,包括:
获取上一时间步的停顿间隔累计计数,在上一时间步的停顿间隔累计计数的基础上增加预设数值得到当前时间步停顿间隔累计计数;
根据所述当前时间步输入的字向量、所述上一时间步输出的隐藏状态得到当前时间步统计期望均值和方差;
对所述当前时间步的停顿间隔累计计数、所述统计期望均值和所述方差进行高斯似然度计算,得到当前时间步的间隔距离信息。
3.根据权利要求1所述的方法,其特征在于,所述通过所述输出门模块基于所述当前时间步输入的字向量、所述上一时间步输出的隐藏状态、所述当前时间步的细胞状态、所述当前时间步的间隔距离信息得到当前时间步的隐藏状态,包括:
根据所述当前时间步输入的字向量、所述上一时间步输出的隐藏状态计算得到当前时间步的细胞状态输出权重值;
根据所述权重值,对所述当前时间步的细胞状态及所述当前时间步的间隔距离信息进行加权求和,得到当前时间步的隐藏状态。
4.根据权利要求1所述的方法,其特征在于,所述根据所述句读预测模型输出的各个所述字向量的隐藏状态,得到待处理文本中各个字符的句读预测结果,包括:
将各个所述字向量的隐藏状态输入全连接层,得到待处理文本中各个字符的句读标签;将所述各个字符的句读标签输入条件随机场模块对相邻标签进行语义关系判断,得到待处理文本中各个字符的句读预测结果。
5.根据权利要求1所述的方法,其特征在于,所述句读预测模型包括正向句读预测模型和反向句读预测模型,所述将所述字向量输入预先训练的句读预测模型中进行处理,得到所述字向量的隐藏状态,包括:
将所述字向量输入预先训练的所述正向句读预测模型中,得到所述字向量的第一隐藏状态;
将所述字向量输入预先训练的所述反向句读预测模型中,得到所述字向量的第二隐藏状态;
将所述字向量的第一隐藏状态和所述第二隐藏状态进行加和得到所述字向量的隐藏状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211191760.6/1.html,转载请声明来源钻瓜专利网。