|
钻瓜专利网为您找到相关结果 55094个,建议您 升级VIP下载更多相关专利
- [发明专利]处理方法和装置、用于处理的装置-CN201710162165.2有效
-
郑宏
-
北京搜狗科技发展有限公司
-
2017-03-17
-
2022-09-23
-
G06F40/166
- 本发明实施例提供了一种处理方法和装置、以及一种用于处理的装置,其中的方法具体包括:获取待处理文本;对所述待处理文本进行分词,以得到所述待处理文本对应的全局词序列;对所述全局词序列进行标点添加处理,以得到所述待处理文本对应的最优标点添加结果;其中,所述标点添加处理在所述全局词序列中相邻词之间添加目标标点符号,所述最优标点添加结果对应的语言模型概率最优,所述最优标点添加结果包括:至少一个语义片段,所述语义片段包括:所述全局词序列的连续词,和/或,添加有标点符号的连续词;输出所述最优标点添加结果。本发明实施例能够提高添加标点的准确度。
- 处理方法装置用于
- [发明专利]标点添加方法及装置-CN201611109690.X在审
-
陈峰
-
北京云知声信息技术有限公司
-
2016-12-02
-
2017-05-10
-
G10L15/26
- 本发明是关于一种标点添加方法及装置,其中,方法包括获取包含标点的预设训练语料信息;利用所述预设训练语料信息和预设的网络模型结构进行训练,得到标点添加模型,其中,所述预设的网络模型结构包括编码器结构和解码器结构;接收用户输入的语音数据信息;对所述语音数据信息进行识别,得到所述语音数据信息对应的文本信息和停顿信息;根据所述文本信息、所述停顿信息和所述标点添加模型,确定所述文本信息对应的标点信息。通过该技术方案,可以实现简单方便地实现标点符号的自动添加,并提高标点符号添加的准确性和灵活性。
- 标点添加方法装置
- [发明专利]一种基于BERT的中文ASR输出文本修复方法及系统-CN202210434469.0在审
-
武星;张源
-
上海大学
-
2022-04-24
-
2022-09-09
-
G06F40/232
- 本发明提出了一种基于BERT的中文ASR文本修复方法及系统,该系统包含:中文标点符号预测模型和中文纠错模型。中文标点预测模型基于BERT进行了两方面的改进:使用RoBERTa模型替换基础BERT模型,通过改变预训练任务中的掩码策略来提高模型的效率;通过提取字音和字形两个嵌入给模型提供更多的中文额外信息。通过这两个方面的改动提出了目前较为完整的中文标点符号预测模型。中文纠错模型使用PLOME预训练模型,该模型的特点也是结合了中文额外特征来提高模型对中文的理解能力。通过简单的结合,本发明得到了一个端到端的中文ASR文本修复系统,其首次结合了中文标点符号预测以及中文纠错两个任务,对错误的文本进行两个角度的纠错,可以显著地提高文本的使用效率。
- 一种基于bert中文asr输出文本修复方法系统
- [发明专利]文本处理方法及装置-CN202211742186.9在审
-
谢畅
-
上海哔哩哔哩科技有限公司
-
2022-12-30
-
2023-04-11
-
G06F40/211
- 本申请实施例提供一种文本处理方法,方法包括:获取第一训练样本,以第一训练样本训练第一掩码语言模型,得到预训练的第一模型,其中,第一训练样本为至少缺失部分标点符号的文本片段;构建原始语句分割模型,获取第一模型的模型参数,以第一模型的模型参数初始化原始语句分割模型,得到初始化后的语句分割模型;获取第二训练样本,以第二训练样本训练初始化后的语句分割模型,得到训练好的语句分割模型,其中,第二训练样本为至少缺失部分标点符号的文本片段本申请实施例提供的文本处理方法,可以对缺少标点符号的文本进行自动分句。
- 文本处理方法装置
|