[发明专利]汉语韵律层级结构预测系统有效
申请号: | 201610642956.0 | 申请日: | 2016-08-08 |
公开(公告)号: | CN106227721B | 公开(公告)日: | 2019-02-01 |
发明(设计)人: | 陶建华;郑艺斌;李雅;温正棋 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙) 11482 | 代理人: | 宋宝库 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种汉语韵律层级结构预测系统。其中,该系统包括:文本分析模块输出分析完成的文本数据;文本特征参数化模块输出参数化的文本特征;字词向量联合训练模块接收所述文本分析模块生成的所述分析完成的文本数据,输出文本的用字向量进行增强的词向量表示模型;词向量生成模块利用用字向量进行增强的词向量表示模型,输出分析完成文本数据的字向量增强的词向量;第一单分类器训练模块输出第一映射模型;第二单分类器训练模块输出第二映射模型;特征重要性排序模块输出具有预定分类性能的文本参数特征;模型融合模块输出所述韵律层级结构预测的结果。通过本发明实施例提高了韵律结构层级预测的准确性。 | ||
搜索关键词: | 汉语 韵律 层级 结构 预测 系统 | ||
【主权项】:
1.一种汉语韵律层级结构预测系统,其特征在于,所述预测系统包括:文本分析模块,用于接收待分析的文本数据,输出分析完成的文本数据;文本特征参数化模块,与所述文本分析模块相连,用于接收所述分析完成的文本数据,输出参数化的文本特征;字词向量联合训练模块,与所述文本分析模块相连,用于接收所述文本分析模块生成的所述分析完成的文本数据,并联合训练基于字向量和词向量的语言模型,输出文本的用字向量进行增强的词向量表示模型;词向量生成模块,用于基于所述文本分析模块输出的所述分析完成的文本数据,利用所述用字向量进行增强的词向量表示模型,输出所述分析完成的文本数据的字向量增强的词向量;第一单分类器训练模块,与所述文本特征参数化模块相连,用于训练从所述文本特征参数化模块输出的所述参数化的文本特征到韵律层级结构的第一映射模型;第二单分类器训练模块,与所述词向量生成模块相连,用于训练从所述词向量生成模块输出的所述字向量增强的词向量到所述韵律层级结构的第二映射模型;特征重要性排序模块,与所述第一单分类器训练模块相连,用于输出具有预定分类性能的文本参数特征;模型融合模块,与所述第一单分类器训练模块、所述第二单分类器训练模块和所述特征重要性排序模块相连,用于接收所述第一单分类器训练模块和所述第二单分类器训练模块输出的所述第一映射模型和所述第二映射模型以及由所述特征重要性排序模块输出的所述具有预定分类性能的文本参数特征,并采用集成学习方法对所述第一单分类器训练模块和所述第二单分类器训练模块在决策层进行融合,从而输出所述韵律层级结构预测的结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610642956.0/,转载请声明来源钻瓜专利网。