[发明专利]一种中文代词消解模型建立方法及装置在审
申请号: | 201610711459.1 | 申请日: | 2016-08-23 |
公开(公告)号: | CN107766320A | 公开(公告)日: | 2018-03-06 |
发明(设计)人: | 温海娇;陈虹;牛国扬;许慢 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 深圳鼎合诚知识产权代理有限公司44281 | 代理人: | 江婷,李发兵 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明一方面提供了一种中文代词消解模型建立方法,包括将语料样本文件经过预处理得到训练样本文件;将所述训练样本文件,按照预先设置的模型进行编码得到词向量矩阵特征库;将所述词向量矩阵特征库,按照预先设置的长短期记忆神经网络算法LSTM处理得到中文代词消解模型。希望在海量数据的基础上,利用深度学习自动挖掘文本的上下文语义、位置等特征,进而解决现有技术中需要人工参与构建人名和人称代词语义特征和泛化能力差的技术问题。该方法及装置人工干预少,实现模型增量更新,泛化能力强,可以应用于智能问答、信息关系抽取、自动生成摘要、机器翻译等系统,帮助机器更好地理解句子含义,提升用户体验。 | ||
搜索关键词: | 一种 中文 代词 消解 模型 建立 方法 装置 | ||
【主权项】:
一种中文代词消解模型建立方法,其特征在于,包括:将语料样本文件经过预处理得到训练样本文件;将所述训练样本文件,按照预先设置的模型进行编码得到词向量矩阵特征库;将所述词向量矩阵特征库,按照预先设置的长短期记忆神经网络算法LSTM处理得到中文代词消解模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610711459.1/,转载请声明来源钻瓜专利网。