[发明专利]中文分词方法及装置在审
申请号: | 201811639636.5 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109684645A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 申化泽;竺成浩 | 申请(专利权)人: | 北京泰迪熊移动科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京卓唐知识产权代理有限公司 11541 | 代理人: | 唐海力;李志刚 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种中文分词方法及装置。该方法包括对输入中文文本分别进行命名实体识别和深度学习分词,得到的结果作为新词集合;对所述新词集合采用基于词典的分词方法,得到中文分词结果,其中,所述命名实体识别中至少包括:深度学习命名实体识别和机器学习命名实体识别。本申请解决了中文分词方法效果较差的技术问题。结合了深度学习分词、深度学习命名实体识别、机器学习命名实体识别和基于词典分词,不仅具有很好的泛化能力,而且具有很好的准确率。此外,采用自定义词典,增加了分词系统的可维护性。 | ||
搜索关键词: | 命名实体 中文分词 分词 机器学习 集合 学习 自定义词典 分词系统 可维护性 输入中文 准确率 申请 文本 | ||
【主权项】:
1.一种中文分词方法,其特征在于,包括:对输入中文文本分别进行命名实体识别和深度学习分词,得到的结果作为新词集合;对所述新词集合采用基于词典的分词方法,得到中文分词结果,其中,所述命名实体识别中至少包括:深度学习命名实体识别和机器学习命名实体识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京泰迪熊移动科技有限公司,未经北京泰迪熊移动科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811639636.5/,转载请声明来源钻瓜专利网。