[发明专利]自然语言分词构造方法及系统、自然语言分类方法及系统有效
申请号: | 201710852703.0 | 申请日: | 2017-09-19 |
公开(公告)号: | CN107491440B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 罗欢;权圣 | 申请(专利权)人: | 马上消费金融股份有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/289;G06F16/33;G06F16/35 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静 |
地址: | 401121 重庆市渝北区*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种自然语言分词构造方法,该方法包括:获取自然语言的Ngram分词,将Ngram分词按照位置序列顺序进行非连续组合,得到组合分词。可见,在原有的Ngram分词基础之上,再将得到的Ngram分词按照位置序列顺序进行组合,通过这样的方法加大了自然语言的表达能力,进而提高自然语言的分类准确率。并且,在本方案中,进一步的对组合分词设置窗口大小,以避免产生过多的组合分词特征量,提高了对自然语言的分类速度。相应的,本发明还公开了一种自然语言分词构造系统、一种自然语言分类方法及系统,同样具有上述有益效果。 | ||
搜索关键词: | 自然语言 分词 构造 方法 系统 分类 | ||
【主权项】:
一种自然语言分词构造方法,其特征在于,包括:获取自然语言的Ngram分词;将所述Ngram分词按照位置序列顺序进行非连续组合,得到组合分词。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马上消费金融股份有限公司,未经马上消费金融股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710852703.0/,转载请声明来源钻瓜专利网。