[发明专利]一种分词方法及系统有效
申请号: | 201911210176.9 | 申请日: | 2019-11-29 |
公开(公告)号: | CN110991173B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 陈显玲 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/216 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 袁春晓;朱璟 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本说明书实施例提供一种分词方法及系统。分词方法包括:候选词获取:基于第一位置从单句语料中获取预设字数的候选词;候选词截断:将候选词从一个或多个拆分位置处拆分,至少基于候选词中各拆分后子词的统计特征,从一个或多个拆分位置中确定候选词的截断位置;当截断位置位于候选词的结束位置时,将候选词确定为一个独立的分词;当截断位置位于候选词内部时,基于截断位置获取候选词的部分,将所述部分作为新的候选词进行至少一轮“候选词截断”处理,直至将所述部分拆分为一个或多个独立的分词;将截断位置作为第一位置从“候选词获取”开始进行下一轮循环;依此,将单句语料拆分为一个或多个独立的分词。 | ||
搜索关键词: | 一种 分词 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911210176.9/,转载请声明来源钻瓜专利网。