[发明专利]一种基于HanLP的电力设备中文分词方法在审
| 申请号: | 201811510609.8 | 申请日: | 2018-12-11 |
| 公开(公告)号: | CN109558595A | 公开(公告)日: | 2019-04-02 |
| 发明(设计)人: | 何熹;段正杰;刘涛;袁俊锋 | 申请(专利权)人: | 河南恩湃高科集团有限公司 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27 |
| 代理公司: | 郑州联科专利事务所(普通合伙) 41104 | 代理人: | 刘建芳 |
| 地址: | 450001 河南省*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于HanLP的电力设备中文分词方法,具体过程为:输入电力设备中文名称文本字符串;依次使用多种分词方法并得到若干种分词结果;使用电力领域专用分词词典与权重比重,对分词结果进行遴选;计算分词结果的综合评定分值,采纳一个最大分值的分词结果;本发明创新性地结合面向电力领域的分词词典库,融合HMM分词、NLP分词、索引分词、最短路径分词等方法,能够更加快速、准确地对电力特定领域的中文文本进行分词,提高了分词结果的准确性与可靠性。 | ||
| 搜索关键词: | 分词 分词结果 电力领域 电力设备 中文分词 创新性地 名称文本 输入电力 中文文本 综合评定 最短路径 词典库 权重 索引 融合 中文 | ||
【主权项】:
1.一种基于HanLP的电力设备中文分词方法,其特征在于:包括以下步骤:输入电力设备中文名称文本字符串;依次使用多种分词方法并得到若干种分词结果;使用电力领域专用分词词典与权重比重,对分词结果进行遴选;计算分词结果的综合评定分值,采纳一个最大分值的分词结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南恩湃高科集团有限公司,未经河南恩湃高科集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811510609.8/,转载请声明来源钻瓜专利网。





