[发明专利]一种电力系统操作票内容提取方法及系统在审

专利信息
申请号: 201711094578.8 申请日: 2017-11-09
公开(公告)号: CN108021552A 公开(公告)日: 2018-05-11
发明(设计)人: 陆承宇;罗华峰;丁峰;阮黎翔;王松;吴栋萁;鲍威;刘俊宏 申请(专利权)人: 国网浙江省电力公司电力科学研究院;国家电网公司;杭州沃瑞电力科技有限公司
主分类号: G06F17/27 分类号: G06F17/27;G06Q10/06;G06Q50/06
代理公司: 浙江翔隆专利事务所(普通合伙) 33206 代理人: 张建青
地址: 310014 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 电力系统 操作 内容 提取 方法 系统
【权利要求书】:

1.一种电力系统操作票内容提取方法,其特征在于,包括:

建立基于隐马尔可夫模型的由字构词的中文分词模型,根据该中文分词模型得到中文操作票指令的分词结果;

建立基于隐马尔可夫模型的词性标注模型,根据该词性标注模型标注词语词性,得到词性序列;

使用训练语料分别对中文分词和词性标注两个模型进行训练;

按照电力系统操作票语法规则,实现电力系统操作票中动作及对象的智能化提取。

2.根据权利要求1所述的电力系统操作票内容提取方法,其特征在于,所述基于隐马尔可夫模型的由字构词的中文分词模型如下:

中文分词模型将中文分词转化为字的序列标注,按照字在词中位置不同,字的词位包括单独成词S、词首B、词中M和词尾E,对于一个含有n个字的中文字符串{x1,…xi,…,xn},基于隐马尔可夫模型的字的词位标注{y1,…yi,…,yn}的联合概率分布为:

P ( { x 1 , y 1 ... x n , y n } ) = P ( y 1 ) P ( x 1 | y 1 ) Π i = 2 n P ( y i | y i - 1 ) P ( x i | y i ) = π [ y 1 ] B [ y 1 , x 1 ] Π i = 2 n A [ y i - 1 , y i ] B [ y 1 , x 1 ] , ]]>

式中,第i个字xi的词位yi∈{S,B,M,E},π、A、B分别对应隐马尔可夫模型的初始状态、状态转移、观测状态概率矩阵参数;

根据隐马尔科夫模型的参数估计方法得到匹配训练语料的中文分词模型参数;给定输入序列,根据维特比算法计算得到上式的最大值,并得到对应的词位序列,在词位为S或E的字后面断句实现分词。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力公司电力科学研究院;国家电网公司;杭州沃瑞电力科技有限公司,未经国网浙江省电力公司电力科学研究院;国家电网公司;杭州沃瑞电力科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711094578.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top