[发明专利]一种基于隐马尔可夫模型的词性标注方法在审
申请号: | 202010447611.6 | 申请日: | 2020-05-25 |
公开(公告)号: | CN111814464A | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 张羽昂;梁寒杲;王景璟;任勇 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06K9/62 |
代理公司: | 北京翔石知识产权代理事务所(普通合伙) 11816 | 代理人: | 李勇 |
地址: | 100084 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 隐马尔可夫 模型 词性 标注 方法 | ||
1.一种基于隐马尔可夫模型的词性标注方法,其特征在于,
基于HMM模型的初步描述,在所述HMM模型上的Viterbi算法给出所述Viterbi算法的具体代码实现。
2.根据权利要求1所述的基于隐马尔可夫模型的词性标注方法,其特征在于,所述基于HMM模型的初步描述的过程为:
对随机变量序列X1,X2,...,Xn满足P(Xn|X1,X2,...,Xn-1)=P(Xn|Xn-1),利用已知的信息,通过求解Xn的转移概率矩阵方法获取随机变量序列Xn的性质,进而解决问题。
3.根据权利要求1所述的基于隐马尔可夫模型的词性标注方法,其特征在于,所述HMM模型上的Viterbi算法的过程为:
(1)根据初始状态分布π生成初始状态;
(2)t=1;
(3)根据B和状态it生成Ot;
(4)根据A和it生成it+1;
(5)t=t+1,如果tT则跳回(3),否则结束。
4.根据权利要求1所述的基于隐马尔可夫模型的词性标注方法,其特征在于,所述Viterbi算法的具体代码如下:
5.根据权利要求1所述的基于隐马尔可夫模型的词性标注方法,其特征在于,基于Viterbi算法的词性标注的过程为:
(1)确定到达下一个状态的最可能路径,并记录其状态;
Φt(i)=argmaxjδt-1(i)·aji,其中t=2,3,......,T i=1,2,......,n;
(2)确定系统完成时最可能的隐藏状态;
it=argmax(δT(i));
(3)所述最可能的状态路径在整个网格回溯,回溯完成时生成观察序列的最可能的隐藏状态序列;
it=φt+1(it+1)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010447611.6/1.html,转载请声明来源钻瓜专利网。