[发明专利]一种基于条件随机场的电信领域命名实体识别方法在审
申请号: | 201711096147.5 | 申请日: | 2017-11-09 |
公开(公告)号: | CN107832296A | 公开(公告)日: | 2018-03-23 |
发明(设计)人: | 章韵;张歌 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 南京经纬专利商标代理有限公司32200 | 代理人: | 徐莹 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于条件随机场的电信领域命名实体识别方法,包括步骤将语料转化为条件随机场CRF模型的输入格式并利用基于词的标注模型对其进行标注;选择上下文窗口大小及从候选特征集中选取特征以构建特征模版;定义条件随机场CRF模型的特征模版,将得到的语料及特征模版输入条件随机场CRF模型,得到电信领域命名实体识别CRF模型,并利用电信领域命名实体识别CRF模型进行待识别电信文本中的电信领域命名实体识别获得输出结果;从所得输出结果中还原识别出的电信领域命名实体。本发明通过自动化的方法进行电信领域命名实体抽取,在一定程度上提高了电信领域命名实体识别的效率,并且能够保证电信领域命名实体识别结果具有较好的准确率和召回率。 | ||
搜索关键词: | 一种 基于 条件 随机 电信 领域 命名 实体 识别 方法 | ||
【主权项】:
一种基于条件随机场的电信领域命名实体识别方法,其特征在于,包括以下步骤:步骤1、将语料转化为条件随机场CRF模型的输入格式并利用基于词的标注模型对其进行标注;步骤2、选择上下文窗口大小及从候选特征集中选取特征以构建特征模版;步骤3、定义条件随机场CRF模型的特征模版,将经步骤1得到的语料以及步骤2所得特征模版输入条件随机场CRF模型,得到电信领域命名实体识别CRF模型,并利用电信领域命名实体识别CRF模型进行待识别电信文本中的电信领域命名实体识别获得输出标注结果;步骤4、从步骤3所得输出标注结果中还原识别出的电信领域命名实体。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711096147.5/,转载请声明来源钻瓜专利网。