[发明专利]基于音节驱动的音译实体名的计算机自动识别方法无效

申请号：	200710166174.5	申请日：	2007-11-13
公开（公告）号：	CN101145166A	公开（公告）日：	2008-03-19
发明（设计）人：	陈沛;郭永福;许欢庆	申请（专利权）人：	北京中搜在线软件有限公司
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	暂无信息	代理人：	暂无信息
地址：	100088北京市海淀区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种基于音节驱动的音译实体名的计算机自动识别方法，包括用于计算机检索的音译名，先获原始可信音译名库；再构建用于识别音译实体名的音节信息库；组成大容量的音译名语料库；以原始可信音译名库的音译名为基础统计识别音译名出现的错误类别，修正该音译名语料库，利用该音译名语料库对音译实体名进行自动识别。本发明充分利于音译名用字的构成规律，对计算机自动识别的对比音译名语料库进行渐进式整理，分析提高了识别精度，并通过音节的统计学习得到计算机识别精度更高的音译名资料库，从而建立大型的高精准度音译名资料库并提高搜索中音译名识别精度的，大大降低的音译名实体搜索工程中错误的触发几率和边界识别错误的几率。
搜索关键词：	基于音节驱动音译实体计算机自动识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于音节驱动的音译实体名的计算机自动识别方法，包括用于计算机检索的音译名，其特征在于所述自动识别方法包括如下步骤：(1)从正文库中提取音译名，获得一定容量的可信的音译名样本组成原始可信音译名库；(2)对原始可信音译名库进行统计分析，构建用于识别音译实体名的音节信息库；(3)利用步骤(2)得到的音节信息库在待识别正文库中挑选音译名，组成大容量的音译名语料库；(4)以原始可信音译名库的音译名为基础统计识别步骤(3)得到的音译名语料库的音译名出现的错误类别，修正该音译名语料库，提高识别精度；(5)利用步骤(4)得到的音译名语料库对输入的音译实体名进行自动识别。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京中搜在线软件有限公司，未经北京中搜在线软件有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/200710166174.5/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于音节驱动的音译实体名的计算机自动识别方法无效

专利文献下载