[发明专利]基于部件组合的梵音藏文联机手写样本生成方法有效
申请号: | 201610349438.X | 申请日: | 2016-05-24 |
公开(公告)号: | CN106056055B | 公开(公告)日: | 2019-05-03 |
发明(设计)人: | 王维兰;卢小宝;蔡正琦;才科扎西;沈文韬;付吉 | 申请(专利权)人: | 西北民族大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 甘肃省知识产权事务中心 62100 | 代理人: | 刘继春 |
地址: | 730030 甘*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于中文信息及数据处理技术领域。现代藏文有500多个字丁,加上梵音藏文共计7240个字丁,在文字识别领域属于大类别的字符集,其样本采集是庞大而复杂的工程,鉴于此,本发明提供了一种基于部件组合的梵音藏文手写样本生成方法;主要包括:(1)确定梵音藏文字符集和梵音藏文部件集;(2)梵音藏文字丁的部件位置信息获取;(3)联机手写梵音藏文部件的样本采集;(4)联机手写梵音藏文字符集样本库的生成。本发明为联机手写梵音藏文识别的研究提供字符训练样本库和测试样本库,本发明提高了手写梵音藏文样本采集效率和样本多样性,降低了样本采集成本,既可以用于联机手写样本采集,也可以用于脱机手写样本采集。 | ||
搜索关键词: | 基于 部件 组合 梵音 藏文 联机 手写 样本 生成 方法 | ||
【主权项】:
1.一种基于部件组合的梵音藏文联机手写样本生成方法,其特征在于步骤为:(a)确定梵音藏文字符集和梵音藏文部件集;梵音藏文字符集由7240个字丁组成,部件集由81个基本集字符和85个构件组成,形成166个部件的梵音藏文部件集;(b)梵音藏文字丁的部件位置信息获取;将7240个梵音藏文的每一个字丁放置于xy平面的大小为M×N的框内,标注该字丁各个部件的外接矩形框,获取并存储该字丁各个部件的坐标数据信息;(c)联机手写梵音藏文部件的样本采集;将166个部件中的待采集部件显示在其部件矩形显示框,采集人员根据部件矩形显示框所显示的部件,在采集区域矩形空白框书写相同的部件,并保存采集部件的信息,完成第1到第166个部件的采集和存储形成一套样本,所有参加采集人员重复该步骤,完成与参加采集人员数量相同的部件样本套数,得到部件样本库;(d)联机手写梵音藏文字符集样本库的生成;根据步骤(b)所获取的字丁各个部件的坐标数据信息,将字丁的部件样本逐一从部件样本库中取出,依次按照它们的位置信息映射到对应位置矩形,便得到字丁的样本;生成7240个梵音藏文字丁的4000~7000套样本。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北民族大学,未经西北民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610349438.X/,转载请声明来源钻瓜专利网。