[发明专利]帐票处理方法、帐票处理装置以及计算机产品有效
申请号: | 200610166798.2 | 申请日: | 2006-11-30 |
公开(公告)号: | CN101118597A | 公开(公告)日: | 2008-02-06 |
发明(设计)人: | 皆川明洋;武部浩明;藤本克仁 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00;G06K9/20 |
代理公司: | 北京三友知识产权代理有限公司 | 代理人: | 李辉;吕俊刚 |
地址: | 日本神奈*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种帐票处理方法、帐票处理装置以及计算机产品。该帐票处理装置从帐票文件提取版面信息和字符信息。候选提取单元从字符信息提取候选单词。频率数字化单元根据各个元素计算候选单词的出现概率。关系数字化单元计算建立候选单词之间关系的迁移概率。评价单元计算表示各逻辑元素中的候选单词的出现概率的评价值。确定单元根据该评价值,将该元素及其候选单词确定为帐票文件中的元素及其字符串。 | ||
搜索关键词: | 处理 方法 装置 以及 计算机 产品 | ||
【主权项】:
1.一种记录介质,该记录介质中存储有帐票处理程序,该帐票处理程序使得计算机使用存储有与逻辑地构成帐票文件的逻辑元素的层级逻辑结构相关的数据、要成为逻辑元素的字符串的出现频率、以及与帐票文件上的逻辑元素之间的相对位置有关的频率的数据库,来识别该帐票文件中的逻辑结构,所述帐票处理程序使计算机执行:根据与存储在所述数据库中的要成为逻辑元素的字符串的一致性,从所述帐票文件中的字符串当中提取字符串作为候选单词;根据所述出现频率计算所述候选单词作为逻辑元素出现的出现概率;根据与相对位置相关的频率来计算迁移概率,该迁移概率是一个逻辑元素的候选单词和另一逻辑元素的候选单词以组合的形式出现的概率;以及根据所述出现概率和所述迁移概率,计算所述逻辑元素的候选单词是与所述逻辑元素相对应的字符串的可信度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200610166798.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种用于折叠桌的翻转结构
- 下一篇:聚苯板切割机