[发明专利]应用了图像处理的文档结构分析装置有效
申请号: | 201580084903.5 | 申请日: | 2015-12-21 |
公开(公告)号: | CN108369559B | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 小岛美津夫;横山淳;铃木龙生;沼田翔平 | 申请(专利权)人: | 艾梅崔克斯株式会社 |
主分类号: | G06F13/00 | 分类号: | G06F13/00 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 黄纶伟;金玲 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供一种能够精度良好地容易且高速地进行垃圾邮件的判定的文档结构分析装置。邮件处理装置(100)构成为包括:数据取得部(112),其从网络(NW)取得样本数据和电子邮件;信号化部(114),其对由数据取得部(112)取得的样本数据等进行n值化;样本存储部(120),其存储被信号化部(114)进行n值化后的数据;信号处理部(130),其比较存储于样本存储部(120)中的n值化后的样本数据与所输入的电子邮件,根据它们的类似度来判定电子邮件是否为垃圾邮件;以及垃圾邮件储存部(140),其根据判定结果来储存垃圾邮件。 | ||
搜索关键词: | 垃圾邮件 样本数据 电子邮件 数据取得部 分析装置 文档结构 样本存储 信号化 判定 存储 邮件处理装置 信号处理部 判定结果 图像处理 储存部 类似度 储存 应用 网络 | ||
【主权项】:
1.一种文档结构分析装置,其具有:取得单元,其取得包含表示字符串的代码的样本数据;信号化单元,其对所取得的样本数据的每个字符的代码分别进行n值化,转换为P行×Q列的数据格式,其中,n是2以上的自然数;存储单元,其存储由所述信号化单元进行n值化后的样本数据;计算单元,其通过运算处理来分别比较输入数据的P行×Q列的各个数据与存储于所述存储单元中的n值化后的样本数据的P行×Q列的各个数据,基于样本数据与输入数据之间的重复程度而计算类似度,其中,该输入数据是对表示字符串的代码进行n值化得到的,且由所述信号化单元转换为P行×Q列的数据格式;以及分类单元,其根据计算出的类似度,对输入数据进行分类,所述取得单元判别是所述样本数据还是所述输入数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于艾梅崔克斯株式会社,未经艾梅崔克斯株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201580084903.5/,转载请声明来源钻瓜专利网。