[发明专利]信息处理装置、机器学习装置以及信息处理方法有效
申请号: | 202010169601.0 | 申请日: | 2020-03-12 |
公开(公告)号: | CN111695568B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 金田健太郎 | 申请(专利权)人: | 精工爱普生株式会社 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/14 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 李丹 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 装置 机器 学习 以及 方法 | ||
1.一种信息处理装置,其特征在于,具备:
存储部,存储使用示教数据进行机器学习后的已学习模型,所述示教数据是将由扫描仪读取的原稿的读取数据中包含的图像、字符串、所述读取数据的布局中的至少一个与所述读取数据的文件名建立关联后的数据;
控制部,使用所述读取数据中包含的图像、字符串、所述读取数据的布局中的至少一个和所述已学习模型,来生成所述读取数据的文件名;以及
学习部,
所述学习部在所述控制部生成的所述文件名未被变更的情况下,将所述读取数据中包含的图像、字符串、所述读取数据的布局中的至少一个与所述控制部生成的所述文件名建立关联后的数据追加于示教数据,
所述学习部在所述控制部生成的所述文件名被变更的情况下,
相比于所述文件名未被变更的情况,将所述读取数据中包含的图像、字符串、所述读取数据的布局中的至少一个与所述控制部生成的所述文件名建立关联后的数据进行填充后再追加于示教数据,并使用数据追加后的所述示教数据使所述已学习模型进行再学习,以使得变更后的所述文件名比变更前的所述文件名对学习结果的影响更大。
2.根据权利要求1所述的信息处理装置,其特征在于,
所述学习部在所述控制部生成的所述文件名中包含的字符串被变更的情况下,
相比于所述文件名未被变更的情况,将所述读取数据中包含的图像、字符串、所述读取数据的布局中的至少一个与包含被变更后的字符串的变更后的文件名建立关联后的数据进行填充后再追加于示教数据,并使用数据追加后的所述示教数据使所述学习部进行再学习,以使得变更后的字符串比变更前的字符串对学习结果的影响更大。
3.根据权利要求1或2所述的信息处理装置,其特征在于,
所述文件名具有包含在所述读取数据中的日期信息。
4.根据权利要求3所述的信息处理装置,其特征在于,
所述已学习模型输出在所述文件名中是否包含所述日期信息。
5.根据权利要求1所述的信息处理装置,其特征在于,
所述示教数据所示的所述文件名包含:由使用者输入的字符串、以及通过对所述读取数据的光学字符识别处理而读取的字符串中的至少一方。
6.根据权利要求1所述的信息处理装置,其特征在于,
所述图像包含示出所述原稿的发布方的图像,
所述控制部以示出所述发布方的图像为基础来确定所述原稿的所述发布方,并生成包含所述发布方的名称的所述文件名。
7.一种机器学习装置,其特征在于,具备:
示教数据获取部,获取示教数据,所述示教数据是将由扫描仪读取的原稿的读取数据中包含的图像、字符串、所述读取数据的布局中的至少一个与关于所述读取数据的文件的信息建立关联后的数据;以及
学习部,基于所述示教数据对已学习模型进行机器学习,所述已学习模型输入所述读取数据中包含的图像、字符串、所述读取数据的布局中的至少一个,并输出关于所述读取数据的文件的信息,
所述学习部在所输出的关于所述文件的信息未被变更的情况下,将所述读取数据中包含的图像、字符串、所述读取数据的布局中的至少一个与所输出的关于所述文件的信息建立关联后的数据追加于示教数据,
所述学习部在所输出的关于所述文件的信息被变更的情况下,
相比于关于所述文件的信息未被变更的情况,将所述读取数据中包含的图像、字符串、所述读取数据的布局中的至少一个与变更后的关于所述文件的信息建立关联后的数据进行填充后再追加于示教数据,并使用数据追加后的所述示教数据使所述已学习模型进行再学习,以使得变更后的关于所述文件的信息比变更前的关于所述文件的信息对学习结果的影响更大。
8.一种信息处理方法,其特征在于,
使用示教数据进行机器学习后的已学习模型,基于读取数据中包含的图像、字符串、所述读取数据的布局中的至少一个,来生成有关所述读取数据的文件的信息,其中,所述示教数据是将由扫描仪读取的原稿的所述读取数据中包含的图像、字符串、所述读取数据的布局中的至少一个与关于所述读取数据的文件的信息建立关联后的数据,
在所输出的关于所述文件的信息未被变更的情况下,
将所述读取数据中包含的图像、字符串、所述读取数据的布局中的至少一个与所输出的关于所述文件的信息建立关联后的数据追加于示教数据,
在所输出的关于所述文件的信息被变更的情况下,
相比于关于所述文件的信息未被变更的情况,将所述读取数据中包含的图像、字符串、所述读取数据的布局中的至少一个与变更后的关于所述文件的信息建立关联后的数据进行填充后再追加于示教数据,并使用数据追加后的所述示教数据使所述已学习模型进行再学习,以使得变更后的关于所述文件的信息比变更前的关于所述文件的信息对学习结果的影响更大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于精工爱普生株式会社,未经精工爱普生株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010169601.0/1.html,转载请声明来源钻瓜专利网。