[发明专利]识别菜名的方法及装置、存储介质、电子装置有效
申请号: | 201910059330.0 | 申请日: | 2019-01-22 |
公开(公告)号: | CN110110577B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 吴洋;刘泉;杨宇;陈晨;魏世康;田正中;兰杰;朱兴 | 申请(专利权)人: | 口碑(上海)信息技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 黄耀威 |
地址: | 200135 上海市浦东新区民生路11*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 方法 装置 存储 介质 电子 | ||
1.一种识别菜名的方法,其特征在于,包括:
接收光学字符识别OCR模块响应目标图片输出的文本信息;
根据预定规则识别所述文本信息是否为菜名;
在所述预定规则未识别出所述文本信息时,获取所述文本信息的特征信息,其中,所述特征信息包括:所述文本信息的属性特征,所述文本信息相对预设词库的匹配特征;
获取所述文本信息相对预设词库的匹配特征,包括:对所述文本信息进行切分处理,得到多个分词;统计所述多个分词中属于菜品词典单词的单词个数,统计所述单词个数与总分词的单词比值,以及判断所述文本信息的最后一个分词是否为菜名并得到判断结果,其中,所述匹配特征包括:所述单词个数,所述单词比值,以及所述判断结果;
计算所述文本信息的特征值,使用二分类模型基于所述特征信息的特征值识别所述文本信息中的菜名,所述特征值与所述文本信息的属性信息和所述文本信息相对预设词库的匹配特征相关联。
2.根据权利要求1所述的方法,其特征在于,获取所述文本信息的特征信息包括:
以所述文本信息为关键字在预设菜品库中检索匹配的多个候选菜品;
分别计算所述文本信息与所述多个候选菜品的编辑距离;
统计编辑距离落在一个或多个预定范围的记录条数,其中,所述匹配特征包括所述记录条数。
3.根据权利要求1所述的方法,其特征在于,获取所述文本信息的特征信息包括:
确定与所述文本信息对应的原始字符串;
计算所述原始字符串的字符串长度和所述原始字符串的语言模型计算概率,其中,所述属性特征包括所述字符串长度和所述语言模型计算概率,所述语言模型计算概率包括最大三元tri-gram语言模型计算概率和最小三元tri-gram语言模型计算概率。
4.根据权利要求1所述的方法,其特征在于,根据预定规则识别所述文本信息是否为菜名包括以下至少之一:
通过白名单识别所述文本信息是否为菜名;
通过关键字识别所述文本信息是否为菜名;
通过字符串长度识别所述文本信息是否为菜名;
通过字符类型识别所述文本信息是否为菜名。
5.根据权利要求4所述的方法,其特征在于,通过白名单识别所述文本信息是否为菜名包括:
解析所述文本信息,得到与所述文本信息对应的原始字符串;
判断预设白名单列表是否包括所述原始字符串;
在所述预设白名单列表包括所述原始字符串时,确定识别出所述文本信息,在所述预设白名单列表不包括所述原始字符串时,确定未识别出所述文本信息。
6.根据权利要求4所述的方法,其特征在于,通过关键字识别所述文本信息是否为菜名包括:
解析所述文本信息,得到与所述文本信息对应的原始字符串;
判断所述原始字符串是否包括预设关键字集合的任一关键字;
在所述原始字符串包括所述预设关键字集合的任一关键字时,确定识别出所述文本信息,在所述原始字符串不包括所述预设关键字集合的任一关键字时,确定未识别出所述文本信息。
7.根据权利要求4所述的方法,其特征在于,通过字符串长度识别所述文本信息是否为菜名包括:
解析所述文本信息,得到与所述文本信息对应的原始字符串;
判断所述原始字符串的长度是否大于预设长度;
在所述原始字符串的长度小于或等于所述预设长度时,确定未识别出所述文本信息,在所述原始字符串的长度大于所述预设长度时,确定识别出所述文本信息不是菜名。
8.根据权利要求4所述的方法,其特征在于,通过字符类型识别所述文本信息是否为菜名包括:
解析所述文本信息,得到与所述文本信息对应的原始字符串;
判断所述原始字符串中是否包括指定类型的字符;
在所述原始字符串中包括所述指定类型的字符时,确定识别出所述文本信息,在所述原始字符串中不包括所述指定类型的字符时,确定未识别出所述文本信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于口碑(上海)信息技术有限公司,未经口碑(上海)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910059330.0/1.html,转载请声明来源钻瓜专利网。