[发明专利]一种基于人工智能技术的听写系统构建方法以及听写机在审
申请号: | 202111361230.7 | 申请日: | 2021-11-17 |
公开(公告)号: | CN114064839A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 王蕊 | 申请(专利权)人: | 王蕊 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F3/0488;G06F40/284;G06V30/148;G06V30/226;G09B19/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510630 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人工智能 技术 听写 系统 构建 方法 以及 | ||
本发明公开了一种基于人工智能技术的听写系统构建方法以及听写机,包括以下步骤:(一)、汉字数据库与算法模型搭建;(二)、显示与朗读部分功能构建;(三)、汉字识别功能构建;(四)、笔顺识别功能构建;(五)、数据库与系统功能功能构建(六)、并建立手写汉字数据库构建;(七)英文单词听写功能模块构建。本发明的技术效果和优点:通过人工智能技术,构建出一套完善的汉字与英文单词听写系统,其切割简单、有多字或多词的拍照识别功能;同时设计了笔序算法,识别笔顺是否正确的功能;数据库可以对已听写的字词进行存储,方便下次的复习调用;数据库更加全面;可以满足自学、听写、笔序纠正等需求,具有广阔的市场前景。
技术领域
本发明涉及汉字听写机技术领域,更具体地说是一种基于人工智能技术的听写系统构建方法以及听写机。
背景技术
孩子的教育中,语文的学习是非常重要的,且各科目都要以汉字为基础。在进行语文教学时,听写是重要的一个教学方法,现有的都是采用老师口述,学生默写的传统方法,之后与课本上进行对照,比较耽误时间,且无法及时更改错误,此外,学生独自在家时,无法进行听写学习。进而出现了汉子听写机,但是目前市场上的汉子听写机只有提供下载字词功能的APP,没有错别字识别、笔序识别等功能,产品落后,难以满足日益增长的市场需求。
发明内容
为了克服现有技术的上述缺陷,本发明提供一种基于人工智能技术的听写系统构建方法以及听写机。
为实现上述目的,本发明提供如下技术方案:
一种基于人工智能技术的听写系统构建方法,包括以下步骤:
(一)、汉字数据库与算法模型搭建
将汉字数据库搭建至云端,并建立好触发查询事务,具体步骤如下:
a、数据库的组成:将每个汉字的字体与笔顺规则、发音文件、常用组词分别进行存储;建立手写汉字存储数据库,将现有的手写汉字公共数据集同步,进行手写汉字数据库的初始化;
b、显示触摸屏采用SVG格式,建立以触摸屏中心为原点的坐标轴,并划分为8个象限,如图3所示,并对每个象限映射为0-7的8个数字。
c、制定笔顺规则并分别封装成函数;
制定笔顺规则:分别为“从上到下”、“从左到右”、“先中间后两边”、“先里后外”、“先外后里”共5个规则。依据上述b.项中的8个象限对应的坐标参照范围以及SVG图的path坐标差值,分别封装成笔顺规则函数代码,对笔画顺序进行判断;
建立低龄儿童常用字的笔顺规则的定义并匹配在对应字的数据库内,建立触发事务;
d、建立多种实际条件下的汉字分割算法
采用的数据集是公共数据集,由于样本数据是单个字,因此可以对单字识别;但是需要多字识别,需要对多个字符先进行分割,然后将分割后的字符逐一识别;采用投影分割的方式对多字符进行分割,先水平投影再垂直投影;设定分割阈值,对于印刷字体的水平分割阈值为2mm,垂直分割阈值为1mm;对于听写字体的分割阈值,在已有的田字格本子上进行,通常水平分割阈值为3mm,垂直分割阈值为5mm;最后将分割完成后的图片或者需要识别的图片转成[64,64]大小,准备输入到多分类汉字识别的tensorflow模型中;具体见图4所示,具体阈值大小包括但不限于上述阈值;
e、训练并建立汉字识别模型
用tensorflow建立多分类任务,比如3000个文字识别就是3000个类别的分类任务;损失函数选择sparse_softmax_cross_entropy_with_logits,优化器选择了Adam,学习率设为0.1;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王蕊,未经王蕊许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111361230.7/2.html,转载请声明来源钻瓜专利网。