[发明专利]一种基于机器学习的自动化口译评估方法及评估系统在审
申请号: | 202211011707.3 | 申请日: | 2022-08-23 |
公开(公告)号: | CN115394320A | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 贾维辰;李德凤;李丽青;陈毅强 | 申请(专利权)人: | 贾维辰 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L15/26;G06F40/253;G06F40/295;G06K9/62;G06N20/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 自动化 口译 评估 方法 系统 | ||
1.一种基于机器学习的自动化口译评估方法,其特征在于,包括下述步骤:
S1.构建标准源语数据集,且所述标准源语数据集中包含有源语音频S-Audio、源文本S-Text、权威目标语音频T-Audio、目标文本T-Text;
S2.根据选择播放T-Audio,被测试者进行口译练习,且在口译练习的同时采集并记录被测试者的练习音频ST-Audio;
S3.根据设定需求并使用机器学习技术对T-Audio、T-Text、ST-Audio进行信息准确度、表达流畅度、语言准确度特征的抽取和评估;
S4.根据评估结果计算被测试者的口译评分,并向被测试者输出评估结果及口译评分。
2.根据权利要求1所述的一种基于机器学习的自动化口译评估方法,其特征在于:在所述步骤S1中还包括构建语料库,所述语料库用于单独储存源文本S-Text和目标文本T-Text,且语料库为位于用户端的本地语料库或位于网络上的远程语料库。
3.根据权利要求1所述的一种基于机器学习的自动化口译评估方法,其特征在于,所述步骤S2中,采集被测试者练习音频ST-Audio并记录时包括:
在练习过程中,被测试者在每句结束时执行确认操作,确认后记录保存并执行断句。
4.根据权利要求2所述的一种基于机器学习的自动化口译评估方法,其特征在于,所述步骤S3中,包括:
a)使用ASR技术将ST-Audio按照步骤S2中断句后所形成的分句转录为文本ST-Text;
b)训练语速分类模型,并使用训练好的语速分类模型对ST-Audio进行评估,得到每句分句的表达流利度得分;
c)训练文本相似度匹配模型,并使用训练好的文本相似度匹配模型对T-Text和ST-Text进行相似度匹配,得到每句分句的信息准确度得分;
d)训练语法错误检测模型和命名实体识别模型,并使用训练好的语法错误检测模型对ST-Text进行语法错误检测,使用训练好的命名实体识别模型对T-Text和ST-Text中具有特定意义的实体进行识别和匹配,得到每句分句的语言准确度得分。
5.根据权利要求1所述的一种基于机器学习的自动化口译评估方法,其特征在于,所述步骤S4中,按如下公式加权计算口译评分:
Score=α·Score{InfoCom}+β·Score{FluDel]+γ·Score{TLQual}
α+β+γ=1
其中:Score{InfoCom}、Score{FluDel}、Score{TLQual}分别代表被测试者的ST-Audio在信息准确度、表达流畅度、语言准确度三个指标中的得分情况,α、β、γ为权重参数,所述权重参数根据口译任务进行设置。
6.一种基于机器学习的自动化口译评估系统,其特征在于,包括:
语料处理模块;用于构建标准源语数据集,且所述标准源语数据集中包含有源语音频S-Audio、源文本S-Text、权威目标语音频T-Audio、目标文本T-Text;
口译练习模块;用于播放T-Audio,还用于在被测试者进行口译练习时采集并记录被测试者的练习音频ST-Audio;
口译评估模块;用于根据设定需求并使用机器学习技术对ST-Audio进行信息准确度、表达流畅度、语言准确度特征的抽取和评估;
结果计算及推送模块;用于计算被测试者的口译评分,还用于向被测试者输出评估结果及口译评分。
7.根据权利要求6所述的一种基于机器学习的自动化口译评估系统,其特征在于,所述语料处理模块还用于构造语料库,所述语料库用于单独储存源文本S-Text和目标文本T-Text,且语料库为位于用户端的本地语料库或位于网络上的远程语料库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贾维辰,未经贾维辰许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211011707.3/1.html,转载请声明来源钻瓜专利网。