[发明专利]一种基于机器学习的自动化口译评估方法及评估系统在审
申请号: | 202211011707.3 | 申请日: | 2022-08-23 |
公开(公告)号: | CN115394320A | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 贾维辰;李德凤;李丽青;陈毅强 | 申请(专利权)人: | 贾维辰 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L15/26;G06F40/253;G06F40/295;G06K9/62;G06N20/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 自动化 口译 评估 方法 系统 | ||
本发明涉及口译评估技术领域,公开了一种基于机器学习的自动化口译评估方法及评估系统,其方法包括:S1.构建标准源语数据集,且标准源语数据集中包含有源语音频S‑Audio、源文本S‑Text、权威目标语音频T‑Audio、目标文本T‑Text;S2.根据选择播放T‑Audio,被测试者进行口译练习,且在口译练习的同时采集并记录被测试者的练习音频ST‑Audio;S3.根据设定需求并使用机器学习技术对T‑Audio、T‑Text、ST‑Audio进行信息准确度、表达流畅度、语言准确度特征的抽取和评估;S4.根据评估结果计算被测试者的口译评分,并向被测试者输出评估结果及口译评分;综上,本发明既能辅助教师和学员进行口译训练,提升口译评估的正确性和一致性;又能辅助人工评估,提升评估效率、降低评估者负荷。
技术领域
本发明涉及口译评估技术领域,具体涉及一种基于机器学习的自动化口译评估方法及评估系统。
背景技术
在语言类测试中,被试者通常被要求基于主题或目标语提交文本(作文任务、翻译任务)或音频资料(口译任务),评价者根据预先制定好的标准或方案对被试者提交的内容进行人工评价。
口译质量评估是口译工作和教学的一个重要环节,但是,当前国内外口译质量研究主要集中于人工评估,而现有的人工评估策略难以高效地支持口译学员的训练,其原因是:
(1)由于大多数评价指标是采用量规(rubric)进行叙述,而在实际操作中评价者需要基于自身经验做出判断并打分,导致评价者在口译评估过程中存在评估结果波动较大的问题,在多人评估时影响评估结果的一致性。
(2)人工评估存在费时、低效等问题,对评价者自身会造成较大精神负荷。
发明内容
(一)要解决的技术问题
本发明所要解决的技术问题在于现有人工评估存在评估结果波动较大、费时、低效、对评估者自身造成较大精神负荷的问题;鉴于此,本发明的目的在于提供一种基于机器学习的自动化口译评估方法及评估系统。
(二)技术方案
本发明通过如下技术方案实现:
一种基于机器学习的自动化口译评估方法,包括下述步骤:
S1.构建标准源语数据集,且所述标准源语数据集中包含有源语音频S-Audio、源文本S-Text、权威目标语音频T-Audio、目标文本T-Text;
S2.根据选择播放T-Audio,被测试者进行口译练习,且在口译练习的同时采集并记录被测试者的练习音频ST-Audio;
S3.根据设定需求并使用机器学习技术对T-Audio、T-Text、ST-Audio进行信息准确度、表达流畅度、语言准确度特征的抽取和评估;
S4.根据评估结果计算被测试者的口译评分,并向被测试者输出评估结果及口译评分。
进一步的,在所述步骤S1中还包括构建语料库,所述语料库用于单独储存源文本S-Text和目标文本T-Text,且语料库为位于用户端的本地语料库或位于网络上的远程语料库。
进一步的,所述步骤S2中,采集被测试者练习音频ST-Audio并记录时包括:在练习过程中,被测试者在每句结束时执行确认操作,确认后记录保存并执行断句。
进一步的,所述步骤S3中,包括:
a)使用ASR技术将ST-Audio按照步骤S2中断句后所形成的分句转录为文本ST-Text;
b)训练语速分类模型,并使用训练好的语速分类模型对ST-Audio进行评估,得到每句分句的表达流利度得分;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贾维辰,未经贾维辰许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211011707.3/2.html,转载请声明来源钻瓜专利网。