[发明专利]一种方言同音字汇自动生成系统在审
申请号: | 202110972419.3 | 申请日: | 2021-08-24 |
公开(公告)号: | CN113779027A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 程南昌;李正涵;杨柳;邹煜 | 申请(专利权)人: | 中国传媒大学 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/36 |
代理公司: | 北京智行阳光知识产权代理事务所(普通合伙) 11738 | 代理人: | 黄锦阳 |
地址: | 100024 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 方言 同音 字汇 自动 生成 系统 | ||
本发明公开了一种方言同音字汇自动生成的系统,具体包括:数据读入模块:用于从数据库中读入目标方言的字表及字段,自动分析出目标方言的声、韵、调系统;排序模块:用于供用户对数据读入模块分析出的声、韵、调系统的排序依据进行设定,并根据用户设定的排序依据对声、韵、调系统进行排序,如果用户没有对排序依据进行设定,则按默认的规则进行排序;同音字汇竖排表生成模块:用于对排序模块得到的排序结果,过滤掉相同的声、韵、调,最终生成同音字汇竖排表。本发明能很好的满足方言调查实用化的需求。
技术领域
本发明涉及文字处理技术领域,具体涉及一种方言同音字汇自动生成系统。
背景技术
中国是方言大国,每种方言都有自己独特的语音系统,整理每种方言的语音系统是方言调查的基本任务。方言同音字汇,简单来说就是一本按方言韵母、声母、声调查字的语文工具书。可以方便地供方言调查者进一步记录语音材料(例如,变调、儿化、轻声、音变等),整理方言的词汇和语法,进行方言语音系统以及古今语音演变的研究;也可以供讲方言的人对照学习普通话;对其他方言区的人了解、学习该方言也有帮助。因此,研究方言的人非常看重“同音字汇”。但是“方言同音字汇”的制作相当困难,传统是采用做卡片的方式,做好一本同音字汇需要很长时间,稍有不慎,就会出现偏差,是一项费时费力的工作。可以说,“方言同音字汇”的制作,已成为制约加速方言调查工作的“瓶颈”。因此,基于计算语言学知识,通过计算机自动生成“方言同音字汇”是一项意义深远的任务。
随着科学研究的交叉融合渗透,相关领域研究人员开始利用计算机辅助方言的调查与研究,以减轻方言调查者的工作量。在“同音字汇”自动处理方面,相关研究工作主要有以下三个方面。
上海师范大学潘悟云利用Visual Foxpro开发了一个“汉语方言计算机处理系统”,在该系统的第四个功能“方言音系分析”中,可调入按一定格式建立的Visual Foxpro数据库字表,生成同音字表。但是用户在使用中必须严格采用该系统所规定的VFP数据库格式,否则即会出现运行错误,并且要求数据库中一定要有汉字、中古声母、中古韵母、中古声调等14个字段[1]。此外,该软件最终生成的同音字表虽然按韵、声、调的顺序对同音字进行了排序,但每一组同音字都有声、韵、调三个属性,离生成文本形式的同音字汇“竖排表”还有一定的距离。
广西民族大学海柳文[2]利用Visual Foxpro开发的“汉语方言民族语言语音材料处理软件”。在进行“同音字汇排序”时,该系统只能按英文字母的音序进行排序,因此影响了同音字汇生成的精度。
广西师范大学刘村汉[3]基于Excel开发的“方言字音处理系统”,在生成同音字汇时,要进行复杂的公式运算,操作一不小心,就有可能出错。加大了对计算机不熟悉的方言调查者学习和操作的难度。
以上软件在同音字汇自动生成方面做出了有效的尝试,并且取得了一定的效果,但它们在用户可用性、用户体验以及准确率上仍然有待提升。
发明内容
针对现有技术的不足,本发明旨在提供一种方言同音字汇自动生成系统。
为了实现上述目的,本发明采用如下技术方案:
一种方言同音字汇自动生成的系统,具体包括:
数据读入模块:用于从数据库中读入目标方言的字表及ID、字目、声、韵、调五个字段的信息,自动分析出目标方言的声、韵、调系统;
排序模块:用于供用户对数据读入模块分析出的声、韵、调系统的排序依据进行设定,并根据用户设定的排序依据对声、韵、调系统进行排序,如果用户没有对排序依据进行设定,则采用默认的排序依据对声、韵、调系统进行排序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国传媒大学,未经中国传媒大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110972419.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种碾磨装置
- 下一篇:一种色织物经纱配色排布设计方法、装置、介质及设备