[发明专利]一种语句翻译复杂度的分析方法有效
申请号: | 201310712248.6 | 申请日: | 2013-12-23 |
公开(公告)号: | CN103729348A | 公开(公告)日: | 2014-04-16 |
发明(设计)人: | 江潮 | 申请(专利权)人: | 武汉传神信息技术有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06Q10/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 430073 湖北省武汉市东湖开发区光谷软件*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语句 翻译 复杂度 分析 方法 | ||
1.一种语句翻译复杂度的分析方法,其特征在于,包括:
扫描待译语句,对所述待译语句进行分词处理,得到所述待译语句中的所有词汇,并统计出词汇总数;
根据得到的所述待译语句中的所有词汇,并统计出词汇总数,确定所述待译语句中的的句长、所述待译语句中的子句的数量、子句的平均长度、所述待译语句中的词汇等级、所述待译语句中的实义词密度和所述待译语句中的习语数;
根据所述待译语句的句长、子句的平均长度、词汇等级、实义词密度和习语数建立计算翻译复杂度的多元线性回归模型,通过样本数据得到回归系数,从而得到所述语句的翻译复杂度。
2.根据权利要求1所述的方法,其特征在于,所述待译语句中的句长为所述待译语句所述词汇总数。
3.根据权利要求2所述的方法,其特征在于,确定所述待译语句中的子句的平均长度的过程包括:
将所述待译语句中的所述词汇总数除以所述子句数量,结果作为所述子句的平均长度。
4.根据权利要求1所述的方法,其特征在于,确定所述待译语句的词汇等级的过程包括:
将得到的每个所述词汇在词汇分级表中进行匹配,得到每个所述词汇的词汇级别;所述词汇级别为一级、二级、三级或四级;
分别统计所述词汇级别为二级或二级以上的级别的所述词汇的数量;
按照词汇等级计算公式计算出所述语句的词汇等级,所述词汇等级计算公式如下:
其中,wordx为词汇级别为X级的词汇的数量,K111、K112和K113为词汇等级调节系数,word为总词汇数。
5.根据权利要求4所述的方法,其特征在于,所述词汇等级调节系数为所述多元线性回归模型的回归系数,采用最小二乘法对样本数据进行计算得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉传神信息技术有限公司,未经武汉传神信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310712248.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:具有推杆的采矿刨机
- 下一篇:关于双梯度钻井的井监测、感测、控制和泥浆测井