[发明专利]语料显示的方法及装置有效
申请号: | 201711102058.7 | 申请日: | 2017-11-10 |
公开(公告)号: | CN107967303B | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 张腾 | 申请(专利权)人: | 传神语联网网络科技股份有限公司 |
主分类号: | G06F40/47 | 分类号: | G06F40/47;G06F40/49;G06F16/33;G06F16/338 |
代理公司: | 北京康盛知识产权代理有限公司 11331 | 代理人: | 李晓芳 |
地址: | 430000 湖北省武汉市东湖开发区光谷软件*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语料 显示 方法 装置 | ||
1.一种语料显示的方法,其特征在于,包括:
从被翻译过的历史语料库中,获取与待翻译语料匹配的第一语料;
根据所述待翻译语料中的每个第一分词,以及所述第一语料中的每个第二分词,生成带起始单元格的编辑值的分词二维表格;
根据所述分词二维表格中每个单元格对应的第一分词与第二分词之间的词语相似度,以及所述起始单元格的编辑值,确定每个所述单元格的编辑值,以及所述分词二维表格的编辑值生成路径;
根据所述编辑值生成路径上相邻编辑值之间的差值,对所述第一语料进行编辑并显示;
所述确定所述分词二维表格的编辑值生成路径包括:
将所述分词二维表格中最后一个单元格确定为所述编辑值生成路径中的当前路径单元格;
查找所述当前路径单元格的生成单元格,并将所述生成单元格确定为所述编辑值生成路径中的当前路径单元格,遍历所述分词二维表格,直至确定所述编辑值生成路径中的每个路径单元格,其中,所述生成单元格是所述当前路径单元格的逆向生成方向上相邻单元格中编辑值最小且生成优先级最高的单元格;
所述确定每个所述单元格的编辑值包括:
根据设定的第一遍历方向遍历所述分词二维表格,确定当前单元格对应的当前第一分词与当前第二分词之间的当前词语相似度;
若根据所述当前词语相似度确定所述当前第一分词与所述当前第二分词为相同词语时,将第一单元格的编辑值确定为所述当前单元格的编辑值,其中,所述第一单元格的第一横坐标值与所述当前单元格的当前横坐标值之间的横差值为最小横坐标间隔值,所述第一单元格的第一纵坐标值与所述当前单元格的当前纵坐标值之间的纵差值为最小纵坐标间隔值,且所述第一单元格位于所述当前单元格的逆向生成方向上,所述逆向生成方向与所述第一遍历方向相反;
若根据所述当前词语相似度确定所述当前第一分词与所述当前第二分词为不同词语时,根据第二单元格的编辑值确定所述当前单元格的编辑值,其中,所述第二单元格是所述当前单元格的所述逆向生成方向上相邻单元格中编辑值最小的单元格。
2.如权利要求1所述的方法,其特征在于,所述生成带起始单元格的编辑值的分词二维表格包括:
根据所述待翻译语料和所述第一语料的语序顺序,将每个所述第一分词以及所述第二分词进行排列,生成二维表格,其中,所述二维表格中每个分词都对应一个起始单元格;
配置所述二维表格中每个起始单元格的编辑值,形成分词二维表格,其中,所述起始单元格的编辑值根据所述语序顺序递增。
3.如权利要求1所述的方法,其特征在于,所述根据所述编辑值生成路径上相邻编辑值之间的差值,对所述第一语料进行编辑并显示包括:
若所述编辑值生成路径上当前路径单元格的编辑值与所述编辑值生成路径上所示生成单元格的编辑值之间的差值不为零时,根据所述当前路径单元格的位置坐标值与所述生成单元格的位置坐标值之间的差值,对所述第一语料进行编辑,其中,所述编辑包括:删除、插入或替换;
根据与每种编辑对应的显示提示方式,显示编辑后的所述第一语料。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于传神语联网网络科技股份有限公司,未经传神语联网网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711102058.7/1.html,转载请声明来源钻瓜专利网。