[发明专利]文本校对装置和文本校对方法有效
申请号: | 201210574520.4 | 申请日: | 2012-12-26 |
公开(公告)号: | CN103324609B | 公开(公告)日: | 2017-05-03 |
发明(设计)人: | 长濑友树;郑育昌 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 王萍,李春晖 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开涉及一种文本校对装置以及文本校对方法。根据实施例的一种日文较对装置具有校正历史文集、校对候选者生成单元、校对可用性确定单元和自动校对单元。校正历史文集彼此关联地存储作为校对前文句的反面文句以及作为校对后文句的正例文句。校对候选者生成单元根据校对对象文句的特性,从校正历史文集获取与校对前文句对应的校对后文句。校对可用性确定单元从校对候选者生成单元获取的校对后文句中选择校对对象文句和校对后文句之间的相似度等于或大于预定阈值的校对后文句作为校对候选者。自动校对单元使用校对可用性确定单元选择的校对后文句中的、具有最高相似度的校对后文句来对校对对象文句进行校对。 | ||
搜索关键词: | 文本 校对 装置 方法 | ||
【主权项】:
一种文本校对装置,包括:存储单元,其彼此关联地存储校对前文句和校对后文句;获取单元,其根据来自所述存储单元的校对对象文句的特性,获取与所述校对前文句对应的所述校对后文句;选择单元,其从所述获取单元获取的所述校对后文句中选择所述校对对象文句和所述校对后文句之间的相似度等于或大于预定阈值的校对后文句;以及校对单元,其使用所述选择单元选择的所述校对后文句中的、具有最高相似度的校对后文句来对所述校对对象文句进行校对,其中所述存储单元彼此关联地保存包括错误的反例和所述错误被校正后的正例,从而允许参照过去的校正历史自动地校正短语,以及其中如果对象文句和正例文句之间的相似度低,则所述选择单元确定使用正例文句的校对是不可能的,并且如果对象文句和正例文句之间的相似度高,则所述选择单元确定使用正例文句的校对是可能的,因此从校对候选者排除与对象文句不相似的正例文句,所述校对单元将所述校对前文句中的、所述校对对象文句和所述校对前文句之间的共同字符串与所述校对前文句和所述校对后文句之间的不同字符串之间的重叠部分的字符串替换为所述校对后文句中的、与所述重叠字符串对应的字符串,从而校对所述校对对象文句,所述校对单元根据校对后文句仅替换所述共同字符串与所述不同字符串之间的重叠字符串,从而进行没有过量或不足的文本校对。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210574520.4/,转载请声明来源钻瓜专利网。