[发明专利]翻译需求识别方法及系统有效

专利信息
申请号: 201110391077.2 申请日: 2011-11-30
公开(公告)号: CN103136192A 公开(公告)日: 2013-06-05
发明(设计)人: 马艳军;吴华;王海峰 申请(专利权)人: 北京百度网讯科技有限公司
主分类号: G06F17/28 分类号: G06F17/28;G06F17/30
代理公司: 北京鸿德海业知识产权代理事务所(普通合伙) 11412 代理人: 袁媛
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 翻译 需求 识别 方法 系统
【说明书】:

【技术领域】

发明涉及社交网络应用技术,尤其涉及一种翻译需求识别方法及系统。

【背景技术】

随着网络技术的发展,社交网络(SNS——Social Networking Services,又称“社会化网络服务”),如facebook,twitter,校内网、开心网、新浪微博等,以其个性化、时效性强等优点,已经成为现代社会一个重要的媒介平台。社交网络是一个能够让用户相互交流,相互沟通,相互参与的互动平台,用户可以在社交网络平台上发布、评论或转发各种信息。有些信息之间存在着相互联系,它们围绕着一个相同的主题,具有相同的主题关键词。将具有相同主题关键词的各种消息归类于同一个话题,并用主题关键词组成主题词条作为话题标签标识该话题。网络平台的话题多种多样,当一定时间、一定范围内的关注程度超过一定范围时,则被认为是热门话题。一个热门话题包括所有与该热门话题的主题相关的文本信息、图片信息以及音视频信息等,并用话题标签来表示该话题。话题标签中包括主题词条和话题标识符“#”,如话题“世界杯2010”的话题标签为“#世界杯2010#”,主题词条为“世界杯2010”。一般来说,主题词条中可以包括多个关键词。

随着全球化的加快和网络的普及,很多热门话题为全世界的网民所关注,比如“世界杯”“ipad2”等。SNS具有迅速消息传递和实时消息搜索功能,是讨论热门话题的重要媒介平台。然而,SNS的用户众多,可能遍布全球各地,这些来自世界各地的用户使用不同的语言发布信息,如英语、汉语、日语等。由于使用的语言不同,其他用户可能无法理解发布的信息,语言上的隔阂成为沟通的一大障碍。为了实现实时的多语言互动,SNS通过提供人工翻译或机器翻译服务,为用户消除语言障碍。

由于每个SNS的用户众多,每天发布的信息数以千万计,如果要对不断更新的海量信息数据都进行翻译,不仅费时费力,几乎是不可能的,而且有些话题的关注范围小,具有区域性,并不会引起其他不同语言地区的用户关注,没有对该些话题对应的文本信息进行翻译的必要,有时反而会影响用户体验。比如,“宋丹丹炮轰英达”这样的话题则较少为中国之外的人群所关注。目前,尚未有一种有效的翻译需求识别机制,用于确定哪些话题需要进行翻译。

【发明内容】

为了解决上述问题,本发明提供了一种翻译需求识别方法及系统,用于对SNS话题的翻译需求进行识别,可以节省系统资源和翻译时间。

具体技术方案如下:

本发明实施例提供的一种翻译需求识别方法,包括:

获取网络平台中的热门话题的主题词条;

利用D1-D3中至少一种识别方法,判断该热门话题的主题词条所对应话题类别的文本信息是否有翻译为目标语言的需求,其中

所述D1为:判断热门话题中主题词条的关键词是否包含目标语言的词项、音译词词项或者预设关键词列表中的词项;

所述D2为:将热门话题的主题词条翻译成目标语言对应的主题词条译文,在目标语言的网络平台中搜索与该主题词条译文所对应话题类别的文本信息,并统计搜索到的文本信息的数量是否超过预设阈值;

所述D3为:对每个热门话题通过用户调查进行翻译需求征集,根据用户反馈的标注信息进行判断。

识别方法D1-D3可以采用预设的识别策略来表示,每一条识别策略对应一种识别方法。

根据本发明之一优选实施例,所述获取网络平台中的热门话题的主题词条具体包括:

直接从网络平台的热门话题列表中获得热门话题的主题词条;

或者,从各网站的热点中获得热门话题的主题词条。

根据本发明之一优选实施例,所述利用D1判断该热门话题的主题词条所对应话题类别的文本信息是否有翻译为目标语言的需求,具体包括以下步骤:

S101、判断热门话题中主题词条的关键词是否包含目标语言的词项,如果包含,则进入S104,否则,进入S102;

S102、判断热门话题中主题词条的关键词是否包含目标语言的音译词词项,如果包含,则进入S104,否则,进入S103;

S103、将热门话题中主题词条的关键词与预设的关键词列表进行匹配,并计算匹配度,判断匹配度是否满足预设要求,如果满足,则进入S104,否则,进入S105;

S104、识别为有翻译需求;

S105、识别为无翻译需求。

根据本发明之一优选实施例,所述利用D2判断该热门话题的主题词条所对应话题类别的文本信息是否有翻译为目标语言的需求,如果搜索到的文本信息数量超过预设阈值,则识别为有翻译需求。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110391077.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top