[发明专利]通过拼音进行搜索的方法、服务器及系统在审
申请号: | 201310727117.5 | 申请日: | 2013-12-25 |
公开(公告)号: | CN103678675A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 乔磊 | 申请(专利权)人: | 乐视网信息技术(北京)股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许志勇 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通过 拼音 进行 搜索 方法 服务器 系统 | ||
技术领域
本申请涉及流媒体播放领域,具体涉及一种通过拼音进行搜索的方法、服务器及系统。
背景技术
如今,视频网站普遍都支持用户在搜索框直接输入拼音来搜索视频结果。视频网站的服务器会根据输入的拼音来自动适配拼音所反应出的文字,再根据这些文字来搜索对应的视频结果。因此只要用户输入的拼音正确,往往就可以找到想搜索的视频。
但是在汉字中存在大量的多音字,一个多音字对应有多个读音,这些不同的读音不能混用,而不同的语境搭配需要使用相应的读音,否则会发生错乱,无法获得真正要表达的意思。在用户搜索时输入的拼音关键字中如果包含这种错乱使用的多音字拼音,显然就会发生很多的误差。例如,如果用户希望搜索“甄嬛传”,需要输入拼音“zhen huan zhuan”,但是“传”本身具有两个读音,分别是“zhuan”(音“撰”)和“chuan”(音“船”),而对于一些普通话发音掌握不太好的用户来说,极容易发生将多音字混淆输入的问题,例如这些用户希望输入的是“甄嬛传”,但是有可能因为多音字混淆将拼音输入成“zhuan huan chuan”,这样就无法正确找到用户希望的结果。
因此,在用户输入的拼音关键字中包含错乱使用的多音字拼音时,如何准确获取与拼音关键字对应的正确的搜索结果就成为了亟待解决的技术问题。
发明内容
本申请所要解决的技术问题在于提供一种通过拼音进行搜索的方法、服务器及系统,在用户输入的拼音关键词中包含错乱使用的多音字拼音时,依然可以准确地获取与拼音关键字对应的正确的搜索结果。
为了解决上述问题,本申请揭示了一种通过拼音进行搜索的方法,包括:接收包括至少一个拼音词语的拼音关键词,根据所述拼音关键词在拼音词库进行匹配,其中,所述拼音词库中具有多个群组,每个群组对应一文字,每个群组包括至少一个拼音词语,对于包括两个以上拼音词语的群组,所述两个以上拼音词语之间具有相关的多音字拼音;根据与所述拼音关键词匹配的群组,获取所述匹配的群组对应的文字,根据所述匹配到的群组对应的文字组成所述拼音关键词对应的文字关键词,其中,对于匹配到两个以上群组的所述拼音关键词,所述拼音关键词中的每个拼音词语匹配到一个群组;根据所述文字关键词形成提示信息并发送至客户端显示,或者,根据所述文字关键词搜索与所述文字关键词对应的资源。
进一步地,所述拼音词库,包括:词语拼音子库和单字拼音子库,其中,所述词语拼音子库中的群组为词语群组,每个词语群组对应一词语文字;所述单字拼音子库中的群组为单字群组,每个单字群组对应一单个文字。
进一步地,根据所述拼音关键词在拼音词库进行匹配的操作,具体包括:按照所述拼音关键词由左向右的排列方向,在所述词语拼音子库中对所述拼音关键词进行匹配,匹配到第一数目的词语群组;按照所述拼音关键词由右向左的排列方向,在所述词语拼音子库中对所述拼音关键词进行匹配,匹配到第二数目的词语群组;如果所述第一数目大于第二数目,将所述拼音关键词中未被所述第一数目的词语群组匹配到的剩余部分组成第一剩余部分,在所述单字拼音子库中对所述第一剩余部分进行匹配,匹配到与所述第一剩余部分中的拼音词语对应的第三数目的单字群组,将所述第一数目的词语群组以及所述第三数目的单字群组作为所述拼音关键词匹配到的群组;如果所述第二数目大于第一数目,对所述拼音关键词中未被所述第二数目的词语群组匹配到的剩余部分组成第二剩余部分,在所述单字拼音子库中对所述第二剩余部分进行匹配,匹配到与所述第二剩余部分中的拼音词语对应的第四数目的单字群组,将所述第二数目的词语群组以及所述第四数目的单字群组作为所述拼音关键词匹配到的群组。
进一步地,根据与所述拼音关键词匹配的群组,获取所述匹配的群组对应的文字,根据所述匹配到的群组对应的文字组成所述拼音关键词对应的文字关键词的操作,具体包括:当所述拼音关键词匹配到的群组包括所述第一数目的词语群组以及所述第三数目的单字群组时,根据所述第一数目的词语群组获取相应的第一数目的词语文字,根据所述第三数目的单字群组获取第三数目的单个文字,根据所述第一数目的词语文字和第三数目的单个文字组成所述拼音关键词的文字关键词;当所述拼音关键词匹配到的群组包括所述第二数目的词语群组以及所述第四数目的单字群组时,根据所述第二数目的词语群组获取相应的第二数目的词语文字,根据所述第四数目的单字群组获取第四数目的单个文字,根据所述第二数目的词语文字和第四数目的单个文字组成所述拼音关键词的文字关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于乐视网信息技术(北京)股份有限公司,未经乐视网信息技术(北京)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310727117.5/2.html,转载请声明来源钻瓜专利网。