[发明专利]集成极速启播和模糊搜索的电视语音搜索方法和存储介质在审
申请号: | 202211279481.5 | 申请日: | 2022-10-19 |
公开(公告)号: | CN115630187A | 公开(公告)日: | 2023-01-20 |
发明(设计)人: | 蒲俊;孙永强;包晖;邓玉 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | G06F16/732 | 分类号: | G06F16/732;G06F40/289 |
代理公司: | 四川省成都市天策商标专利事务所(有限合伙) 51213 | 代理人: | 刘银 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 集成 极速启播 模糊 搜索 电视 语音 方法 存储 介质 | ||
1.集成极速启播和模糊搜索的电视语音搜索方法,其特征在于,包括以下步骤:
步骤S100.在linux服务器搭建solr搜索引擎,为后续的平台提供基础的全文检索服务;
步骤S200.修改IkAnalyzer分词器;
步骤S300.solr搜索引擎集成修改后的IkAnalyzer分词器,IkAnalyzer分词器根据定义的字典对域进行分词,并支撑用户配置自己的字典;
步骤S400.用户输入搜索词进行搜索;
在用户输入搜索词到达solr搜索引擎进行搜索时,采用useSmart=true智能分词模式,如果用户输入搜索词与IkAnalyzer分词库词条匹配,则不再往下细分,实现精准检索;如果用户输入搜索词与IkAnalyzer分词库词条不匹配,则细分为最小粒度,实现模糊检索。
2.根据权利要求1所述集成极速启播和模糊搜索的电视语音搜索方法,其特征在于,所述步骤S100中,solr搜索引擎的搭建过程为:
将tomcat容器安装压缩包解压到/opt/tomcat/下,再解压solr安装压缩包,复制解压的solr文件夹内的solr.war,将solr.war解压并移动到tomcat的/opt/tomcat/webapps中;拷贝解压的solr文件夹内/example/lib/ext/下的jar文件到/opt/tomcat/webapps/solr/WEB-INF/lib/,并拷贝解压的solr文件夹内/example/resources/log4j.properties文件到/opt/tomcat/webapps/solr/WEB-INF/classes下;在/opt目录下创建solrhome文件夹,并将solr/example/solr中的数据拷贝到建立的solrhome文件夹中,编辑/opt/tomcat/webapps/solr/WEB-INF/web.xml文件,修改env-entry-value属性为/opt/solrhome/指定solrhome,重启tomcat,完成对solr搜索引擎的搭建。
3.根据权利要求1所述集成极速启播和模糊搜索的电视语音搜索方法,其特征在于,所述步骤S200中,修改IkAnalyzer分词器的具体方法为:
在搭建的solr搜索引擎内的IkAnalyzer源码中增加一个UpdateKeeper定时任务,UpdateKeeper定时任务implements实现Runnable接口,通过Thread.sleep线程睡眠预设时间,实现每预设时间执行一次;UpdateKeeper定时任务读取存放在/solr/configs/solr_conf/目录下的zookeeper文件dict.txt,获取到视频资源名称,并更新到IkAnalyzer分词库中。
4.根据权利要求3所述集成极速启播和模糊搜索的电视语音搜索方法,其特征在于,所述步骤S200中,还包括:
在视频媒资入库时记录视频资源名称,将视频资源名称进行去除特殊符号、去除版本、去重的处理,并将处理后的视频资源名称写入zookeeper文件中。
5.根据权利要求1所述集成极速启播和模糊搜索的电视语音搜索方法,其特征在于,所述步骤S300中,具体为:
将修改后的IkAnalyzer分词器jar上传到solr搜索引擎,修改schema.xml配置文件,增加新的fieldType字段类型text_ik,其中,index索引和query查询都采用org.wltea.analyzer.lucene.IKTokenizerFactory,并且,query查询设置useSmart=true采用智能分词模式,使solr搜索引擎启用IkAnalyzer分词器,在需要的检索字段中修改type为自定义的text_ik字段类型。
6.一种计算机可读存储介质,其特征在于,存储有能够被处理器加载执行时实现如权利要求1至5中任一项所述集成极速启播和模糊搜索的电视语音搜索方法的程序。
7.一种智能终端,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序,该程序能够被处理器加载执行时实现如权利要求1至5中任一项所述集成极速启播和模糊搜索的电视语音搜索方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211279481.5/1.html,转载请声明来源钻瓜专利网。