[发明专利]一种语句词语采集方法及装置在审
申请号: | 202111058415.0 | 申请日: | 2021-09-10 |
公开(公告)号: | CN113779965A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 尹红霞 | 申请(专利权)人: | 中联国智科技管理(北京)有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/289;G06F40/30;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语句 词语 采集 方法 装置 | ||
本发明公开了一种语句词语采集方法及装置。其中,该方法包括:获取语句应用场景;根据预设应用场景分类规则,将所述语句应用场景进行分类,得到语句信息;将所述语句信息进行分割处理,得到分割语句信息;采集所述分割语句信息中的词语数据。本发明解决了现有技术中的语句词语采集方法仅仅对原始语句数据进行采集,无法根据场景信息对语句进行分类采集,降低了语句采集整体的效率的技术问题。
技术领域
本发明涉及语句采集领域,具体而言,涉及一种语句词语采集方法及装置。
背景技术
随着智能化科技的不断发展,人们的生活、工作、学习之中越来越多地用到了智能化设备,使用智能化科技手段,提高了人们生活的质量,增加了人们学习和工作的效率。
目前,在采集语句数据的过程中,通常对原始语句进行拆分处理并将拆分后的语句数据进行分析,提取可用的采集信息而进行相关的采集操作,但是传统的语句词语采集方法仅仅对原始语句数据进行采集,无法根据场景信息对语句进行分类采集,降低了语句采集整体的效率。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种语句词语采集方法及装置,以至少解决现有技术中的语句词语采集方法仅仅对原始语句数据进行采集,无法根据场景信息对语句进行分类采集,降低了语句采集整体的效率的技术问题。
根据本发明实施例的一个方面,提供了一种语句词语采集方法,包括:获取语句应用场景;根据预设应用场景分类规则,将所述语句应用场景进行分类,得到语句信息;将所述语句信息进行分割处理,得到分割语句信息;采集所述分割语句信息中的词语数据。
可选的,在所述获取语句应用场景之前,所述方法还包括:获取原始语句数据。
可选的,在所述将所述语句信息进行分割处理,得到分割语句信息之前,所述方法还包括:根据所述语句信息,获取分割策略。
可选的,在所述获取所述分割语句信息中的词语数据之后,所述方法还包括:将所述词语数据进行存储。
根据本发明实施例的另一方面,还提供了一种语句词语采集装置,包括:获取模块,用于获取语句应用场景;分类模块,用于根据预设应用场景分类规则,将所述语句应用场景进行分类,得到语句信息;分割模块,用于将所述语句信息进行分割处理,得到分割语句信息;采集模块,用于采集所述分割语句信息中的词语数据。
可选的,所述装置还包括:获取模块,还用于获取原始语句数据。
可选的,所述装置还包括:策略模块,用于根据所述语句信息,获取分割策略。
可选的,所述装置还包括:存储模块,用于将所述词语数据进行存储。
根据本发明实施例的另一方面,还提供了一种非易失性存储介质,所述非易失性存储介质包括存储的程序,其中,所述程序运行时控制非易失性存储介质所在的设备执行一种语句词语采集方法。
根据本发明实施例的另一方面,还提供了一种电子装置,包含处理器和存储器;所述存储器中存储有计算机可读指令,所述处理器用于运行所述计算机可读指令,其中,所述计算机可读指令运行时执行一种语句词语采集方法。
在本发明实施例中,采用获取语句应用场景;根据预设应用场景分类规则,将所述语句应用场景进行分类,得到语句信息;将所述语句信息进行分割处理,得到分割语句信息;采集所述分割语句信息中的词语数据的方式,解决了现有技术中的语句词语采集方法仅仅对原始语句数据进行采集,无法根据场景信息对语句进行分类采集,降低了语句采集整体的效率的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中联国智科技管理(北京)有限公司,未经中联国智科技管理(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111058415.0/2.html,转载请声明来源钻瓜专利网。