[发明专利]用于车辆故障问答系统的数据处理方法及装置在审
申请号: | 201710442585.6 | 申请日: | 2017-06-13 |
公开(公告)号: | CN107315787A | 公开(公告)日: | 2017-11-03 |
发明(设计)人: | 郑玮 | 申请(专利权)人: | 北京品智能量科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N5/02 |
代理公司: | 北京润平知识产权代理有限公司11283 | 代理人: | 金旭鹏,肖冰滨 |
地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 车辆 故障 问答 系统 数据处理 方法 装置 | ||
技术领域
本发明涉及车辆领域,具体地,涉及一种用于车辆故障问答系统的数据处理方法及装置。
背景技术
随着自然语言处理技术、机器学习、信息抽取、机器翻译等人工智能技术的不断发展,使得以智能硬件及个人助理为代表的一系列问答系统逐渐走入日常生活。比如:百度的度秘机器人、智能家居的语音控制系统、智能手机的语音交互、车载设备的语音控制等。所有这些系统中必不可少的一个基础模块是特定场景或领域的知识库,用户的指令或问题,经过模型计算,从知识库中获取答案,返回给用户。因此,构建一个良好的知识库是建立人与智能系统之间良好交互的前提。知识库的构建依赖于结构化、半结构化和非结构化数据的获取,以及对这些数据的清洗和重构。
数据预处理作为构建知识库的重要一环将直接影响知识库的知识的准确性和完备性。原始数据经过精心设计的预处理,得到符合不同业务要求的数量,质量以及组织形式,保存到知识库。
对不同领域、格式及业务要求的数据,数据处理方式都不尽相同,例如针对数值型数据的常规处理过程主要包括:清理、集成、变换及归约等。
发明内容
本发明实施例的目的是针对车辆故障问答系统中知识库的建立提供一种用于车辆故障问答系统的数据处理方法及装置。
为了实现上述目的,本发明实施例提供一种用于车辆故障问答系统的数据处理方法,该方法包括:从多个与车辆有关的问题中提取出与车辆故障有关的问题;根据车辆类型对所提取的与车辆故障有关的问题进行分类;以及针对所分类的车辆类型,对每一与车辆故障有关的问题进行摘要抽取以获得故障问题摘要。
可选地,所述方法还包括:将每一所述故障问题摘要根据所分类的车辆类型存储在知识库中。
可选地,所述从多个与车辆有关的问题中提取出与车辆故障有关的问题包括:使用分类模型依次判断所述多个与车辆有关的问题中的每一个问题是否为与车辆故障有关的问题,以提取出与所述车辆故障有关的问题。
可选地,所述分类模型的建立包括以下步骤:将多个与车辆故障有关的问题作为训练数据进行模型训练以形成所述分类模型。
可选地,所述根据车辆类型对所提取的与车辆故障有关的问题进行分类包括:使用正则匹配表达式对所提取的与车辆故障有关的问题进行分类。
相应地,本发明实施例还提供一种用于车辆故障问答系统的数据处理装置,所述装置包括:提取模块,用于从多个与车辆有关的问题中提取出与车辆故障有关的问题;分类模块,用于根据车辆类型对所提取的与车辆故障有关的问题进行分类;以及摘要抽取模块,用于针对所分类的车辆类型,对每一与车辆故障有关的问题进行摘要抽取以获得故障问题摘要。
可选地,所述装置还包括:存储模块,用于将每一所述故障问题摘要根据所分类的车辆类型存储在知识库中。
可选地,所述提取模块使用分类模型依次判断所述多个与车辆有关的问题中的每一个问题是否为与车辆故障有关的问题,以提取出所述与车辆故障有关的问题。
可选地,所述装置还包括:模型训练模块,用于将多个与车辆故障有关的问题作为训练数据进行模型训练以形成所述分类模型。
可选地,所述分类模块用于使用正则匹配表达式对所提取的与车辆故障有关的问题进行分类。
相应地,本发明实施例还提供一种极其可读存储介质,该机器可读存储介质上存储有指令,该指令用于使得机器执行上述的用于车辆故障问答系统的数据处理方法。
通过上述技术方案,在实践过程中,针对车辆故障问答系统的知识库的构建,可以节约大量人工数据抽取、编写的工作,并且降低了数据的噪声,提供数据的一致性。
本发明实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施例,但并不构成对本发明实施例的限制。在附图中:
图1示出了根据本发明一实施例的用于车辆故障问答系统的数据处理方法的流程图;以及
图2示出了根据本发明一实施例的用于车辆故障问答系统的数据处理装置的结构框图。
具体实施方式
以下结合附图对本发明实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明实施例,并不用于限制本发明实施例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京品智能量科技有限公司,未经北京品智能量科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710442585.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:业务数据存储方法及装置
- 下一篇:基于MapReduce的PCA降维处理流程