[发明专利]交互信息处理方法、装置、计算机设备和存储介质有效
申请号: | 201911258211.4 | 申请日: | 2019-12-10 |
公开(公告)号: | CN111191446B | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 雷志林 | 申请(专利权)人: | 平安医疗健康管理股份有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/205;G06F40/30;G06F16/332;G06K9/62 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 唐彩琴 |
地址: | 200001 上海市黄浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 交互 信息处理 方法 装置 计算机 设备 存储 介质 | ||
1.一种交互信息处理方法,所述方法包括:
获取用户终端发送的交互信息,提取所述交互信息对应的文本信息;
对所述文本信息进行文本分割,得到多个文本句;
将所述多个文本句输入至文本分析模型,识别文本句的语义特征并对所述文本句进行分词得到多个文本,提取出所述多个文本对应的待标准化文本;
提取所述待标准化文本对应目标领域的领域语义特征,根据所述领域语义特征计算所述待标准化文本与领域词库中多个标准文本的互信息值;
检测所述互信息值是否达到阈值,当达到互信息阈值时,提取所述互信息值对应的标准文本生成候选集;
计算所述待标准化文本与所述候选集中多个标准文本之间的相似度;
根据所述互信息值和相似度计算所述待标准化文本与多个标准文本的互相关性;
计算待标准化文本与非领域词典中多个词汇的负相关性,所述非领域词典中存储了多个目标领域的非标准词汇;
计算所述多个待标准化文本对应标准领域词典中标准文本的概率值;
根据所述互相关性和负相关性以及概率值得到目标相关性;
从所述候选集中提取出所述目标相关性达到阈值的标准文本并输出;
将所述标准文本与目标领域的知识图谱数据进行匹配,获取与所述标准文本相匹配的目标知识信息,将所述目标知识信息推送至所述用户终端。
2.根据权利要求1所述的方法,其特征在于,所述提取出多个文本对应的待标准化文本的步骤包括:
通过文本分析模型计算多个文本句的文本序列,并对文本句添加对应的序列标签;
根据文本句的序列标签计算所述文本句的语义特征,根据所述语义特征对文本句进行分词,得到多个文本;
根据所述序列标签和语义特征计算多个文本的词性标签;
根据所述语义特征和词性标签计算多个文本的规范因子;
提取所述规范因子满足预设阈值的文本,将所述文本作为待标准化文本。
3.根据权利要求1所述的方法,其特征在于,所述提取所述互信息值达到阈值的标准文本的步骤包括:
根据所述领域语义特征获取所述目标领域对应的多个标准文本;
计算所述多个待标准化文本与所述多个标准文本之间的点互相关性;
计算所述多个待标准化文本的左边界熵和右边界熵,根据所述左边界熵和右边界熵得到所述待标准化文本的信息熵;
根据所述点互相关性和信息熵计算待标准化文本与多个标准文本之间的互信息值,提取所述互信息值满足预设阈值的多个标准文本。
4.根据权利要求1所述的方法,其特征在于,所述获取与所述标准文本相匹配的目标知识信息步骤包括:
根据所述目标领域获取领域类别对应的知识图谱数据;所述知识图谱数据包括多个知识信息;
计算所述标准文本与多个知识信息的匹配度;
获取所述匹配度达到预设阈值的知识信息,将所述知识信息确定为所述标准文本对应的目标知识信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安医疗健康管理股份有限公司,未经平安医疗健康管理股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911258211.4/1.html,转载请声明来源钻瓜专利网。