[发明专利]基于问诊会话构建用户画像的方法、装置、设备和介质在审
申请号: | 202111005960.3 | 申请日: | 2021-08-30 |
公开(公告)号: | CN113724882A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 赵建双 | 申请(专利权)人: | 康键信息技术(深圳)有限公司 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G16H50/30;G06F16/35;G06F40/289;G06F40/216;G06N3/04;G06N3/08 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 洪铭福 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 问诊 会话 构建 用户 画像 方法 装置 设备 介质 | ||
本申请公开了一种基于问诊会话构建用户画像的方法、装置、设备和介质,涉及机器学习技术领域。该方法包括:获取用户输入的主诉信息;对主诉信息进行特征提取,得到第一特征向量矩阵;将第一特征向量矩阵输入至预测网络模型中,得到与主诉信息匹配的问诊问题,预测网络模型是根据第一数据集训练得到的,第一数据集包括多个医疗问诊样本,其中,每个医疗问诊样本包括问诊问题与对应的病症;向用户呈现问诊问题,以得到用户输入的问诊信息;根据问诊信息构建用户画像。通过对用户输入的主诉信息进行识别,并通过预测网络模型得到与主诉信息相对应的问诊问题,以此快速的对用户进行自动问诊,提高了获取问诊信息的效率且降低了人工成本。
技术领域
本申请涉及机器学习技术领域,尤其是涉及一种基于问诊会话构建用户画像的方法、装置、设备和介质。
背景技术
相关技术中的根据医疗数据生成用户画像的方法中,大多通过人工在线问诊的方式来获取医患间的问诊信息,通过对问诊信息进行分词、筛查和标识后,根据标识结果来构建患者的用户画像。但此种以人工在线问诊的方式获取问诊信息,并构建用户画像的方式效率较低,且人工成本较高。
发明内容
本申请旨在至少解决现有技术中存在的技术问题之一。为此,本申请提出一种基于问诊会话构建用户画像的方法、装置、设备和介质,能够提高构建用户画像的效率且降低人工成本。
根据本申请的第一方面实施例的基于问诊会话构建用户画像的方法,包括:获取用户输入的主诉信息,其中,所述主诉信息为所述用户的病症描述信息;对所述主诉信息进行特征提取,得到第一特征向量矩阵;将所述第一特征向量矩阵输入至预测网络模型中,得到与所述主诉信息匹配的问诊问题,其中,所述预测网络模型是根据第一数据集训练得到的,所述第一数据集包括多个医疗问诊样本,每个所述医疗问诊样本包括问诊问题与对应的病症;向所述用户呈现所述问诊问题,以得到所述用户输入的问诊信息;根据所述问诊信息构建用户画像。
根据本申请实施例的问诊会话构建用户画像的方法,至少具有如下有益效果:通过对用户输入的主诉信息进行识别,并对主诉信息进行特征提取后输入至预测网络模型中,通过预测网络模型得到与主诉信息相对应的问诊问题,通过问诊问题快速的对用户进行自动问诊,以获取用户的问诊信息,根据问诊信息构建用户画像,提高了构建用户画像的效率,且在收集问诊信息时不需要通过人工进行问诊,节省人工成本。通过构建好的用户画像,方便后续选择符合用户当前病症的治疗领域的医生进行进一步问诊,且通过用户画像可以更精确的向用户进行项目的推荐。
根据本申请的一些实施例,所述对所述主诉信息进行特征提取,得到第一特征向量矩阵,包括:对所述主诉信息进行自然语言预处理,得到多个第一分词;将所述多个第一分词输入至预先训练好的词向量模型中,以得到多个第一词向量;对所述多个第一词向量进行组合处理,得到所述第一特征向量矩阵。
根据本申请的一些实施例,所述对所述主诉信息进行自然语言预处理,得到多个第一分词,包括:对所述主诉信息进行繁体转简体处理,得到简体信息;对所述简体信息进行分词,得到预分词信息;对所述预分词信息进行去停用词处理,得到分词信息;对所述分词信息进行同义词归一化,得到所述多个第一分词。
根据本申请的一些实施例,所述将所述第一特征向量矩阵输入至预测网络模型中,得到与所述主诉信息匹配的问诊问题,包括:将所述第一特征向量矩阵输入双向循环神经网络进行特征融合处理,得到第一融合特征向量矩阵;将所述第一融合特征向量矩阵输入高速神经网络进行深度处理,得到第一深度特征向量矩阵;通过卷积神经网络对所述第一深度特征向量矩阵进行特征提取,得到第一向量;根据所述第一向量得到与所述主诉信息匹配的问诊问题。
根据本申请的一些实施例,所述向所述用户呈现所述问诊问题,以得到所述用户输入的问诊信息,包括:向所述用户呈现所述问诊问题和结构化的答案选项;根据所述用户输入的所述答案选项,得到所述用户输入的问诊信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于康键信息技术(深圳)有限公司,未经康键信息技术(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111005960.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:仓储监测方法、装置及电子设备
- 下一篇:一种双服务器全时预测电力功率的方法