[发明专利]音乐知识图谱半自动构建方法及系统在审
申请号: | 202210108955.3 | 申请日: | 2022-01-28 |
公开(公告)号: | CN114547330A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 闫伟;季增彦;张亮;卜凡洋;隋远 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295;G06N3/04;G06N3/08 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音乐 知识 图谱 半自动 构建 方法 系统 | ||
1.音乐知识图谱半自动构建方法,其特征是,包括:
对中文音乐领域数据集的命名实体进行识别;
将识别出来的命名实体,转换成中文音乐领域的三元组;
基于中文音乐领域的三元组,构建中文音乐领域的知识图谱。
2.如权利要求1所述的音乐知识图谱半自动构建方法,其特征是,所述方法还包括:
基于中文音乐领域的知识图谱,实现音乐数据的个性化推荐或者音乐数据的搜索。
3.如权利要求1所述的音乐知识图谱半自动构建方法,其特征是,对中文音乐领域数据集的命名实体进行识别;具体包括:
采用训练后的神经网络模型,对中文音乐领域数据集的命名实体进行识别;
神经网络模型,具体网络结构包括:
依次连接的卷积神经网络CNN、双向长短词记忆模型BiLSTM、自注意力机制层Self-Attention和CRF层;
所述训练后的神经网络模型,具体训练过程包括:
构建训练集;其中,训练集为已知命名实体的语料库;
将训练集输入到神经网络模型中,对模型进行训练,得到训练后的神经网络模型。
4.如权利要求3所述的音乐知识图谱半自动构建方法,其特征是,所述采用训练后的神经网络模型,对中文音乐领域数据集的命名实体进行识别;具体工作原理包括:
将中文音乐领域语料库中的每个对话,转换成向量矩阵;
使用卷积神经网络CNN,对向量矩阵进行特征提取,得到每个对话的本质特征;
将每个对话的本质特征,输入到双向长短词记忆模型BiLSTM中,输出包含上下文特征表示的单词特征;
将包含上下文表示的单词特征,输入到自注意力机制层,筛选出关键实体;
将筛选出的关键实体,输入到CRF层,得到实体标签。
5.如权利要求4所述的音乐知识图谱半自动构建方法,其特征是,将中文音乐领域语料库中的每个对话,转换成向量矩阵;具体包括:
删除每个对话的停用词;
将每个对话中断开的句子连接到一起;
删除每个对话中句子之间的空格;
将每个对话中句子控制在设定长度;
对话中的每个句子对应一个索引向量;
对话中每个句子中的每个单词,对应单词向量;
得到每个对话对应的向量矩阵。
6.如权利要求1所述的音乐知识图谱半自动构建方法,其特征是,将识别出来的命名实体,转换成中文音乐领域的三元组;具体包括:
根据预定义的关系模板,将识别出来的命名实体,将实体与实体之间用关系连接起来,转换成中文音乐领域的三元组;
所述预定义的关系模板,包括:歌曲名称与作者的关系,歌曲名称与歌词的关系;
将识别出来的命名实体,转换成中文音乐领域的三元组,具体包括:
提取出每句话中的实体,所述实体,包括:歌手、歌曲和歌词;如果实体之间的关系在预定义关系库中被定义,则最终返回三元组集合[第一实体,关系,第二实体]。
7.如权利要求1所述的音乐知识图谱半自动构建方法,其特征是,
基于中文音乐领域的三元组,构建中文音乐领域的知识图谱;具体包括:
将音乐三元组放到知识图谱生成算法中,自动形成知识图谱,并且链接到图形数据库Neo4j,生成为可视化的知识图谱;
在图形数据库Neo4j中,遍历三元组集合中每一个三元组,以第一实体与第二实体,利用cypher语言去掉重复的创建两个节点,并以第一实体与第二实体的关系作为关联利用cypher语言连接两个节点;所构建的知识图谱将存储在Neo4j数据库中。
8.音乐知识图谱半自动构建系统,其特征是,包括:
实体识别模块,其被配置为:对中文音乐领域数据集的命名实体进行识别;
三元组转换模块,其被配置为:将识别出来的命名实体,转换成中文音乐领域的三元组;
图谱构建模块,其被配置为:基于中文音乐领域的三元组,构建中文音乐领域的知识图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210108955.3/1.html,转载请声明来源钻瓜专利网。