[发明专利]检索方法及其建立文本语义提取模型的方法无效
| 申请号: | 201010144190.6 | 申请日: | 2010-04-12 |
| 公开(公告)号: | CN102214180A | 公开(公告)日: | 2011-10-12 |
| 发明(设计)人: | 宋威;梁久祯 | 申请(专利权)人: | 无锡科利德斯科技有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 214125 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 检索 方法 及其 建立 文本 语义 提取 模型 | ||
1.一种检索方法,其特征在于,其包括:
将待检索数据库表示成文档_关键词矩阵,所述文档_关键词矩阵的行数为文档的篇数n,列数为关键词的个数m;
产生一个目标矩阵以表示改善后的待检索数据库,其包括:
对文档_关键词矩阵进行转置以形成关键词_文档矩阵,利用奇异值分解算法将所述关键词_文档矩阵分解成关键词向量矩阵、一对角线矩阵和文档向量矩阵的乘积;和
选取所述关键词向量矩阵,利用所述文档_关键词矩阵和所述关键词向量矩阵相乘以建立目标矩阵;和
在所述目标矩阵表示的改善后的待检索数据库中进行检索。
2.根据权利要求1所述的方法,其特征在于,所述对角线矩阵是一个以文档篇数n为秩的对角线矩阵,所述关键词向量矩阵为m阶矩阵,所述文档向量矩阵为n阶矩阵。
3.根据权利要求1所述的方法,其特征在于,所述对角线矩阵是一个以小于文档篇数n的数量k为秩的对角线矩阵,所述关键词向量矩阵的行数为m,其列由其经济矩阵的前k列构成,所述文档向量矩阵的行数为k,其列数为n。
4.一种建立文本语义提取模型的方法,其特征在于,其包括:
在向量空间模型中以文档_关键词矩阵表示待检索数据库,所述文档_关键词矩阵的行数为文档的篇数n,列数为关键词的个数m;
对文档_关键词矩阵进行转置以形成关键词_文档矩阵,利用奇异值分解算法将所述关键词_文档矩阵分解成关键词向量矩阵、一对角线矩阵和文档向量矩阵的乘积;和
选取所述关键词向量矩阵,利用文档_关键词矩阵和所述关键词向量矩阵相乘以建立目标矩阵。
5.根据权利要求4所述的方法,其特征在于,所述对角线矩阵是一个以文档篇数n为秩的对角线矩阵,所述关键词向量矩阵为m阶矩阵,所述文档向量矩阵为n阶矩阵。
6.根据权利要求4所述的方法,其特征在于,所述对角线矩阵是一个以小于文档篇数n的数量k为秩的对角线矩阵,所述关键词向量矩阵的行数为m,其列由其经济矩阵的前k列构成,所述文档向量矩阵的行数为k,其列数为n。
7.一种建立文本语义提取模型的方法,其特征在于,其包括:
在向量空间模型中以文档_关键词矩阵表示待检索数据库,所述文档_关键词矩阵的行数为文档的篇数n,列数为关键词的个数m;
对文档_关键词矩阵进行转置以形成关键词_文档矩阵,利用奇异值分解算法将关键词_文档矩阵分解成关键词向量矩阵的酉矩阵的前k列构成的k列关键词向量矩阵、关键词_文档矩阵的前k个最大的奇异值构成的k阶对角线矩阵和文档向量矩阵的前k行构成的k行文档向量矩阵的乘积;和
选取所述k列关键词向量矩阵,利用文档_关键词矩阵和所述k列关键词向量矩阵相乘以建立目标矩阵;其中
k为小于或等于文档篇数n的数量的一个值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡科利德斯科技有限公司,未经无锡科利德斯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010144190.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:带离心分离箱的打浆机
- 下一篇:一种改善维生素A醋酸酯溶解性的方法





