[发明专利]一种基于马尔科夫决策过程模型的会话搜索方法有效

申请号：	201610237174.9	申请日：	2016-04-15
公开（公告）号：	CN105930400B	公开（公告）日：	2019-10-11
发明（设计）人：	刘峰;朱荣鑫;唐丹丹;张苏可;丁霄汉	申请（专利权）人：	南京大学
主分类号：	G06F16/33	分类号：	G06F16/33
代理公司：	南京瑞弘专利商标事务所(普通合伙) 32249	代理人：	陈建和
地址：	210093 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种基于马尔科夫决策过程模型的会话搜索方法，包括如下步骤：1)准备阶段，爬取足够多的网页，获取语料库全集C；C为爬取的网页集合经过筛选后的结果；每个网页内对应有文档d；训练人员进行自发的会话搜索并记录其过程以获取训练数据，生成训练文档；2)训练阶段，数据预处理，统计检索阶段中需要使用的词语t与文档d之间的关联度，包括使用狄利克雷平滑P_s(t\|d)和不使用狄利克雷平滑的P_us(t\|d)；3)检索阶段，接收用户当前输入的查询语句q_i；通过公式计算语料库全集C中每个文档d与当前查询q_i的关联度；计算每个文档d与整个会话搜索的关联度；返回关联度高的前N篇文档。
搜索关键词：	一种基于马尔科夫决策过程模型会话搜索方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于马尔科夫决策过程模型的会话搜索方法，其特征在于，包括如下步骤：1)准备阶段a)爬取足够多的网页，获取语料库全集C；C为爬取的网页集合经过筛选后的结果；每个网页内对应有文档d，则C包括{d_i}；b)训练人员进行自发的会话搜索并记录其过程以获取训练数据，训练数据包括涉及的查询，查询的更改，用户在搜索引擎返回的结果中点击的文档及其点击停留时间，生成训练文档；c)结束准备阶段；2)训练阶段a)数据预处理，统计检索阶段中需要使用的词语t与文档d之间的关联度，包括使用狄利克雷平滑P_s(t|d)和不使用狄利克雷平滑的P_us(t|d)；b)解析步骤1‑b)中生成的训练文档，其中包括会话的信息；c)读取训练文档中的一个会话，一个会话包括一次或多次用户对搜索结果操作的信息；d)读取会话中一次用户对搜索结果操作的信息、包括涉及的查询，查询的更改，点击的文档，点击的停留时间；并由此更新P_us(t|d)的值；e)重复步骤d)直到会话结束；f)重复步骤c)，d)，e)直到所有会话都被处理完毕；g)结束训练阶段；3)检索阶段a)接收用户当前输入的查询语句q_i；b)通过公式计算语料库全集C中每个文档d与当前查询语句q_i的关联度；c)计算每个文档d与整个会话搜索的关联度；d)返回关联度高的前N篇文档，N取10；e)重复步骤a)，b)，c)，d)直到用户结束查询；f)结束检索阶段；其中所述步骤2‑a)所述的数据预处理：1)计算和使用狄利克雷平滑的作为词语t与文档d关联度的初始值，其中#(t，d)为词语t在文档d中出现的次数，P(t|C)为t出现在语料库全集C中的次数，|d|为文档d的长度，μ为狄利克雷方法的参数，参数设置为5000；2)结束；其中所述步骤2‑d)所述的更新词语t和文档d之间的关联度，即更新P_us(t|d)的值的过程：1)如果是第一次查询交互，则不改变P_us(t|d)的值；2)如果不是第一次查询交互，设当前交互的查询语句为q_i，前一次交互的查询语句为q_i‑1，令q_theme为q_i和q_i‑1最长公共子序列，+Δq＝q_i‑q_theme，‑Δq＝q_i‑1‑q_theme；对P_us(t|d)的更新分为权值不变，降低权值和增加权值的情况；a)词语t与文档d关联度的权值不变的情况；对于且t∈‑Δq的情况，搜索引擎不改变其权值；b)降低词语t与文档d关联度权值的情况；当查询变更了，不论是+Δq还是‑Δq，只要出现在上次的搜索结果的文档集D_i‑1中，都要降低这些词语的权值；P_us(t|d)为词语t对当前查询和待评估文档之间的相关性的贡献；而由于词语t已经出现在文档集D_i‑1中，为体现新颖度，词语t在文档集D_i‑1中出现的频率越高，权值就减得越多；因此，对于(t∈+Δq or t∈‑Δq)and t∈D_i‑1，有如下公式：此处采用对数函数是为了防止数值下溢；其中确定的过程：i.将对q_i‑1搜索返回结果的前十个片段和满意的点击作为有效的搜索结果，记为所谓满意的点击是指在点击的文档上停留时间超过30s；ii.对于所有的文档搜索结果找出文本关联度与上次查询q_i‑1最大的即其中iii.计算的值；以2‑a方法iv.结束确定的过程；c)增加词语t与文档d关联度权值的情况；i.当为一个增加的词语并且没有出现在上一次查询的结果集D_i‑1中，根据反文档的频率成比例增加这些词语的权值；如果是一个在很多文档中常见的词语，为了确保在增加一个偏爱的词语的时候，避免增加过多；对于t∈+Δq and有如下公式：log P_us(t|d)_new＝(1+idf(t))log P_us(t|d)其中：idf(t)是反文档的频率，定义为：其中D是搜索引擎返回的全部文档的数目；D_W是D中出现t的文档数目；ii.对于t∈q_theme，也增加权值，由于主题词是一个会话中的话题类或常用词，并不是整个全集中常用词语；因此，idf(t)并不适用此处；用词语t在先前最大收益文档出现的频率的逆运算，来代替idf(t)；公式如下：3)结束更新P_us(t|d)的值的过程。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京大学，未经南京大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610237174.9/，转载请声明来源钻瓜专利网。

上一篇：一种基于云计算的大数据ETL交互式处理平台
下一篇：一种基于数据库的剔重方法及系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于马尔科夫决策过程模型的会话搜索方法有效

专利文献下载