[发明专利]基于人际间会话信息的人际关系自动化画像方法有效
| 申请号: | 201611078731.3 | 申请日: | 2016-11-29 |
| 公开(公告)号: | CN106776895B | 公开(公告)日: | 2019-05-14 |
| 发明(设计)人: | 王博;王渊;武贤丽 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/951 |
| 代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李丽萍 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 人际 会话 信息 人际关系 自动化 画像 方法 | ||
本发明公开了一种基于人际间会话信息的人际关系自动化画像方法,主要是通过提取会话信息中的频繁项集,进而挖掘频繁项集中的主题来反映关系内涵,步骤是,首先定义会话双方之间的会话信息集合,然后采用FP‑Growth算法在会话信息集合中挖掘出一个频繁项集,所述频繁项集中频繁项的长度为2到10,所述频繁项集的最小支持度的最小取值为2,最大取值为会话信息集合中会话信息的数量;根据上述挖掘出的频繁项集中提取多个关键主题词,将这些关键主题词组合后即为会话信息中的主题;最后将主题作为会话双方的关系内涵。
技术领域
本发明涉及一种人际关系画像方法,属于社会计算领域的一个重点研究问题。该方法利用人际间的会话信息对人际关系进行自动化画像。
背景技术
识别和了解人们之间的人际关系是社会计算中一个非常必要的问题,它是许多相关研究如社区发现、影响力分析、链接预测、个性化推荐等的基础。要对一个关系进行画像,可以有两个基本层次,分别是关系的特性和关系的内涵。其中,关系的特性指的是关系较为简单和易于量化的基本属性;而关系的内涵则指的是两个人之间的关系的内容。
在当前研究中,关系的内涵建模主要表现为关系的类型识别。多数情况,这些类型是已知的,例如敌友、师生、论文合作等。在更一般的情况,多数研究将关系类型抽象为简单的正负二元化类别。在这种思路下,关系的内涵分析,转化为关系的类型识别,进而转化为经典的分类问题。
但是,这种基于已知类型和分类方法的关系内涵分析不能够充分满足关系内涵分析的需要。一方面,已知的关系类型是十分有限的,人们之间的关系内涵往往十分复杂,在实际经验中,往往很难用一个简单的类型名称来准确刻画两个人之间的关系,而需要用一系列具体的描述来更为准确的刻画一个关系的内涵。另一方面,即使是已知的关系类型,往往也可以具有不同的内涵。例如同样是朋友关系,即可能是工作伙伴,也可能是具有相同的兴趣爱好。
由此可见,需要一种信息量更加丰富的方法,来实现关系的内涵的语义化的刻画。要实现这一点,人际之间的会话信息是一个非常好的资源。
在社会语言学中,语言代码不仅具有单纯语言学上的符号意义,而且蕴含着复杂的社会因素和深刻的文化意义,语言的符号体系既实现又控制着社会关系的结构。社会语言学认为社会结构与语言结构互相影响。萨丕尔-沃尔夫假设认为语言结构决定着人们对世界的看法,即语言影响思维,进而思维决定行为与社会关系。
发明内容
在本发明中,将尝试通过提取会话信息中的频繁项集,进而挖掘频繁项集中的主题来反映关系内涵,来建立一种基于会话信息的人际关系自动化画像方法。
为了解决上述技术问题,本发明提出的一种基于人际间会话信息的人际关系自动化画像方法,包括以下步骤:
步骤一、定义会话双方之间的会话信息集合:
P={P1,P2,...,Pn},P是指会话双方之间的会话信息集合;其中,Pi是指会话信息集合中的某一条会话信息;当Wi.sup>=min_sup时,将会话信息集合P中的一个单词集合Wi称为一个频繁项;其中,Wi.sup表示会话信息集合P中一个单词集合Wi的支持度,支持度为n表示在会话信息集合P中有n条信息包含单词集合Wi;min_sup用来表示会话信息集合P中一个频繁项的最小支持度;
步骤二、频繁项集的挖掘:
采用FP-Growth算法在会话信息集合P中挖掘出一个频繁项集。设会话信息集合P的大小为size,单位是kb,且会话集中共包含m条会话信息,则最小支持度的取值按照如下公式计算可得:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611078731.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:日志数据库系统和同步方法
- 下一篇:一种快速的图融合图像检索方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





