Indexed by:
Abstract:
社交媒体的兴起极大地改变了网络用户的信息行为习惯,人们在惊叹信息获取方式便捷、高效、丰富的同时也被社交媒体信息缺乏组织、良莠不齐、检索困难等问题所困扰。与传统的文献型知识体系构成相区别,社交媒体信息的海量化与主题发散性特征尤其明显。文章以新浪微博为例,从微博短文本的内容、时间、空间、人物等多维度实现面向语义关联的多维度主题聚合。从内容特征上,针对微博短文本数据的稀疏特性,选取适用于短文本挖掘的LDA主题模型,实现对微博信息的主题聚类;而针对微博信息的外部特征,利用RDF资源描述框架实现对其语义化描述,并依托语义关联发现组件Silk Workbench从时间、地点、人物维度实现了基于主题的微博信息语义发现与多维主题聚合。研究表明,LDA主题挖掘模型与关联数据技术的结合应用为有效揭示社交媒体信息的主题特征,实现对微博信息的细粒度切分、语义化描述与多维度关联聚合提供了一种有效的解决方案。
Keyword:
Reprint 's Address:
Email:
Version:
Source :
情报理论与实践
ISSN: 1000-7490
CN: 11-1762/G3
Year: 2018
Issue: 7
Volume: 41
Cited Count:
WoS CC Cited Count: 0
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count: -1
Chinese Cited Count:
30 Days PV: 4
Affiliated Colleges: