Indexed by:
Abstract:
社交媒体的兴起极大地改变了网络用户的信息行为习惯,人们在惊叹信息获取方式便捷、高效、丰富的同时也被社交媒体信息缺乏组织、良莠不齐、检索困难等问题所困扰。与传统的文献型知识体系构成相区别,社交媒体信息的海量化与主题发散性特征尤其明显。文章以新浪微博为例,从微博短文本的内容、时间、空间、人物等多维度实现面向语义关联的多维度主题聚合。从内容特征上,针对微博短文本数据的稀疏特性,选取适用于短文本挖掘的LDA主题模型,实现对微博信息的主题聚类;而针对微博信息的外部特征,利用RDF资源描述框架实现对其语义化描述,并依托语义关联发现组件Silk Workbench从时间、地点、人物维度实现了基于主题的微博信...
Keyword:
Reprint 's Address:
Email:
Source :
情报理论与实践
Year: 2018
Issue: 07
Volume: 41
Page: 136-142
Cited Count:
WoS CC Cited Count: 0
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 1
Affiliated Colleges: