Abstract:
如何从海量聊天数据获取聊天主题和聊天人物行为是案件智能化分析的热点问题之一。传统词嵌入方法,将文本中的所有词汇映射到向量空间,存在词汇特征冗余的问题。为了缓解这一问题,该文提出一种基于候选主题词的话题分类算法—CTW (candidate topic words)。该算法使用LDA主题模型抽取聊天文本中的关键词,使用预训练词向量得到显著的语义特征,同时为增强特征,将字符特征与获取的词汇特征进行融合。传统方法同时还存在只关注话题无法更精确地刻画人物行为的问题。针对该问题,该文提出了同时获取聊天话题和人物行为的方案:针对已归类的话题,该方案使用群成员互动强度、群成员活跃度作为人物行为网络中的权值,...
Keyword:
Reprint 's Address:
Email:
Source :
计算机技术与发展
ISSN: 1673-629X
CN: 61-1450/TP
Year: 2022
Issue: 04
Volume: 32
Page: 44-50
Cited Count:
WoS CC Cited Count: 0
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 0
Affiliated Colleges: