• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
成果搜索

author:

刘晓芳 (刘晓芳.) [1] | 欧荣安 (欧荣安.) [2] | 罗欢 (罗欢.) [3] | 刘芳婷 (刘芳婷.) [4] | 张辉极 (张辉极.) [5] | 韩冰 (韩冰.) [6] | 赵建强 (赵建强.) [7]

Abstract:

如何从海量聊天数据获取聊天主题和聊天人物行为是案件智能化分析的热点问题之一.传统词嵌入方法,将文本中的所有词汇映射到向量空间,存在词汇特征冗余的问题.为了缓解这一问题,该文提出一种基于候选主题词的话题分类算法—CTW(candidate topic words).该算法使用LDA主题模型抽取聊天文本中的关键词,使用预训练词向量得到显著的语义特征,同时为增强特征,将字符特征与获取的词汇特征进行融合.传统方法同时还存在只关注话题无法更精确地刻画人物行为的问题.针对该问题,该文提出了同时获取聊天话题和人物行为的方案:针对已归类的话题,该方案使用群成员互动强度、群成员活跃度作为人物行为网络中的权值,构建话题参与人的行为网络图;最后通过成员在群中的备注给人物赋予不同的社会标签,以丰富人物行为.实验表明,提出的话题分类算法,在实际搜集的数据集上比基线模型拥有更佳的性能,在获取群聊话题的同时得到了更丰富的人物行为描述.

Keyword:

互动强度 人物行为 候选主题词 社会标签 群成员活跃度 聊天主题 话题分类

Community:

  • [ 1 ] [刘芳婷]厦门市人民检察院检察技术信息部,福建 厦门 361008
  • [ 2 ] [刘晓芳]厦门市美亚柏科信息股份有限公司
  • [ 3 ] [张辉极]厦门市美亚柏科信息股份有限公司
  • [ 4 ] [赵建强]厦门市美亚柏科信息股份有限公司,福建 厦门361008;西安电子科技大学,陕西 西安 710071
  • [ 5 ] [罗欢]福州大学
  • [ 6 ] [欧荣安]广州市刑事科学技术研究所
  • [ 7 ] [韩冰]广州市刑事科学技术研究所

Reprint 's Address:

Email:

Show more details

Related Keywords:

Related Article:

Source :

计算机技术与发展

ISSN: 1673-629X

Year: 2022

Issue: 4

Volume: 32

Page: 44-50

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: -1

Chinese Cited Count:

30 Days PV: 0

Affiliated Colleges:

Online/Total:435/10112318
Address:FZU Library(No.2 Xuyuan Road, Fuzhou, Fujian, PRC Post Code:350116) Contact Us:0591-22865326
Copyright:FZU Library Technical Support:Beijing Aegean Software Co., Ltd. 闽ICP备05005463号-1