基于XML的PDF文档信息抽取系统的研究 - Details

初始密码提示：姓名拼音首字母【第一个汉字的首字母大写，其他首字母小写】+身份证号（或护照）后六位【包含字母的，字母大写】

手机验证码登录找回密码

author：

宋艳娟 (宋艳娟.) ^[1] | 张文德 (张文德.) ^[2] (Scholars：张文德)

Abstract：

本文对XML的PDF文档信息抽取系统进行了研究。文章首先设计了科技论文的DTD文档,然后分析了PDF文档的结构。在此基础上,介绍了PDF文档信息抽取系统的设计框架。该框架以上述DTD为模板,把以PDF格式表示的科技论文解析转换为有效的XML文档。

Keyword：

信息抽取情报分析数据挖掘

Community：

Reprint 's Address：

Email：

Show more details

Related Keywords：

Source ：

Year： 2006

Page： 396-401

Language： Chinese

Cited Count：

WoS CC Cited Count：

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count： -1

Chinese Cited Count：

30 Days PV： 0

Affiliated Colleges：

Get Fulltext

Library Discovery Baidu Scholar Search WF