Abstract:
本文对XML的PDF文档信息抽取系统进行了研究。文章首先设计了科技论文的DTD文档,然后分析了PDF文档的结构。在此基础上,介绍了PDF文档信息抽取系统的设计框架。该框架以上述DTD为模板,把以PDF格式表示的科技论文解析转换为有效的XML文档。
Keyword:
Reprint 's Address:
Email:
Source :
Year: 2006
Page: 396-401
Language: Chinese
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count: -1
Chinese Cited Count:
30 Days PV: 1
Affiliated Colleges: