Abstract:
<正> 1.分析 根据有关资料的统计,汉字的使用具有明显的字频分布特征。按字频由大到小顺序排列的前N个字,字频累计百分比如下分布:N=1,>4%; N=20,>16.7%; N=163,>50%;N=1000,>90%; N=2400,>99%; N=3838,>99.9%。并且随着时间的推移,高频字将越来越集中。汉字字频分布特征可为设计字形发生器提供参考。根据题目要求,选择汉字量1000~2000个,这样容量没有超过64K且字频累计百分比可大于90%。在实际运用时,高频率分为公用高频字与专用高频字,专用高频字与汉字的使用背景、目标、环境等有关,不易把握,因而过分地追求符合字频分布特征是不可能...
Keyword:
Reprint 's Address:
Email:
Source :
福建电脑
Year: 1996
Issue: 02
Page: 41-42
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 4
Affiliated Colleges: