编目字段的多少并不能代表一条数据的好坏,大约能表达一条数据的详细程度。
DC给数据定义个15个项,想必有他的道理。前些时间想起来看看图书的MARC数据常用到多少个字段,于是对随机抽取出来的一万条国家图书馆的数据进行了一下统计,数据的时间大约是03年左右的。结果来看数据比回溯建库的时候当然字段是要丰富了许多。或许如果对不同来源的数据进行比较才能比较出数据的繁简程度。这个统计只能算是一种想法或者思路的尝试。
字段个数 | 出现次数 | 百分比 |
14 | 2 | 0.02% |
15 | 13 | 0.13% |
16 | 203 | 2.03% |
17 | 332 | 3.32% |
18 | 771 | 7.71% |
19 | 1492 | 14.92% |
20 | 1808 | 18.08% |
21 | 1657 | 16.57% |
22 | 1243 | 12.43% |
23 | 936 | 9.36% |
24 | 656 | 6.56% |
25 | 459 | 4.59% |
26 | 241 | 2.41% |
27 | 95 | 0.95% |
28 | 50 | 0.5% |
29 | 19 | 0.19% |
30 | 14 | 0.14% |
大于30 | 9 | 0.09% |
你可以使用这个链接引用该篇文章 http://publishblog.blogchina.com/blog/tb.b?diaryID=3078314
|
- 评论人:da
2007-11-16 10:57:39
|
|||
这个有什么意思 |
||||
|
- 评论人:飞云
2005-09-30 09:46:18
|
|||
从以上的统计可以看出,绝大部分的数据字段个数都在18-22个之间。高于30个字段的只是极少数的记录了。
|
||||