MARC数据中的字段数统计- -| 回首页 | 2005年索引 | - -搜罗,在中国的世界遗产

MARC编目数据的分类深度统计- -

                                      

       统计看起来是一件满有意思的工作,使我看待MARC数据的眼光有了另外的感觉。这次还是对同样一批(一万条)的国家图书馆数据进行了分类级别的统计,实际上就是统计一下690$a的长度,考虑到使用复分号造成的长度的影响,暂时不计算“-”后的内容。

分类号长度

记录数

百分比

1

46

0.46%

2

359

3.59%

3

861

8.61%

4

1678

16.78%

5

369

3.69%

6

2782

27.82%

7

2206

22.06%

8

974

9.74%

8位以上

723

7.23%

- 作者: 飞云 访问统计: 2005年09月30日, 星期五 10:59 加入博采

Trackback

你可以使用这个链接引用该篇文章 http://publishblog.blogchina.com/blog/tb.b?diaryID=3081474

回复

- 评论人:飞云   2005-10-10 16:37:25   飞云的博客  

dwzql:我使用了一个工具软件统计的。统计方案是用java Scrept程序编写的。

- 评论人:dwzql   2005-10-07 14:21:29   

请教是如何统计的?

- 评论人:飞云   2005-09-30 20:44:52   

统计的意图??这单个统计的意图不是太明确,或许只是尝试寻找对MARC数据进行分析评价的一种简单客观的方法,目前还没有找到理想的方案。想用一系列的统计来说明MARC数据状况。
去掉-后的位数,是考虑复分的位数长,级别没有那么多,希望统计公平一些,客观一些。对其他复分表因为没有特定的符号分隔所以对计算机来讲就没有很好的办法了,所以就简单地把-后的去掉了。
编目先生有什么好的办法吗??

- 评论人:cat wizard   2005-09-30 19:24:20   

很有意思的统计数据。不知道您的统计意图是什么?
为什么不计算“-”后面的呢?通用复分表除了总论表有“-”外,其他各表都不一定用符号分隔。所以即使没有“-”,也不能说明没有用复分号呀。况且还有主表中的复分呢。

评论内容: