|
|
用户名:topflyer 笔名:飞云 地区: 行业:其他 |
| 日 | 一 | 二 | 三 | 四 | 五 | 六 |
欢迎访问飞云的博客
新闻出版总署批准发布《图书流通信息交换规则》行业标准
关注: CIP在版编目项目动向
海外中文图书的编目数据印象
Z39.50服务器中的ISBN号著录标准
对于编目来说标准已经够多的了,从著录开始遵循各种标准,marc数据也都执行了标准,总以为在这么多标准基础上建立的数据库是标准的不能再标准了。可是谁知道在标准来不及说明的小小角落,一个小小的不标准也能让检索的人费尽麻烦。如果谁有能力应该建议一下,在标准上再增加一个小标准。
这些废话有感于这几天查询了几个z39.50服务器。
用ISBN号查询服务器,美国国会图书馆的服务器,ISBN号是没有 "-" 的,国外的服务器大都如此。但是国内的服务器就不是这样的了。国家图书馆的z39.50服务器,如果没有输入 “-”就不能找到想要的数据。不知这样的问题是在服务器解决还是要z39.50前端软件来解决。反正要查询的人用起来就不是那么方便了。
在这样的情况下倒是希望能够有非用字的过滤,能够给使用者带来一些方便。
MARC编目数据的分类深度统计
MARC数据中的字段数统计
编目字段的多少并不能代表一条数据的好坏,大约能表达一条数据的详细程度。
DC给数据定义个15个项,想必有他的道理。前些时间想起来看看图书的MARC数据常用到多少个字段,于是对随机抽取出来的一万条国家图书馆的数据进行了一下统计,数据的时间大约是03年左右的。结果来看数据比回溯建库的时候当然字段是要丰富了许多。或许如果对不同来源的数据进行比较才能比较出数据的繁简程度。这个统计只能算是一种想法或者思路的尝试。
字段个数 | 出现次数 | 百分比 |
14 | 2 | 0.02% |
15 | 13 | 0.13% |
16 | 203 | 2.03% |
17 | 332 | 3.32% |
18 | 771 | 7.71% |
19 | 1492 | 14.92% |
20 | 1808 | 18.08% |
21 | 1657 | 16.57% |
22 | 1243 | 12.43% |
23 | 936 | 9.36% |
24 | 656 | 6.56% |
25 | 459 | 4.59% |
26 | 241 | 2.41% |
27 | 95 | 0.95% |
28 | 50 | 0.5% |
29 | 19 | 0.19% |
30 | 14 | 0.14% |
大于30 | 9 | 0.09% |