博客开篇- -| 回首页 | 2005年索引 | - -MARC数据中的字段数统计

拼音的困惑

关键词MARC    拼音    编目                                          

困惑一:拼音的格式:
做一条数据就要给某些字段加拼音,这好像是常规了。好在手边的软件大都可以自动地加拼音,所以给那些个字段加拼音已经不再是什么难题了。但是给一条数据加拼音并不难,难的是给千千万万条数据加拼音。更难的是给那么多的数据加同样的拼音。这里所说的同样的拼音就是指格式一样的拼音。

从见到过的MARC数据中的拼音格式类型来看有几种:

1)所有字母都小写,
2)所有字母都大写,
3)每个子字段的首字的首字母大写,其余的小写
4)每个字的首字母大写,其余字母小写

以上几种都是每个单字分开的,

5)按词分隔,每个词的首字母大写其余的小写

随着编目数据的积累和交流,要把各种不同来源的数据放到一起,拼音就成了一个问题。通常的做法是将原来的拼音全部删除,然后重新加拼音。工作量非常之大,还要仔细辨认多音字。够让人困惑的。

困惑二、哪些字段加拼音
比较有统一意见的是200$a要加拼音,这个没有问题。但是有不少图书馆200的$e$n$i也有加拼音的,还有7××字段的$a似乎也有不少加拼音的。到底应该怎样用才是合适的呢??

还有用USMARC编中文图书,要求245字段等用拼音,而用880字段写中文。而另一种做法是用两个245字段,分别著录拼音和汉字。困惑!

困惑三、如何断词
如果按字切割,比较方便。如果想要按词切割,计算机处理起来就很麻烦了,计算机不够智能无法判断改怎样断词。按照ALA的罗马化拼音的规则似乎计算机是无计可施了。

曾有朋友提出过,让编目员在的时候,将要加拼音的字段用空格人工断词,让计算机执行加拼音的过程后自动将多余的空格删除。不知这样的主意编目员是否都愿意接受。困惑之三

已经有不少日子在这样的困惑中徘徊.........

【作者: topflyer】【访问统计:】【2005年09月28日 星期三 21:57】【 加入博采】【打印

Trackback

你可以使用这个链接引用该篇文章 http://publishblog.blogchina.com/blog/tb.b?diaryID=3067408

博客手拉手

博客开篇
编目不能只看书名
做编目工作一年了
对编目工作的一些担忧
对编目外包的再认识

回复

- 评论人:路过人   2006-12-22 15:39:40   

好象听说国图格式要求所有拼音字母都应该是小写,但好象有很多MARC著录是每个字拼音的拼首大写,其他字母小写,这样看起来比较清楚.
CNMARC专家这款软件中可以对拼音字段进行批量处理,根据需要可大写,可小写,也可只有拼首大写.

- 评论人:Silence   2006-05-05 11:13:14   

每个字的首字母大写,其余字母小写, 人名地名也大写。美国会图书馆有规则可依。

880 还是平行的245取决于集成系统,国会使用的是Voyager, 用880。

按字切割, 只有人名地名例外:Mao Zedong, Zhongguo, Xianggang

验证码:   
评论内容: