困惑一:拼音的格式:
做一条数据就要给某些字段加拼音,这好像是常规了。好在手边的软件大都可以自动地加拼音,所以给那些个字段加拼音已经不再是什么难题了。但是给一条数据加拼音并不难,难的是给千千万万条数据加拼音。更难的是给那么多的数据加同样的拼音。这里所说的同样的拼音就是指格式一样的拼音。
从见到过的MARC数据中的拼音格式类型来看有几种:
1)所有字母都小写,
2)所有字母都大写,
3)每个子字段的首字的首字母大写,其余的小写
4)每个字的首字母大写,其余字母小写
以上几种都是每个单字分开的,
5)按词分隔,每个词的首字母大写其余的小写
随着编目数据的积累和交流,要把各种不同来源的数据放到一起,拼音就成了一个问题。通常的做法是将原来的拼音全部删除,然后重新加拼音。工作量非常之大,还要仔细辨认多音字。够让人困惑的。
困惑二、哪些字段加拼音
比较有统一意见的是200$a要加拼音,这个没有问题。但是有不少图书馆200的$e$n$i也有加拼音的,还有7××字段的$a似乎也有不少加拼音的。到底应该怎样用才是合适的呢??
还有用USMARC编中文图书,要求245字段等用拼音,而用880字段写中文。而另一种做法是用两个245字段,分别著录拼音和汉字。困惑!
困惑三、如何断词
如果按字切割,比较方便。如果想要按词切割,计算机处理起来就很麻烦了,计算机不够智能无法判断改怎样断词。按照ALA的罗马化拼音的规则似乎计算机是无计可施了。
曾有朋友提出过,让编目员在的时候,将要加拼音的字段用空格人工断词,让计算机执行加拼音的过程后自动将多余的空格删除。不知这样的主意编目员是否都愿意接受。困惑之三
已经有不少日子在这样的困惑中徘徊.........
你可以使用这个链接引用该篇文章 http://publishblog.blogchina.com/blog/tb.b?diaryID=3067408
|
- 评论人:路过人
2006-12-22 15:39:40
|
|||
好象听说国图格式要求所有拼音字母都应该是小写,但好象有很多MARC著录是每个字拼音的拼首大写,其他字母小写,这样看起来比较清楚.
|
||||
|
- 评论人:Silence
2006-05-05 11:13:14
|
|||
每个字的首字母大写,其余字母小写, 人名地名也大写。美国会图书馆有规则可依。
|
||||