The Digital Cataloger

インターネット時代の図書館目録

Vol.5 第4節 メタデータとしての図書館目録

突然ですが(笑)、図書館目録は、メタデータです。

メタデータとは、その名の通りデータに関するデータのコトで、目録の場合、本そのモノに書かれているデータではなく、その本自体について書かれたデータという意味で、メタデータになります。

これは一体、何を意味するでしょう?

たとえば、ある特定の本ではなく、何かの事柄について調べようとしている場合、Web-OPAC等で、自分が探しているキーワードを入力して検索すると思います。

その際、GoogleブックスKindleX-Rayのように、本の全ての内容がテキスト化されていて、機械的に検索できたり頻出単語が分かるようになっていれば、自分が探している本を見つけるコトができるでしょうか?

確かに、図書館についての本であれば、その中に「図書館」という単語が出てくる蓋然性は高いので、「図書館」という単語が多く含まれる本は、図書館についての本ではないかと類推できます。
しかし、もしかしたら、それは図書館を舞台にした小説かもしれません。図書館の歴史について調べている場合は、それでは少し困ります。

同じように、他にも図書館というコトバを多く含む本でも、図書館の建築についての本もあれば、法律についての本もあります。自分がどんな本を求めているのかによって、選ぶ本が全く違ってくるコトは言うまでもありません。

では、さらに「歴史」「建築」「法律」というコトバを掛けあわせて検索すればよいかというとそうでもありません。
ある概念を説明するのに、そのモノ自体の名称は使わないコトは大いに考えられます(というか、そもそも説明というのはそういうモノです)。

こう考えると、ある本の中の頻出単語さえ分かれば自分の探している本が見つかるかというと、決してそうでもないコトが分かります。

そこで、その対象(この場合は本)にどっぷり浸かるのではなく、一歩ひいて、「そのモノは一体なんなのか?」という特徴や概要を記す情報が必要になってきます。
それがメタデータであり、図書館の本の場合は目録というコトになります。

図書館目録には、本の大きさ(主に縦の長さ)やページ数といった、文字どおり、物理的な外観の情報も含まれますが(時に、これも本選びの大きな手がかりになります)、その本のタイトル著者といった、自分が探しているコトの大きなヒントになる情報がメインになります(タイトルはもちろんですが、著者についても、何の専門家なのかと言った観点から、本探しの重要な情報になります)。

で、さらに、これこそが全文検索とは違うところですが、目録には、「件名」「分類記号」といわれる情報が付与されています。

件名というのは、英語でいうと「Subject」です。
ボクが図書館の勉強をしていた頃は、あまり図書館以外では聞き慣れないコトバでしたが、今ではすっかり「メールの件名」としてイメージしやすいと思います。
つまり、「これは何についてのモノなのか」という表題、本の場合だと、その本の内容を一言で表現するコトバです。

一方、分類記号は、本を分野ごとに分類し、その分野ごとに一定のルールで(主に)数字を使って分ける方法です。

これらは、目録を作るヒトが本の内容を見て判断しますが、そのヒトの趣味や嗜好で、好き勝手なコトバや番号をつけても意味がないので、事前に決められたモノの中から選択するようになっています(なので、逆に、それを知らないと検索できないという問題があります)。

一方、人間が判断しますので(この作業は、まだ(?)、コンピュータによる機械化は実用段階ではありません)、当然、ガイドラインはあるものの、作業したヒトの視点や能力(経験)によって、違った件名や分類記号が付けられる可能性はあります。

それでも、経験豊富なカタロガ(目録を作成するヒト)が、実際に目次や内容を確認してそれらを付与すれば、本には直接書かれていない、もっと抽象的なレベルで本を分類し、本を選ぶ際の大きな手助けになるコトはご理解いただけると思います。

今後、もし、世の中の全ての本がスキャンされ、全文がテキスト化されても、それで探している本が見つかるかというと、必ずしもそうではありません。
その点で、目録というメタデータは必要ですし、そのためには、まだまだカタロガという人間のチカラが必要なのです。

つづく