TRC MARCは日本の8割強の公共図書館で利用されている書誌データベースである。1982年に提供を開始して以来,図書館業務の効率化に役立ち,図書館利用者の多様な検索ニーズに応えるツールとなることを目指して,内容の拡充と提供スピードの迅速化を図ってきた。本稿では,TRC MARC独自の入力項目を中心に,その内容および特色について述べる。併せて新刊図書MARCの作成工程についても紹介する。
TRC MARCは,株式会社図書館流通センター(以下,TRC)が作成・提供し,日本国内の公共図書館を中心に利用されている書誌データベースである。
図書館の資料をコンピューターで管理・検索するための書誌情報をMARCという注1)。図書館にある膨大な資料の中から「目的の1冊」を探し出すためには「どのような特徴の資料がどこにあるのか」がわかるように整備された蔵書目録が不可欠である。昔の図書館では紙の目録カードを作って蔵書を管理していたが,日本では1980年代に図書館のコンピューター導入が進み,目録はデータベース化されてMARC(機械可読目録)となった。
MARCは今では「あって当たり前」の存在なので改めて関心をもたれることは少ないかもしれない。しかし,おそらく多くの方がイメージしているよりも豊かな内容をもち,人手をかけて構築されてきたデータベースなのである。本稿ではTRC MARCの内容および作成方法を紹介する。日頃からMARCを利用している方にも,あまりなじみのない方にも,「書誌データベースの中身」を知っていただくことで今後の利活用を考える一助となれば幸いである。
TRCは,社団法人日本図書館協会の図書整理事業部が全国の図書館向けに行っていた「図書館資料の書誌作成」を継承するために,1979年に誕生した企業である注2)。1982年には,それまで提供していた目録カードに加えて,機械可読目録であるTRC MARCの提供を開始した。提供開始初年度の累積データは約20万件,以来作成を続けて2016年現在で和図書約360万件の累積データがある注3)。
2016年4月現在,TRC MARCは日本の公共図書館3,241館1)のうち2,801館(86.4%)で採用されている。また国立情報学研究所が運営する総合目録データベース(NACSIS-CAT)の参照MARCとして,全国の大学図書館等でも共同利用されている。このほかOCLC(Online Computer Library Center, Inc.)のWorldCatにも週次でMARCを提供しているため,海外の図書館で日本語図書を受け入れる際にも利用されている。
TRC MARCは,書誌情報であるMARCと,MARCとリンクして検索を拡充する連携ファイルからなる(図1)。以下では新刊図書のMARCと連携ファイルについて概観する(図2)。
MARCは長年にわたり多くの人の手によって作成されるものである。そうして蓄積されるデータから正確な検索結果を引き出せるようにするには,一定の規則にのっとって整合性のあるデータを作成する必要がある。TRC MARCは日本の図書館目録の共通ルールである「日本目録規則(NCR)」1987年版改訂3版に準拠し,細部については社内でマニュアルを作成して整合性を保っている。
タイトル,著者(責任表示),出版社(者),出版年,ページ数,大きさなどの基本的な項目はNCRにのっとって入力する。タイトルや著者名等には必ず対応するカナ読みも入力しているため,カナ読みからの統一的な検索も可能である。
図書館では資料をテーマから探せるように主題(テーマ)順に排架している。そのために必要なのが分類記号で,大多数の日本の図書館では「日本十進分類法(NDC)」が採用されている。現在TRC MARCではNDCの新訂8版と新訂9版を提供している。これに加えて2017年4月からは新訂10版も提供する。2014年末にNDCの最新版となる新訂10版が発表されたが,図書館でNDCの版を変更するには蔵書の背ラベルの貼り替え等を行う必要があり,物理的にも大変な作業になる。多くの図書館ではすぐに新訂10版に移行することは難しいため,新訂8版・新訂9版の分類提供も継続して行うこととした。また逆に新訂10版を採用する図書館が過去の図書を排架するときのために,累積のMARC全件に対しても新訂10版を付与して2017年4月から提供する予定である注4)。
このほかに本の主題を表すキーワードである件名も付与している。TRC MARCの件名は「基本件名標目表(BSH)」第4版をベースに「国立国会図書館件名標目表(NDLSH)」からも採用している。新しい主題が出現した場合には,必要に応じて件名の新設も行っている。近年新設した件名には「IoT」「ふるさと納税」「マタニティハラスメント」などがある。
3.1.2 TRC MARC独自の項目TRC MARCは,日本目録規則で規定されている項目以外にも多くの情報を盛り込んでいる。これはMARCを利用する図書館から寄せられる「こんな検索ができたら便利」「こんな情報があると選書(購入資料の選定)がしやすい」といった意見に応えて,さまざまな項目を追加してきたことによる。
たとえば,その本の内容を105文字以内の文章で紹介する“内容紹介”注5)。本の読者対象を表す“利用対象”。特に子どもは年齢によって読めるものが違うので,利用対象の区分も「0~2歳」「3~5歳」「小学1~2年生」「小学3~4年生」というように細かく設定している。分類からでは検索が難しい「時代小説」や「ミステリー」「季節・行事の絵本」「写真絵本」などが検索できる“ジャンル”。「ソフトカバー」「リング綴じ」「型紙付き」「しかけ付き」といった“装丁の特徴”も入力していて,図書館が選書する際に役立つ情報になっている。このほか,文学賞等を受賞した作品には“受賞情報”として賞名を,新聞の書評欄に掲載されたものには“書評情報”として新聞紙名と掲載日を入力している注6)。
これらの項目を組み合わせることで,「小学3~4年生が読める地震についての本で,できれば漫画で解説されているもの」「最近出た時代小説で何か賞をとった作品」「先月の新聞書評で紹介されていた本で,タイトルは忘れたが新書だった」といった検索も可能になる注7)。図書館利用者の多様なニーズに応えることを目指して,多角的な切り口を用意しているのである。
3.2 連携ファイル(1)典拠ファイル典拠ファイルは,著者名や件名など本を検索するときに重要なキーになる項目を管理するためのデータベースである。TRCが作成している典拠ファイルには「個人名」「団体名」「件名」「学習件名」「全集」「シリーズ」「出版者」の7種類がある。ここでは「個人名」「件名」「全集」の典拠ファイルについて紹介する。
3.2.1 個人名典拠ファイル個人名典拠ファイルは,著者または伝記や人物研究の主題となる人名を管理するデータベースで,人名検索で起こりがちな「困った事態」を解決できるツールである。たとえば同姓同名の著者が複数いる場合,単純に著者名で検索すると目的の人物以外の著作も混じった検索結果になってしまう。これに対して典拠ファイルでは著者各人に個別のIDを付けて管理することにより,同姓同名の著者一人ずつを区別して検索できるようにしている。また,外国人の著者は翻訳によって日本語表記が異なることが多い。シェークスピアは「ウィリアム・シェークスピア」「W.シェイクスピア」「沙比阿翁」など,これまで30通り以上の表記がなされてきたが,典拠ファイルではそれらがすべて同一人物の異表記であることがわかるように管理して,図書の表記にかかわらずシェークスピアの著作をまとめて検索できるようにしている。このほかに,複数のペンネームを使い分けている作家の別ペンネーム同士を参照できる機能もある。
3.2.2 件名典拠ファイル件名典拠ファイルは,本の主題を言葉で表す“件名”を管理するデータベースである。たとえば「人工知能」と「AI」のように,同じテーマを扱った本でもタイトル中で使われる表現はさまざまだが,件名は一つの概念に対して必ず決まった言葉を付与することにより「あるテーマについての本」を一括検索することを可能にする。この言葉の統一を管理するのが件名典拠ファイルである。また,昔「保母」「保父」と呼ばれていた職業が現在では「保育士」と呼ばれるように,言葉は時代によっても変わる。件名としては現在の呼称である「保育士」を付与するが,件名典拠ファイルには「保母」「保父」という名称からでも検索ができる参照機能をもたせている。
3.2.3 全集典拠ファイルタイトルや出版社が変わる継続資料の情報をまとめているのが全集典拠ファイルである。このファイルを利用すると,「婦人労働の実情」→「働く女性の実情」→「女性労働白書」→「女性労働の分析」というように改題を繰り返してきた継続資料もまとめて検索・管理することができる。
3.3 連携ファイル(2)内容細目ファイル内容細目ファイルは,短編集,アンソロジー,論文集など1冊の中に複数の作品を含む図書について,その内容のタイトル・著者・収録ページを最大499編まで収録しているデータベースである。これにより短編や論文1編のタイトル・著者名からの検索が可能になる。
3.4 連携ファイル(3)目次情報ファイル目次情報ファイルは,専門書(利用対象が大学生・大学院生または研究者のもの),楽譜,児童向けノンフィクションの目次を収録したデータベースである。図書の内容を把握するのに役立つほか,楽譜の内容曲など目次のキーワードからの検索を可能にする。
3.5 連携ファイル(4)更新データTRC MARCは一度作成すれば終わり,ではない。「直木賞」や「本屋大賞」のように図書刊行後に発表される受賞情報や,新聞書評の掲載情報などを,MARC作成後にも順次追加して「更新データ」として図書館に提供している。受賞情報は大きな話題になる賞以外にもプレスリリース等をチェックして情報を追加する。新聞書評は担当者が実際に新聞をめくって書評欄をチェックしている。対象としているのは「朝日新聞」「産経新聞」「日本経済新聞」「毎日新聞」「読売新聞」「中日新聞・東京新聞」の6種7紙である。
また著者の生年や没年が判明した場合は,個人名典拠ファイルに生没年情報を追加している。新聞で訃報をチェックするほか,新刊書の著者紹介からも情報を収集する。これも蓄積していくことで有用なデータになると考えている。
3.6 児童書に対する工夫生涯にわたって図書館を利用してもらうためには,子どもの頃から図書館を使う体験を重ねることが大切という考えから,TRC MARCは児童書のMARCに特に力を入れている(図3)。
児童書のMARCには,子どもが自分で検索して読みたい本を選べるように,子ども向けにまとめた“児童用内容紹介”を入力している。学年ごとに習う漢字に配慮して利用対象に合わせた漢字を使い,かみ砕いた表現をするよう工夫している。
3.6.2 学習件名ノンフィクションの児童書は,一冊の本が扱う主題が大きい傾向がある(たとえば「どうぶつ」「身のまわりのぎもん」)。一方で子どもはより具体的な小さなテーマから検索しようとすることが多い。このギャップに対応するために入力しているのが“学習件名”である。学習件名は子どもたちが日常生活や学習の中で出会う言葉を検索用キーワードにしたもので,ノンフィクションの児童書を対象に以下の基準で入力している。
これまでに学習件名を付与したMARCは約5万件に上る。これは5万冊の児童書を一括で検索できる巨大な索引のようなものといえばイメージしやすいだろうか。
水族館で見た「たつのおとしご」について知りたいと考えた子がいるとしよう。1冊まるごと「たつのおとしご」について解説している本は今まで数冊しか刊行されていないが,学習件名を使って検索すると60件のMARCがヒットする(図4)。ページ数も入力しているため,検索結果を見れば『海の生きもの図鑑』の36ページや『世界一ときめく質問、宇宙一やさしい答え』の145ページから「たつのおとしご」についての解説があることがわかるようになっている。
このように学習件名を使うと「調べたい事柄がどの本の何ページに載っているか」がわかるため,図書館員がレファレンスに答える際や子どもが調べ学習をする際に利用することができる。本の詳細な内容まで検索できるので図書館の資料をすみずみまで活用でき,蔵書数の少ない学校図書館での調べ学習にも有効である。
先述のとおり,ノンフィクションの児童書は目次もデータベース化している。児童書の目次は子どもが抱く疑問に沿ったものが多いため,目次を検索できればレファレンスサービスに有効なためである。子どもが図書館で「走ると胸がドキドキするのはなぜ?」「どうしておやつは3時に食べるの?」といった質問をしたとき,「胸がドキドキ」「3時 おやつ」といったフレーズで目次を検索すれば疑問について解説のある本を見つけることができるのである。
TRCは,MARCの作成・提供に加え,図書館への図書・視聴覚資料等の販売,運営受託,コンサルティングなどを総合的に行っている企業である。そこで次に,TRC MARCが図書館の資料収集とどのように関係しているかを紹介したい。
4.1 図書館用選書カタログ『週刊新刊全点案内』前の週にMARCを作成した新刊書の情報を週1回冊子にまとめて,図書館向けの選書カタログ『週刊新刊全点案内』(図5)として発行している。毎週火曜日に発行し,約3,000部を全国の図書館に送付している注8)。
『週刊新刊全点案内』の特長は,まず新刊書を網羅的に掲載していること注9),そしてTRC MARCの入力内容を反映して選書のための情報を豊富に掲載していることである。タイトル,著者,出版社,ページ数,価格などの基本情報はもちろん,分類,件名,内容紹介,著者紹介,受賞情報,ジャンル,利用対象,装丁の特徴,CDなど付属資料の有無,日本語以外で書かれている本にはその言語を,文庫には書き下ろしかどうかを表示する。「○○の改題」のようにその本の来歴を示す情報も表示し,図書館で改題前の本の所蔵を確認したうえで購入を検討することができるようにしている。全体の約6割にあたる本には表紙の写真も掲載している。
また新刊書の情報以外に,既刊書で「はじめて新聞書評に載った本」の情報もまとめて掲載している。新聞書評に載った本は利用者からの問い合わせが増えるため,図書館で所蔵を確認するために利用されている。
掲載図書にはすべて発注用のバーコードが付いており,バーコードを読み取ることで簡単に発注データを作ることができるようになっている。
個人が購入する本と違い,図書館が購入する資料には背ラベル・バーコード・フィルムコートなどの特別な装備が必要である。TRCでは注文を受けた本に対してこれらの装備を行って納品している。装備の内容や請求記号注10)は図書館ごとに異なるため,図書館と取引を開始する際に詳細に打ち合わせをし,図書館ごとに専用のプログラムを組んでいる。請求記号や背ラベルのプログラムは,MARCの入力項目(分類記号・別置記号・図書記号・巻冊記号・利用対象・大きさなど)を,図書館ごとの仕様に沿った形で編集するように作成する。これによって人為的なミスをなくし,正確な請求記号・背ラベルを自動的に出力できるようにしている。
TRCでは新刊書の約7割を在庫し,在庫倉庫と装備工場を一体化することによって素早い納品(在庫のある本なら最短5日で出荷)を実現している。一般的な注文~納品までの流れは次のとおりである。
(1)図書館から注文を受ける(オンライン発注が主流)。
(2)MARCの情報をもとに,図書館ごとに設定したプログラムを用いて請求記号を自動的に付与する。プログラムとは違う請求記号にしたい場合は,発注時に図書館から個別指示することも可能である。
(3)注文品の収集:まず在庫を確認してピッキング。在庫がない場合は取次会社を通して取り寄せる。
(4)集品できた本から装備を開始:請求記号をもとに背ラベルとバーコードをカラープリンターで出力する。出力したラベル類は図書館ごとに決められた位置に手作業で貼り付ける。
(5)フィルムコートを掛ける。
(6)装備が終わった本を検品し,納品原簿を付けて出荷する。
図書館では本を受け取ってもそれを管理するデータ(MARC)がなければ所蔵登録や貸出を行うことができない。そこで本を納品するタイミングに合わせて,図書館ごとの請求記号を付加した形でMARCを図書館にお届けしている。MARCの提供方法は図書館ごとのシステムに合わせた形で行っており,現在はインターネット経由のダウンロードが主流である。このMARCを図書館の蔵書管理システムに取り込むことにより,図書館に本が届いたら本に装備されているバーコードをなぞるだけで受入処理ができ,すぐに排架・貸出することができるのである。
最後に,新刊図書のMARCの作成工程を紹介する。TRC MARCの作成は,TRCのデータ部で行っている。データ部には約100名が在籍し,うち約70名が新刊図書MARCの作成に携わっている。
(1) 見本の入手TRC MARCは必ず実物の図書をもとに作成する。出版社から近刊情報(これから出る本の情報)もいただいているが,タイトル等が変更されることもよくあるため,実際に世に出る図書の実物を確認して必要な情報を一つひとつ入力していく。
MARC作成のための図書は,主に出版社が取次販売会社に見本として提出したものを使用している注11)。日本出版販売株式会社から毎日2回直接データ部に見本が届けられる。出版社によっても異なるが,データ部に見本が到着するのはおおむね本が書店店頭に並ぶ3~4日前。そこでMARCも3~4日で作成し,書店発売とほぼ同じタイミングで出来上がるように工程を組んでいる。
1日に搬入される見本は平均で約300冊。刊行点数の多い日は500冊近くなることもある。そんなときは部署内が緊迫した雰囲気になるが,どれほど冊数が多くてもMARCや新刊情報を遅れずに図書館に提供するよう取り組んでいる。
また出版物の中には大手取次を通さずに流通するものもある。新刊書をできるかぎり網羅的に収集するために,各種専門取次にもお願いして見本を入手しているほか,出版社に直接交渉して見本をいただく場合もある。
(2) 登録見本が届くと,累積のTRC MARC全件と近刊情報を検索してヒットチェックを行ったうえで,登録作業を開始する。タイトル,著者,出版社,ISBN,価格等の基本情報を入力し,1件ずつのMARCに固有のID(TRC MARC No.)を付与する。新刊書のMARC作成は,内容の豊富さ・正確さとスピードをいかに両立させるかが勝負である。効率よく作成するために,これ以降分業体制をとって各項目の入力・チェックを進めていく。
(3) 表紙の写真撮影登録した図書は,表紙の写真をデジタルカメラで撮影する。図書のイメージをわかりやすく伝えるために,ここで撮影した表紙を『週刊新刊全点案内』や図書館向けWebシステム「TOOLi」に掲載している。
(4) 分類・件名の付与次に図書の主題にかかわる情報を入力する。1冊ずつ内容を確認して分類記号と件名を付与し,利用対象,ジャンル,学習件名も入力する。一通り入力したら必ず別の担当者がチェックし,主題の把握が難しい本はさらに別の一人がチェックする。
以降の各工程においても,必ず入力者とは別の担当者がチェックすることを徹底している。
(5) 内容紹介の入力内容紹介は,図書のカバーや帯にあるあらすじ,まえがき,あとがき,目次,近刊情報の紹介文などを基にまとめる。その際「連載紙誌名」「書き込み欄がある」「しかけ付き」など,図書館が選書の際に知っておきたいと思われる情報も盛り込むように心がけている。
児童書には児童用内容紹介も入力する。入力システムに学年別漢字配当表(学年ごとに学習する漢字)を搭載しているため,利用対象に応じた漢字を確認しながら,わかりやすい文章になるよう工夫する(図6)。
内容細目ファイルと目次情報ファイルは,まず図書の目次をスキャンしてOCRでテキストデータ化して入力システムに取り込む。OCRでは誤変換も起こるため図書と照らし合わせて1文字ずつ確認。目次に対応する本文ページも確認しながら入力する。
(7) 初出人名・団体名の典拠作業著者名や件名として初めて出現した人名・団体名がある場合は,典拠ファイルを作成するための調査を行う。図書の記載を確認したうえで,オンライン資料を含む複数の参考資料にあたり,時には出版社や著者本人に確認をとることもある(図7)。すでに典拠ファイルにある人名でも同姓同名の別人という可能性があるので慎重に調査を行う。内容細目に現れる著者を含めて1日平均80件ほどの個人名典拠ファイルを新規作成している。
最後に,タイトル・著者といった基本事項を確認し,翻訳書の原タイトル,改題等の書誌的来歴,著作の言語,装丁の特徴などの詳細な項目を入力してMARCを完成させていく。入力システムに細かなエラーチェック機能を組み込んでいるため,単純な入力ミスは防げるようになっている(図8)。もちろん人の目でのチェックも欠かせない。入力後にはすべての入力内容とリンクする典拠ファイルの情報を一覧できる形でプリントアウトし,入力者とは別の一人,複雑な内容であればさらにもう一人がチェックを行う。ここまでの入力内容全体を図書と照らし合わせ,累積データとの整合性,分類と書誌的事項の整合性,典拠ファイルとのリンク等も確認する。
すべての項目を入力し終えたら校正に移る。入力したMARC全件を目録カード形式で印字して図書現物を見ながらもう一度主要な入力内容を確認するほか,15種類以上の校正用リストを用いて各項目をチェックしていく(図9)。ここで1文字でもミスがあれば全国の図書館に影響が及ぶため入念に校正を行う注12)。
図書によって時間差はあるが,ここまでで見本入荷から3~4日。これらの作業を毎日繰り返して,年間約8万件の新刊図書MARCが出来上がる注13)。
TRC MARCはこれまで,利用館から寄せられる意見をもとに,図書館の業務に役立つ使い勝手のよいMARCを作ること,利用者それぞれが図書館の資料の中から「求める1冊」を探し出すためのツールを提供することを目指してさまざまな工夫を重ねてきた。
現在「日本目録規則(NCR)」の改訂が進められており,新規則が2017年度中に公開される予定である2)。この改訂は,デジタル情報資源に対応し,図書館目録をセマンティックWebに適したものにしていこうとする世界的な潮流をくんだものであり,図書館で完結していた書誌情報をより広く活用していく方向を目指している。また書誌情報の作成方法も,AIを含む技術的な進展に合わせて変化していくものと考えられる。
こうした動向や新しい技術に積極的に対応しながら,私たちはこれからも,図書館にかかわる人たち,書誌情報を利用する人たちに役立つデータ作成を追求していきたいと考えている。
2001年株式会社図書館流通センター入社。データ部にてTRC MARCの作成を担当。研修やシステム開発にも携わる。