情報管理
Online ISSN : 1347-1597
Print ISSN : 0021-7298
ISSN-L : 0021-7298
JSTサービス紹介
JST科学技術用語シソーラスの改訂
山崎 文枝
著者情報
ジャーナル フリー HTML

2017 年 60 巻 5 号 p. 365-368

詳細

1. はじめに

科学技術振興機構(JST)では1975年から科学技術全分野の専門用語を体系的に整理した辞書として,「JST科学技術用語シソーラス」(以下,JSTシソーラス)を整備している。また2008年からシソーラスを骨格としてその同義語等を整理した「大規模辞書」の整備を開始し,現在は113万語の科学技術用語を体系づけた辞書として公開している1)。大規模辞書は,同義語,表記ゆれ語を整理し,さらに上位語となる,あるいは関連の深いシソーラス用語への関係づけも行っており,シソーラスを骨格として体系づけられた辞書である。JDreamIIIのJSTシソーラスブラウザ(1),J-GLOBALのJSTシソーラスmap2)2)でJSTシソーラスと大規模辞書を公開している。

2017年4月,JSTシソーラスを改訂し,それに伴う大規模辞書の修正,および文献記事の修正を行ったので報告する。

図1 JSTシソーラスブラウザ
図2 JSTシソーラスmap(表示例)

2. 改訂の基本方針

シソーラスは,日々進歩する科学技術に合わせて,定期的に改訂する必要がある。今回は以下の方針に基づいて改訂を行った。

  • ・世の中の動きや用途に,よりマッチした用語をシソーラスに収録する。具体的には,新たな概念の収録,時勢に合わない収録用語の表記修正,統合・分離,削除を行う。
  • ・シソーラス用語の階層構造については,新たな概念や時勢に合わない階層関係に関して,修正,追加・新設を行う。
  • ・JSTシソーラスから削除した用語は,大規模辞書(JSTシソーラスブラウザ・JSTシソーラスmap)に収録し,JDreamIII等での検索時の利便性を維持する。
  • ・JDreamIIIの記事データは,該当するすべての記事の索引部分に対して,シソーラスの改訂内容に従い,機械的な付け替え(バックファイルメンテナンス)を行い,検索でのヒット件数が損なわれることがないようにする。

3. 改訂規模と改訂例

JSTで作成している科学技術文献データベースの,年間索引頻度50以上の用語を候補語とし,その中から各研究分野の核となる用語を選定した。今回の改訂の概要は以下のとおりである。

1) 新JSTシソーラス(2017)の用語数

3万7,410語(旧JSTシソーラス(2015)では3万7,349語)

2) 改訂内訳

  • ・新語 65語
  • ・表記・階層等修正語 125語
  • ・削除・統合語 4語

3) 改訂例

以下に改訂例を示す

  • ・新語の登録(表1
  • ・表記の修正(表2
  • ・階層の修正(表3

ある特定の分野での利用に限定した上位語が付いていたものについて上位語を見直し,他の分野でも利用できるようにした。旧上位語については必要に応じて,関連語(RT)とした。

  • ・削除・統合(表4

似た意味をもつ2つのシソーラス用語について,片方を残して統一した。削除した方の用語については,大規模辞書の同義語,あるいは関連語として統一後のシソーラス用語を案内している。

表1 新語の登録例
表2 表記の修正例
表3 階層の修正例
表4 削除・統合

4. シソーラス改訂に関連する諸データの修正

シソーラスを利用している諸データ(大規模辞書,JDreamIII文献記事の索引)についてもこの改訂に伴う修正を行った。大規模辞書では,同義語の見直しや表記の追加,上位語,関連語となるシソーラス用語の見直しを行った。3は上位語を見直したことにより,階層を充実させた例である。

また,JSTが作成する文献データベースを改訂後のシソーラスに基づいて検索できるように,過去記事のキーワードの付け替えを行った。4は表記修正を行った用語についての索引修正の例である。

図3 大規模辞書を含めた階層の充実
図4 文献記事の索引修正例

5. JDream検索への影響

今回のシソーラス改訂に伴い,2017年4月以降のJDreamサービス(科学技術文献速報およびSDIサービスを含む)の新着データには,新語や,これまでと表記の異なるシソーラス用語が索引されることになる。たとえば,“グルジア”ではなく,“ジョージア【国】”が索引語として付与される(ただし,標題や著者抄録中の“グルジア”が“ジョージア【国】”に置き換えられることはない)。そのため,SDI検索や過去の保存式を用いて検索を行う場合には,シソーラス改訂の影響を確認し,検索式中の語が改訂対象であれば,検索式の修正を検討する必要がある。

たとえば以下の例1・例2のように,シソーラス用語のみに基づいた検索(検索コード/CTを用いた検索)に限らず,キーワード検索(/AL)や全文検索(/QS,または検索コードなし)の場合も改訂前後ではヒット件数が大きく変わる場合があるので,改訂対象の索引語の置き換えやOR検索式への修正を推奨したい(この例では,検索式中に“グルジア”があれば,“ジョージア【国】”に置換したり,“グルジア OR ジョージア【国】”に修正したりすることが推奨される)。

<例1 2016年3月時点での検索結果(想定)>
L1 グルジア/CT 220
L2 グルジア/AL 230
L3 グルジア 230
L4 ジョージア【国】/CT 0
L5 ジョージア【国】/AL 2
L6 ジョージア【国】 2
<例2 2017年4月時点での検索結果(想定)>
L7 グルジア/CT 0
L8 グルジア/AL 230
L9 グルジア 230
L10 ジョージア【国】/CT 220
L11 ジョージア【国】/AL 222
L12 ジョージア【国】 222

6. おわりに

このような科学技術全分野の専門用語を体系的に整理した辞書は,文献検索というこれまでの用途に加え,今後は自然言語処理等での活用が期待されており,引き続き収録用語の充実を図ってゆく計画である。その骨格をなすシソーラスについても,規模は小さくとも短いスパンでの改訂を進めてゆきたい。

今回のシソーラス改訂の詳細については,(http://jdream3.com/news/20170306.html)を参照していただきたい。

(科学技術振興機構 情報企画部 山崎文枝)

参考文献
  • 1)  岩沢一男, 倉田重子, 山崎文枝, 中村徹. JST科学技術用語シソーラスの改訂:2008年版シソーラスと大規模辞書との連携. 情報管理. 2008, vol. 51, no. 2, p. 129-137. http://doi.org/10.1241/johokanri.51.129, (accessed 2017-06-10).
  • 2)  國岡崇生, 田村友紀, 山崎文枝, 堀内美穂, 坂内悟. JSTシソーラスmap:JST辞書の可視化による効果的な検索語の発見. 情報管理. 2012, vol. 55, no. 9, p. 662-669. http://doi.org/10.1241/johokanri.55.662, (accessed 2017-06-10).
 
© 2017 Japan Science and Technology Agency
feedback
Top