情報知識学会誌
Online ISSN : 1881-7661
Print ISSN : 0917-1436
論文
異なる学問分野のコーパスを利用した専門用語抽出手法の提案
久保 順子辻 慶太杉本 重雄
著者情報
ジャーナル フリー

20 巻 (2010) 1 号 p. 15-31

詳細
PDFをダウンロード (1777K) 発行機関連絡先
抄録

コンピュータを使用した専門用語自動抽出は,従来,対象とする専門分野のテキストコーパスのみをデータとして行っているものが多かった.しかし,専門用語の特徴として,対象分野のコーパスに頻出し,対象分野以外の他分野コーパスにはあまり多く出現しない点が挙げられる.そこで本研究では,対象分野コーパスと他分野コーパスとの用語の出現率の差を考慮した手法を提案する.実験では,女性学のテキストを対象分野のコーパスとして使用し,他分野のコーパスとして39分野のテキストを使用した.実験の結果,従来の代表的手法よりもかなり高い精度で用語が抽出できることが明らかとなった.また39分野のテキストから任意のテキストを選び他分野コーパスとして用いてコーパスの規模を縮小できるか実験を行った.その結果,対象分野と類似した分野のテキストを用いることで,39分野すべてのテキストを用いた場合の抽出精度・再現率に近づけることができた.

著者関連情報
© 2010 情報知識学会
前の記事 次の記事

閲覧履歴
feedback
Top