情報知識学会誌
Online ISSN : 1881-7661
Print ISSN : 0917-1436
ISSN-L : 0917-1436

この記事には本公開記事があります。本公開記事を参照してください。
引用する場合も本公開記事を引用してください。

異なる学問分野のコーパスを利用した専門用語抽出手法の提案
久保 順子辻 慶太杉本 重雄
著者情報
ジャーナル フリー 早期公開

論文ID: 19-320

この記事には本公開記事があります。
詳細
抄録

コンピュータを使用した専門用語自動抽出は,従来,対象とする専門分野のテキストコーパスのみをデータとして行っているものが多かった.しかし,専門用語の特徴として,対象分野のコーパスに頻出し,対象分野以外の他分野コーパスにはあまり多く出現しない点が挙げられる.そこで本研究では,対象分野コーパスと他分野コーパスとの用語の出現率の差を考慮した手法を提案する.実験では,女性学のテキストを対象分野のコーパスとして使用し,他分野のコーパスとして39分野のテキストを使用した.実験の結果,従来の代表的手法よりもかなり高い精度で用語が抽出できることが明らかとなった.また39分野のテキストから任意のテキストを選び他分野コーパスとして用いてコーパスの規模を縮小できるか実験を行った.その結果,対象分野と類似した分野のテキストを用いることで,39分野すべてのテキストを用いた場合の抽出精度・再現率に近づけることができた.

著者関連情報
© 2010 情報知識学会
feedback
Top