自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
概念間距離の定式化と既存電子化辞書との比較
岡本 潤石崎 俊
著者情報
ジャーナル フリー

2001 年 8 巻 4 号 p. 37-54

詳細
抄録
コンピュータで言語処理を行なうとき, 構文解析や意味解析だけでなく人間が持つ一般的な知識や当該分野の背景的知識などの情報が必要になる. 本研究では, 人間の持つ知識を調べるため連想実験を行ない連想概念辞書として構造化した. 連想実験では, 小学生の学習基本語彙中の名詞を刺激語とし, 刺激語と「上位概念, 下位概念, 部分・材料, 属性, 類義語, 動作, 環境」の7つの課題から連想語を収集する. 従来の電子化辞書は木構造で表現され, 概念間の距離は階層の枝の数を辿る回数をもとに計算するなど構造に依存したものであったが, 連想概念辞書では連想実験から得られるパラメータをもとに, 線形計画法によって刺激語と連想語の距離を定量化した. また距離情報を用い, 「果物」「野菜」「家具」などの日常頻出語を中心として3~4階層をなす刺激語の連想語 (上位/下位概念) のつながりを調べた. この連想概念辞書とEDR電子化辞書, Word Netの比較を, 上位/下位階層をなす概念問の距離を求めることで行なった. 連想概念辞書とWord Netは, ある程度近い概念構造を持っており, 一方EDRは他の2つとは異なる特徴の構造を持っていることがわかった.
著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top