主催: Webインテリジェンスとインタラクション研究会
会議名: WI2研究会
回次: 11
開催地: LIFULL本社
開催日: 2017/12/15 - 2017/12/16
p. 51-56
現在,様々な単語の分散表現を獲得する手法がある.fastText を始めとする単語分散表現を取得する多くの手法では文書を入力し,隠れ層と出力層からなる2 層のニューラルネットワークで学習を行い, 隠れ層における各単語の重みを抽出することで各単語の分散表現を獲得することができる.これらの手法では,学習ごと,つまり学習するコーパスごとで得られた単語ベクトルモデルの各要素に関連性はない. 本稿では, 機能語を次元とするベクトル空間へ各学習で得られた単語ベクトルを射影することで,コーパスによって異なる単語のコンテキストを検出する指標を提案する.単語のコンテキストが概ねのコーパスで変化しないと考えられる機能語と各単語との類似度を要素とするベクトルを生成する.生成したベクトルを参照して, 同一単語について異なるモデル間でのベクトル類似度を提案指標とする.提案指標の妥当性を提案指標と主観評価による単語コンテキストの差異の評価の比較によって評価した.