自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
最新号
選択された号の論文の3件中1~3を表示しています
巻頭言
論文
  • 桾澤 優希, 山本 和英
    2018 年 25 巻 3 号 p. 255-293
    発行日: 2018/06/15
    公開日: 2018/09/15
    ジャーナル フリー

    本論文では,日本語語義曖昧性解消に存在する問題点を文中のひらがなを漢字に直すかな漢字換言タスクを通して明らかにする.素性について分散表現と自己相互情報量を組み合わせる手法を考案し実験を行った結果,かな漢字換言においてベースラインに比べ約 2 ポイント高い精度を得ることができた.日本語の語義曖昧性解消タスクを用いた検証においても,PMI を用い文全体から適切な単語を素性として加えることが有効であることを示した.かな漢字換言の利点を活かし,大量の訓練データを用いたときのかな漢字換言の精度の比較を行った結果,非常に大きい訓練データを用いた場合分散表現を用いたどの手法でもほぼ同じ精度を得られることがわかった.その一方で同じ精度を得るために必要な訓練データは指数関数的に増えていくため,少ない訓練データで精度を上げる手法が語義曖昧性解消において重要であることを確認した.また,BCCWJ と Wikipedia から作成した訓練データとテストデータを相互に使い実験し,各ドメインにあった訓練データを使うことが精度向上において重要であることを確認した.

  • 谷中 瞳, 峯島 宏次, Pascual Martínez-Gómez, 戸次 大介
    2018 年 25 巻 3 号 p. 295-324
    発行日: 2018/06/15
    公開日: 2018/09/15
    ジャーナル フリー

    文と文がどのような意味的関係にあるかという文間の関連性の計算は,情報検索や文書分類,質問応答などの自然言語処理の基盤を築く重要な技術である.文の意味をベクトルや数値で表現する手法は未だ発展途上であり,自然言語処理分野においては,様々な機械学習による手法が活発に研究されている.これらの手法では,文字や単語を単位としたベクトルを入力として,それらの表層的な出現パターンとその振る舞いを学習することで,文ベクトルを獲得している.しかし,否定表現を含む文など,文の構造的意味を正確に表現できるかは自明ではない.一方で,形式意味論においては,表現力の高い高階論理に基づいて意味の分析を行う研究が発展しているが,文間の関連性のような,連続的な意味的関係を表現することが困難である.そこで本研究では,機械学習と論理推論という二つの手法を組み合わせて文間の関連性を計算する手法を提案する.具体的には,文間の含意関係を高階論理の推論によって判定するシステムの実行過程から,文間の関連性に寄与する特徴を抽出し,文間の関連性を学習する.文間類似度学習と含意関係認識という2つの自然言語処理タスクに関して提案手法の評価を行った結果,推論の過程に関する情報を特徴量に用いることによって,いずれのタスクにおいても精度が向上した.また,含意関係認識用データセットの一つであるSICKデータセットの評価では,最高精度を達成した.

feedback
Top