自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
19 巻, 2 号
選択された号の論文の3件中1~3を表示しています
巻頭言
論文
  • 鍜治 伸裕, 喜連川 優
    2012 年 19 巻 2 号 p. 65-88
    発行日: 2012/07/06
    公開日: 2012/10/05
    ジャーナル フリー
    日本語を含めた多くの言語において,複合名詞内部の単語境界は空白で分かち書きされない.こうした複合名詞を構成語列へと分割する処理は,多くの自然言語処理の応用において重要な基礎技術となる.日本語の場合,片仮名語は生産性が高く未知語が多いことから,特に片仮名複合名詞の扱いが技術的な問題となる.この問題の解決を図るため,本論文は片仮名複合名詞の言い換えと逆翻字を分割処理に利用する方法を提案する.実験では,言い換えと逆翻字をラベルなしテキストから抽出し,その情報を利用することによって,分割精度が統計的に有意に向上することを確認した.
  • 貞光 九月, 齋藤 邦子, 今村 賢治, 松尾 義博, 菊井 玄一郎
    2012 年 19 巻 2 号 p. 89-106
    発行日: 2012/07/06
    公開日: 2012/10/05
    ジャーナル フリー
    本論文ではブートストラップ法を用いた語彙獲得を行う際に,トピック情報を用いることでセマンティックドリフトを緩和し,獲得精度を向上できることを示す.獲得対象とする語を含む文書の大域的情報であるトピック情報を,統計的トピックモデルを用いて推定し,識別モデルを用いたブートストラップ法における3つの過程で利用する.1つ目は識別モデルにおける素性として,2つ目は負例生成の選択基準として,3つ目は学習データの多義性解消のために用いる.実験において,提案手法を用いることでセマンティックドリフトを軽減し,語彙の獲得精度が6.7から28.7%向上したことを示す.
feedback
Top