自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
24 巻 , 4 号
選択された号の論文の6件中1~6を表示しています
巻頭言
論文
  • 福岡 知隆, 白井 清昭
    2017 年 24 巻 4 号 p. 523-547
    発行日: 2017/09/15
    公開日: 2017/12/15
    ジャーナル フリー

    対話行為の自動推定は自由対話システムにおける重要な要素技術のひとつである.機械学習を用いた既存の対話行為の推定手法では,機械学習に用いる特徴のセットを 1 つ設定するが,この際に個々の対話行為の特質は十分に考慮されていなかった.機械学習の特徴の中にはある特定の対話行為の分類にしか有効に働かないものもあり,そのような特徴は他の対話行為の分類精度を低下させる要因になりうる.これに対し,本論文では対話行為毎に適切な特徴のセットを設定する.まず, 28 個の初期の特徴を提案する.次に,対話行為毎に初期特徴セットから有効でない特徴を削除することで最適な特徴セットを獲得する.これを基に,入力発話が対話行為に該当するかを判定する分類器を対話行為毎に学習する.最後に,個々の分類器の判定結果ならびに判定の信頼度から,適切な対話行為をひとつ選択する.評価実験の結果,提案手法は唯一の特徴セットを用いるベースラインと比べてF値が有意に向上したことを確認した.

  • 五島 圭一, 高橋 大志
    2017 年 24 巻 4 号 p. 547-577
    発行日: 2017/09/15
    公開日: 2017/12/15
    ジャーナル フリー

    本研究では,金融分野に特化した極性辞書の作成を目的とし,ニュースデータと株式価格データから極性辞書の作成を行う.株式価格情報から単語のポジティブ/ネガティブの情報を獲得するため,ニュース記事が言及している銘柄の株式価格変動を算出する.株式価格変動をニュース記事の教師情報として,教師あり学習を行ったのち,学習器から単語の極性情報を抽出することで,単語に対して重み付き極性値の付与を試みた.そして,作成した極性辞書を用いて,学習に用いたメディアのニュース記事分類と他メディアのニュース記事分類を行うことにより,本研究手法の有効性を検証した.検証の結果,ニュース記事配信日の株式リターンに関して,将来のニュース記事を分類できること,また,異なるメディアのニュース記事も分類できることを示した.一方で,ニュース記事配信日から 2 営業日以上離れると,ニュース記事分類が困難であることが示された.

  • Kanako Komiya, Minoru Sasaki, Hiroyuki Shinnou, Yoshiyuki Kotani
    2017 年 24 巻 4 号 p. 579-596
    発行日: 2017/09/15
    公開日: 2017/12/15
    ジャーナル フリー

    We developed a cross-lingual recommender system using collaborative filtering with English-Japanese translation pairs of product names to help non-Japanese buyers who speak English when they are visiting Japanese shopping websites. Customer purchase histories at an English shopping site and those at another Japanese shopping site were used for the experiments. Two experiments were conducted to evaluate the system. They were (1) two-fold cross validation where half of the translation pairs were masked and (2) experiments where all of the translation pairs were used. The precisions, recalls, and mean reciprocal ranks (MRRs) of the system were evaluated to assess the general performance of the recommender system in the first set of experiments. We investigated the effect formatting the translation pairs and the performance according to the type of feature value of the vectors (binary versus rating values). In contrast, the kind of items that were recommended in a more realistic scenario were shown in the second experiment. The results reveal that masked items were found more efficiently than when the bestseller recommender system was used and, further, that items only on the Japanese site that seemed to be related to the buyers’ interests could be found by the system in the more realistic scenario.

  • 今村 賢治, 隅田 英一郎
    2017 年 24 巻 4 号 p. 597-618
    発行日: 2017/09/15
    公開日: 2017/12/15
    ジャーナル フリー

    ドメイン適応は,機械翻訳を実用に使用するときの大きな課題の一つである.本稿では,複数ドメインを前提とした,統計翻訳の適応方式を提案する.本稿の方式は,カバレッジが広い(未知語が少ない)コーパス結合モデルと,素性関数の精度がよい単独ドメインモデルを併用する.これらを,機械学習のドメイン適応に用いられている素性空間拡張法の考え方で結合する.従来の機械翻訳における素性空間拡張法は,単一のモデルを用いていたが,本稿の提案方式は,複数のモデルを用いることにより,両者の利点を活かすことが特徴である.実験では,単独ドメインモデルに比べ,翻訳品質が向上または同等を保持した.提案法は,当該ドメインの訓練コーパスが小規模である場合に高い効果を持ち,100 万文規模の大規模コーパスを持つドメインへの適応に使用しても,翻訳品質を下げることなく,ドメインによっては品質向上の効果がある.基本的な対数線形モデルでも,モデルの選択と設定を適切に行うことで,最先端品質の適応方式が実現できることを示す.

  • Hao Wang, Yves Lepage
    2017 年 24 巻 4 号 p. 619-646
    発行日: 2017/09/15
    公開日: 2017/12/15
    ジャーナル フリー

    In this paper, we describe a novel method for joint word alignment and symmetrization. Based on initial parameters from simple IBM models, we synchronously parse the parallel sentence pair under the framework of bracket transduction grammar constraints. Our 2-phase method can achieve nearly the same run-time as fast_align while delivering better alignments on distantly-related language pairs such as English–Japanese. We show how to integrate this method into a standard phrase-based SMT pipeline. Although the alignment quality results are mixed, by forcing all words to be aligned (1-to-many/many-to-1), our method significantly reduces the phrase table size with no difference in translation quality and even outperforms fast_align in some end-to-end translation experiments.

feedback
Top