自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
26 巻, 4 号
選択された号の論文の4件中1~4を表示しています
巻頭言
一般論文
  • 加藤 明彦, 進藤 裕之, 松本 裕治
    2019 年 26 巻 4 号 p. 663-688
    発行日: 2019/12/15
    公開日: 2020/03/15
    ジャーナル フリー

    複単語表現 (MWE) は統語的または意味的な非構成性を有する複数の単語からなるまとまりである.統語的な依存構造の情報を利用し,かつ意味理解が必要なタスクでは,単語ベースの依存構造よりも MWE を考慮した依存構造,即ち MWE を統語的な単位とする依存構造の方が好ましい.広範囲の連続MWEを依存構造で考慮するために,本稿では Ontonotes コーパスに対して新たに形容詞 MWE を注釈し,複合機能語と形容詞 MWE の双方を考慮した依存構造コーパスを構築した.また,意味理解が必要なタスクでは句動詞などの非連続な出現を持ちうる MWE(動詞 MWE)の認識も重要である.依存構造の情報は動詞 MWE 認識で有効な特徴量として働くと期待されるため,本稿では連続 MWE を考慮した依存構造と動詞 MWE の双方を予測する問題に取り組む.前者については以下の 3 つのモデルを検討する: (a) 連続MWE認識と,MWE を考慮した依存構造解析のパイプライン,(b) 連続MWEの範囲を依存関係ラベルとして符号化した head-initial な依存構造を解析するモデル,および (c) 連続MWE認識と上記 (b) の階層的マルチタスク学習モデルである.実験の結果,連続MWE認識ではパイプラインモデルとマルチタスクモデルがほぼ同等の F 値を示し,head-initial な依存構造の解析器を 1.7 ポイント上回った.動詞MWE認識では系列ラベリングベースの認識器を上述のマルチタスクモデルに組み込むことで F 値が 1.3 ポイント向上した.

  • 芦原 和樹, 梶原 智之, 荒瀬 由紀, 内田 諭
    2019 年 26 巻 4 号 p. 689-710
    発行日: 2019/12/15
    公開日: 2020/03/15
    ジャーナル フリー

    近年,多くの自然言語処理タスクにおいて単語分散表現が利用されている.しかし,各単語に 1 つの分散表現を生成するアプローチでは,多義語における各語義が一つの分散表現に集約されてしまい,それらを区別することができない.そのため,先行研究では品詞やトピックごとに異なる分散表現を生成するが,語義を区別するには粒度が粗いという課題がある.そこで,本研究では各単語に対してより粒度の細かい複数の分散表現を生成するための 2 つの手法を提案する.1 つ目は,依存関係にある単語を手がかりとして,予め複数の分散表現を生成しておく手法である.2 つ目は,文脈中の全ての単語を考慮して語義に対応する分散表現を動的に生成する双方向言語モデルを利用する手法である.単語間の意味的類似度推定タスクおよび語彙的換言タスクにおける評価実験の結果,より細かい粒度で分散表現を生成する提案手法が先行研究よりも高い性能を発揮することを示した.

  • 竹林 佑斗, Chenhui Chu, 荒瀬 由紀, 永田 昌明
    2019 年 26 巻 4 号 p. 711-731
    発行日: 2019/12/15
    公開日: 2020/03/15
    ジャーナル フリー

    ニューラル機械翻訳は従来手法の句に基づく統計的機械翻訳に比べて,文法的に流暢な翻訳を出力できる.しかし訳抜けや過剰翻訳などの問題が指摘されており,翻訳精度に改善の余地がある. このような問題に対して従来の句に基づく統計的機械翻訳では,対訳辞書を用いてデコーダ制約を実装することにより翻訳精度を改善していたが,ニューラル機械翻訳では対訳辞書を有効活用するアプローチが明らかではない.本稿では対訳辞書を単語報酬モデルによりニューラル機械翻訳に適用する手法を提案する.提案手法は,テスト時のデコーディングの際に対訳辞書に存在する単語に報酬を与えることでそれらの出現確率を高め,翻訳精度の向上を図る.提案手法は辞書をニューラル機械翻訳モデルとは独立して適用するため,辞書の更新や変更を簡単に行える利点がある.また指定された語彙を出力するよう制約を加える方法より少ない計算量で翻訳精度を改善できる.さらにアテンションを利用して対訳辞書を活用する手法と組み合わせると性能を改善できることを実験的に示した.

feedback
Top