自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
26 巻, 3 号
選択された号の論文の5件中1~5を表示しています
巻頭言
応用システム論文
  • 徳久 雅人, 木村 周平
    2019 年 26 巻 3 号 p. 545-578
    発行日: 2019/09/15
    公開日: 2019/12/15
    ジャーナル フリー

    本稿では,様々なサービスを有する小型計算機に言葉による命令を受理させる手法について述べる.小型計算機における発話文解析では,サービスのための規定の発話文を必ず受理すること,および,ユーザからの発話文を追加的に学習することを低い計算コストで行うことが要求される.そこで,サービスごとに語義やチャンクを正確に区別するため,サービスごとにパージング結果を格納するアレイを設け,強化学習を用いて発話文解析を進める手法を提案する.実験において自動車旅行を支援する車載器の発話文解析に応用したところ,軽量に動作し,クローズドテストにおいて 0.99, オープンテストにおいて 0.81 という精度で発話文解析が可能であることを確認した.

一般論文
  • 赤間 怜奈, 徳久 良子, 乾 健太郎
    2019 年 26 巻 3 号 p. 579-612
    発行日: 2019/09/15
    公開日: 2019/12/15
    ジャーナル フリー

    我々は,高齢者の Quality of Life (QOL) を家族に伝えることで,高齢者と離れて住む家族とのコミュニケーションを活性化することを目指している.高齢者の QOL 表出発話(高齢者の QOL を推定するのに有用な手がかりを含んだ発話)の生成を補助するシステム構築に向けて,本論文では (1) QOL ラベルつき対話コーパスを構築するための方法論を提案し,(2) QOL ラベルを用いた特定の QOL 情報を伝達する応答の生成について議論する.具体的には,模擬的なワーカを用いることの妥当性を予備実験により示した上で,クラウドソーシングを効果的に利用して高齢者が主体となる高齢者の QOL 表出発話を大規模に収集し,QOL ラベルつき対話コーパスを構築した.構築したコーパスを用いた応答生成実験により,「着くとすぐに本を読んでいるよ」のような家族の発話に対する高齢者の応答候補として,高齢者の QOL が《健康満足感 (positive)》の場合は「今度本を読んであげよう」,《健康満足感 (negative) 》の場合は「私は新聞を読むのも億劫だよ」など,QOL 情報の伝達に役立つ応答が生成されることを確認した.

  • 嶋中 宏希, 梶原 智之, 小町 守
    2019 年 26 巻 3 号 p. 613-634
    発行日: 2019/09/15
    公開日: 2019/12/15
    ジャーナル フリー

    本稿では,参照文を用いた文単位での機械翻訳自動評価手法について述べる.現在のデファクトスタンダードである BLEU をはじめとして,多くの従来手法は文字や単語の N-gram に基づく素性に頼っており,文単位での評価にとっては限定的な情報しか扱えていない.そこで本研究では,文全体の大域的な情報を考慮するために,事前学習された文の分散表現を用いる機械翻訳自動評価手法を提案する.提案手法では,大規模コーパスによって事前学習された文の符号化器を用いて,翻訳文と参照文の分散表現を得る.そして,翻訳文と参照文の分散表現を入力とする回帰モデルによって,人手でラベル付けされた翻訳品質を推定する.WMT-2017 Metrics Shared Task における翻訳品質のラベル付きデータセットを用いた実験の結果,我々の提案手法は文単位の全ての to-English 言語対において最高性能を達成した.

  • 浅原 正幸
    2019 年 26 巻 3 号 p. 635-652
    発行日: 2019/09/15
    公開日: 2019/12/15
    ジャーナル フリー

    ヒトの文処理のモデル化として Hale によりサプライザルが提案されている.サプライザルは文処理の負荷に対する情報量基準に基づいた指標で,当該単語の文脈中の負の対数確率が文処理の困難さをモデル化するとしている.日本語において眼球運動測定を用いて文処理の負荷をモデル化する際に,統語における基本単位である文節単位の読み時間を集計する.一方,単語の文脈中の生起確率は形態素や単語といった単位で評価し,この齟齬が直接的なサプライザルのモデル化を難しくしていた.本論文では,この問題を解決するために単語埋め込みを用いる.skip-gram の単語埋め込みの加法構成性に基づき,文節構成語のベクトルから文節のベクトルを構成し,隣接文節間のベクトルのコサイン類似度を用いて,文脈中の隣接尤度をモデル化できることを確認した.さらに,skip-gram の単語埋め込みに基づいて構成した文節のベクトルのノルムが,日本語の読み時間のモデル化に寄与することを発見した.

feedback
Top