本研究では,マルチタスク転移学習を用いた意図理解方式を提案する.本方式は,意図理解とは性質が異なる複数のドメインのデータを利用し,意図理解の正解率 を高めるものである.転移学習の元ドメインとして日英翻訳データ(日英翻訳タスク)および日本語Wikipedia(文予測タスク)を,目標ドメインとして各発話文 に一つの意図ラベルが付与されている機器操作データ(意図理解タスク)を用いた.その結果,各意図ラベルに対する学習データ数が1, 3, 5と少ないとき,複数 のドメインのデータを利用しない,従来の転移学習の方式の意図理解正解率を,提案方式が上回ることが分かった.
昨今,自然言語処理における対話システムや対話生成が注目されている.チャットボットのコールセンターへの普及により,正確な人間性な対話応答が求められ ている.一方,社会学のエスノメソドロジーや談話分析・会話分析における定性的な相互行為は有益である.そこで,もう一度,国立国語研究所の提供する日本 語学習者会話データコーパスを用いて,効果を検証し対話破綻の傾向や対話生成に適用することを目指した考察である.
本発表では,グループでの観光計画を想定し,合議せずに訪問スポットを決定する手法を提案する.グループ観光では興味が互いに異なるため,皆が満足する計 画を合議で決定することは時間がかかる.また, 討論が苦手な人の意見が反映されにくいという問題点がある.提案手法では各自が興味や条件を入力した後,一 人ずつ順番に推薦スポットリストの評価をする.この時,心理学分野で提唱されている MBTI 分類法を利用したアンケートに基づき,評価する順番を決定する. ユーザ実験により有効性について考察する.
データ分析によって構築する予測モデルを実務上で使う場合には、精度だけでなく頑健性と説明性も求められる.そのためには分析データは定義が明らかで充足 率も高く予測対象との関連も明瞭でなければならない.しかし実際のデータは分散されて存在することが多く,データも多様で適切なデータが見つからない場合 が多い.分散されたデータの定義を確認しながら分析用のデータを統合することは前処理といって全工程の7割を占めるといわれている.一方最近の主要なデータ 分析言語のRやPythonは数理モデル構築には適しているが,煩雑な前処理を行うには記述が難しすぎる.本論ではコマンドモードとビジュアルな環境を提供した実用的なデータ分析ツールPadocを提案する.提案ツールは前処理ではPythonに比べて記述が容易であることを示し,ビジュアルな環境は仮説検証や知識発見についても十分な性能を提供している事を示す.