深層学習による日本語キャプション生成システムの開発

小林 豊; 鈴木 諒; 谷津 元樹; 原田 実

doi:10.11517/jsaisigtwo.2017.AM-17_04

抄録

周辺状況を視覚的に理解した上で対話する対話システムの開発を目的として，深層学習を用いた日本語キャプション生成システムDeep Watcherおよび，人物中心のキャプション付き画像データセットを作成した．キャプションの生成にはCNNとLSTMを用いたShow and Tellモデルを使用した．またキャプション内容と5つの特徴項目について人手による一致率の評価を行った．結果，生成されたキャプションの内容の一致率は41%，特徴項目は性別が最も高く87%であった．キャプション内容の一致率は過学習により高くない結果となったが，性別の特徴項目については対話システムへの応用の可能性を示すことができた．

著者関連情報

お気に入り & アラート

閲覧履歴

発行機関からのお知らせ

第二種研究会の全記事は認証なしでアクセス可能です．また，各記事の著作権は原則として著者に帰属します．

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）