Webインテリジェンスとインタラクション研究会 予稿集
Online ISSN : 2758-2922
第11回研究会
選択された号の論文の24件中1~24を表示しています
セッション1:コミック・小説
  • 上野 高士, 風間 一洋
    p. 1-6
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    本稿では,コミック中の登場人物の発話タイミングに基づいて人物相関図を作成する手法を提案する.まず,コミック中の登場人物の発話タイミングベクトルから自動的に登場シーンを求め,2者の登場シーンベクトルから登場人物間の関係の強さを表す関連度と,関係の重要性を表す重要度,両者の立場の均衡性を表す均衡度と呼ぶ3つの指標を算出し,それらに基づいて人物相関ネットワークを作成する.さらに,実際のコミック画像のデータセットから書き起こしたセリフデータを用いて,シーン抽出と各指標の特性を分析すると共に,人物相関ネットワークを人物相関図として可視化して,妥当性を評価する.

  • 今野 勇気, 荒木 健治
    p. 7-12
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    現代では数多くの小説が存在し,また毎年多くの小説が発表されている.膨大な小説の中から人々が好みの小説を探す手段の一つとなる,小説の自動要約システムを提案する.文書の要約は文抽出による手法が主流であり,本提案システムでも小説中の重要文抽出によって小説の要約を試みている.また重要文の抽出を文の組み合わせ最適化間題とみなし要約を行う.本提案システムは,言語概念ベクトルを用いた意味的な類似度計算などの複数の関数を使用し,多目的最適化を行うものである言語概念ベクトル化にはword2vecとfasttextを用い,多目的最適化を多目的遺伝的アルゴリズムの一種であるNon-dominated Sorting Genetic Algorithm-II(NSGA-II)を用いてシステムを構築した.本稿では,小説要約システムの構築及び, ROUGEを用いた要約システムの性能評価を行った結果について述べる.また小説の要約を生成する際に問題となるネタバレを回避するための予備実験の結果についても述べる.

  • 森 晴菜, 山西 良典, 西原 陽子, 福本 淳一
    p. 13-16
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    読書中断後,読書を再開する際に既読内容のあらすじを提示すれば,既読内容を短時間で振り返ることができ,本来の読書時間を削減することなくスムーズに続きを読み始められる.本稿では,読書再開時に必要とされるあらすじについて調査するため,人手によるあらすじ作成実験を行った.得られたあらすじについて,あらすじ文の小説本文中での出現位置や,読書進度に応じたあらすじの変化に着目し,その特徴を分析した.また,毎回の読書量や読書時間などの読書活動状況とあらすじとの関連についても考察した.

セッション2:テキスト・データ分析
  • 廣中 詩織, 佃 洸摂, 濱崎 雅弘, 後藤 真孝
    p. 17-22
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    オリジナルコンテンツから次々と新しい派生コンテンツが制作されるN次創作活動では,複数人のクリエータがコラボレーションをしてひとつのコンテンツを制作することが盛んに行われている.本稿では,動画共有サービスに投稿された,音楽に関するN次創作動画を対象として,コラボレーションがもたらす効果について分析する.具体的には,以下の3つの観点から分析を行う:(1)コラボレーションが動画の視聴のされ方に与える影響,(2)コラボレーションがクリエータのアクティビティに与える影響,(3)コラボレーション関係に基づくクリエータの特性.分析の結果,コラボレーションによって制作された動画は再生数がより多くなること,コラボレーション動画を制作したクリエータはより長い期間N次創作活動を行うこと,コラボレーションをしたクリエータのペアの25%以上は複数回のコラボレーションをしており,コラボレーションには一定の継続性があることなどが明らかになった.

  • 砂山 渡
    p. 23-28
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    コンピュータによる知能を生かすには人間の知恵が必要であり,人間がいかにコンピュータを使いこなすかが問われる時代となって来ている.また,世の中に溢れるデータを活用する必要性が高まる中,データ分析を行える人材の育成が求められている.我々のグループでは,これまでにテキストマイニングのための統合環境TETDMを構築している.TETDMは,汎用的な分析を行うための多くのツールを備えるとともに,データ分析に不慣れな人においても,データ分析のスキルを身につけてもらうための機能として,ゲームモードとキャラクターアシストチュートリアルを提供している.本稿においては,これらの機能の説明,テキスト分析スキルとの関連,これまでの利用実績について述べるとともに,本環境の整備と普及につなげるための方策について議論したい.

  • 吉崎 辰悟, 越智 洋司
    p. 29-30
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    学生が自分の必要とする講義や参考書を探し出す手段として,シラバスを利用する方法が挙げられる.シラバスとは,大学で開講される授業や講義の大まかな内容を示したものであり,講義の目的や各時限の授業内容などが記載されている.しかし現状では,大量のシラバスデータから必要な情報を探し出す事は難しく,科目ごとの類似性や関連性を把握することは困難である.そこで,シラバスデータから関連科目を導き出し,関連科目データベースを作成することで学生が講義の内容をより深く理解するための手助けになるのではないかと考えた.本稿では,近畿大学のシラバスデータを対象に,文章ベクトルから関連科目を導出する手法について述べる.

招待講演
セッション3:言語・テキスト処理
  • 太田 博三
    p. 35-40
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    深層学習の持続的な発展により,自然言語処理における知識獲得は大きく進歩している特に文生成においては画像からその文生成を行うなど著しく発展している.本稿ではウェブサイトのテキスト文の自動生成を従来の自然言語処理の手法を交えながら変分オート・エンコーダー(VAE)にいたるまでの手法による生成文を比較考察した第1の課題は文と文のつながりの不自然さの解消である.第2の課題は生成された文章が剽窃や盗作の回避のため,独自性とはなにか,またその区分を社会科学的に考察し,一つの試みとして提案するものである.

  • 澤崎 夏希, 遠藤 聡志, 當間 愛晃, 山田 孝治, 赤嶺 有平
    p. 41-46
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    機械学習アルゴリズムが特徴量そのものを学習することで様々な領域での問題解決にブレークスルーが起こっている.テキスト分類の問題領域でも,多くの場合.高い分類精度を達成している.しかし成功例の多くは各正解ラベルのデータ量が均一あるいはそれに近い状態であることが多い.このため.すべての正解ラベルデータを十分量用意するためのコストが機械学習アプローチのボトルネックとなっている.また.ラベル毎のデータ量が不揃いな場合は不均衡データと呼ばれうまく分類できないことが知られている.本研究では,自然言語の不均衡データに対するかさ増し手法を提案する.提案手法を用いた,不均衡データ分類問題の計算実験を行い.分類精度の検証によってその有用性を評価する.

  • 島田 理紗子, 小邦 将輝, 平手 勇宇, 関 洋平
    p. 47-50
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    本研究では,重複する料理レシピを判別するために構築したコーパスについて紹介する.重複レシピとは,レシピを構成する要素の一部またはすべてが他のレシピと一致しているレシピを指す.重複レシピには,重複の度合いや,料理の同一性などの組み合わせによって複数のパターンがあるため,本研究では料理の共通性や調理手順の共通性の重複の度合いによってレシピを7段階に分類し,コーパスを構築した.さらに,構築したコーパスのレシピのうち,一部が重複しているレシピの変更部分に対して,レシピ用語の種類をタグ付けした.その結果,重複の度合いによって,変更されるレシピ用語の種類の傾向が異なることがわかった.

セッション4:ニューラルネットワーク
  • 木村 和哉, 山西 良典, 西原 陽子
    p. 51-56
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    現在,様々な単語の分散表現を獲得する手法がある.fastText を始めとする単語分散表現を取得する多くの手法では文書を入力し,隠れ層と出力層からなる2 層のニューラルネットワークで学習を行い, 隠れ層における各単語の重みを抽出することで各単語の分散表現を獲得することができる.これらの手法では,学習ごと,つまり学習するコーパスごとで得られた単語ベクトルモデルの各要素に関連性はない. 本稿では, 機能語を次元とするベクトル空間へ各学習で得られた単語ベクトルを射影することで,コーパスによって異なる単語のコンテキストを検出する指標を提案する.単語のコンテキストが概ねのコーパスで変化しないと考えられる機能語と各単語との類似度を要素とするベクトルを生成する.生成したベクトルを参照して, 同一単語について異なるモデル間でのベクトル類似度を提案指標とする.提案指標の妥当性を提案指標と主観評価による単語コンテキストの差異の評価の比較によって評価した.

  • 田中 恒平, 小林 亜樹
    p. 57-60
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    深層学習の学習の枠組みの1つであるオートエンコーダが,情報推薦分野の評価値推定タスクで応用が進んでいる.嗜好データをオートエンコーダで学習させた場合,オートエンコーダからの出力である推薦値と正解値との誤差が大きくなるユーザがあり,これが全体の推定精度に悪影響を及ぼしている.そこで本研究では,学習過程において大きな誤差となるユーザデータを除外しつつ学習する方式を提案する.実データを用いた実験で,除外したユーザデータが学習に悪影響を及ぼしていることを示す.

  • 水越 友裕, 高木 友博
    p. 61-64
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    多くのコミュニティQAでは質問に対し,回答として複数の文を書き込むことができる.そのため質問に対する直接的な回答文に加えて,その質問または回答を補足するような文が多く見られるそこで本稿では質間文と回答文の両方を考慮した補足文を対象に,適切な補足文を質間文と直接的な回答文の関係性から選択するモデルを提案する.手法としてはニューラルネットワークを用いた従来の回答選択モデルを拡張し,補足文を選択するタスクに適用する.また補足文の選択モデルの学習・テストを目的に,既存のデータセットから補足文を人手で抽出し,データセットを構築した.この構築したデータセットを用いて,提案手法が有効であるかどうか評価実験を行った.

セッション5:推薦・音楽
  • 古屋 翔大, 木村 和哉, 山西 良典, 西原 陽子, 奥 健太
    p. 65-70
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    従来の歌詞検索システムは単語をクエリとして用いた楽曲検索であるため,ユーザの検索意図が充分に考慮されない問題がある.例えば,「恋」と入力したときに,恋という単語が含まれた楽曲を検索することは可能だが,恋を間接的に描写したフレーズは検索されない.本研究では,7万曲以上の歌詞コーパスを学習し,同一のベクトル空間で表現された歌詞の異なるレイヤーである「単語」「フレーズ」「楽曲」それぞれの分散表現を獲得する.この異なるレイヤー同士の類似度を用いることで,単語からフレーズ,フレーズから歌詞全体を検索できるなどのレイヤーを横断した探索的検索を実現する.ユーザ観察によって提案手法による歌詞検索の有用性を確認した.

  • 有山 俊一郎, 延原 肇
    p. 71-76
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    スポット情報推薦サービスにおいて,スポットに紐づくテキスト情報がないため推薦候補として選択されない問題を解決するために,画像-テキスト間写像を利用したスポット情報拡張手法が提案されている.この手法には,いくつか調整可能なパラメータがあるが,この手法によって拡張した情報を定量的に評価できないため,パラメータの最適化が困難であった.そこで本研究では,スポット間においてそれぞれに紐付けられた画像と単語の相似性を比較することで,スポットに付与した単語がふさわしいものであるかを,画像間距離空間と単語間距離空間を融合し,定量的に評価する指標を提案し,スポット情報拡張の最適化を実現する.また,東京,ニューヨーク周辺のスポット,それぞれ1000スポットを利用した評価実験を行い,提案する定量指標およびそれに基づくスポット情報の一拡張を示す.

  • 藤井 流華, 岡本 一志
    p. 77-80
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    モデルベース協調フィルタリングを重回帰分析により実現することを目指し,ユーザ-アイテム行列をWord2Vecにより次元圧縮し圧縮空間で回帰係数を推定する手法を提案する.協調フィルタリング用ベンチマークデータセットを用いた実験により,提案手法の予測性能と適切なWord2Vecのハイパーパラメータを明らかにする.具体的には,重回帰分析ではL1正則化またはL2正則化を適用し,圧縮次元数10通り,ウィンドウサイズ5通りの計50通りのWord2Vecのハイパーパラメータにおける予測精度を検証する.実験結果から,提案手法にはL2正則化が適しており,Word2Vecの次元数は小さく,ウィンドウサイズは大きくするほうが予測精度の向上に寄与することを確認している.これらの結果より,推薦理由の説明能力を有したモデルベース協調フィルタリングを重回帰分析により実現できる可能性を得ている.

  • 杉本 蒼, 奥 健太
    p. 81-84
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    入力された楽曲プレイリストに合ったシーケンス景観をスライドショーとして提示するシステム,playlist2scapeseqを提案する.シーケンス景観とは,ドライブ中に景観が遷り変わるといったように,視点を移動させながら連続的に遷り変わっていく景観のシーケンスである.一方で,視点を固定したときの景観をシーン景観とよぶ.我々はこれまでにシーン景観について,四つの景観要素(田園系,山林系,水辺系,都市系)で表現される景観ベクトルを定義した.本研究では,景観ベクトルで表現されるシーン景観を時系列的に連続させることでシーケンス景観を構成する.併せて,楽曲については,クラウドソーシングにより得られた楽曲-景観関係データに基づき景観ベクトル化を行う.playlist2scapeseqは,入力された楽曲プレイリスト内の各楽曲の景観ベクトルと類似するシーン景観を探索し,時系列的につなぎ合わせることでシーケンス景観を生成する.

セッション6:感情・ソーシャルメディア(1)
  • 三橋 奎太, ジェプカ ラファウ, 荒木 健治
    p. 85-90
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    五感に関する知識は人間の意味処理において重要であるが,コンピュータにとってはそれらの知識を理解することは困難である.これまでに我々が行なった研究において五感知識データベースを自動構築する手法の提案を行なったが,それらの知識の一般性について最滴な手法が確立されていなかったため,「りんごの色が赤い」と「風船の色が赤い」といった知識のように一般性のレベルに差があるような知識について,そのレベルを考慮することなく,コーパスからルールに当てはまった知識をすべてデータベースに登録していた.そこで獲得した五感に関する知識の一般性について,共起頻度と意味的特徴を用いて評価する手法の提案を行なったその結果,正解データの値をそのまま学習させる評価手法よりもRMSEの値が5~6ポイント改善され,ベースラインに対する提案手法の優位性が確認された.

  • 冨永 登夢, 土方 嘉徳
    p. 91-96
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    本研究では,Twitterユーザを対象に、人格特性の変化と他ユーザとのインタラクションの関係を明らかにした.ここで対象としている人格特性は,Five Factor Modelとして知られる開放性,誠実性,外向性,調和性,神経症傾向の5次元で構成される.我々はまず,IBMの提供するモデルを用いて,Twitterユーザのツイートから過去と現在の人格特性を推定した.次に,過去と現在の間に,Twitterユーザの人格特性がどの程度変化しているかを確認した.さらに,上述の期間において,Twitterユーザが受け取った返信,引用,そして登録に関するデータを取得し,それらと人格特性の変化量の関係を非線形重回帰分析により明らかにした.この分析から,他ユーザとのインタラクションが人格特性の変化と有意な相関関係を示すことが分かった.最後に,これらの結果を踏まえた考察と今後の展望について述べた.

  • 大田 樹, 奥 健太
    p. 97-100
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    感情を入力とした感情アウェア観光スポット推薦システムの実現を目指している.このような推薦を実現するためには,あらかじめスポットを感情コンテキストに基づき特徴化しておく必要がある.本研究では,まず位置情報を手掛かりにスポットとツイートとを対応付ける.対応付けられたツイートから感情語を抽出し,1語ごとに感情モデルに落とし込む.ここで感情モデルとしてラッセルの円環モデルがある.ラッセルの円環モデルは快-不快と活動性の2軸に基づき感情を分類したものである.このモデルをベースとした特徴空間に感情語を配置する.特徴空間上の感情語の分布に基づきスポットの感情コンテキスト特徴化を行う.

  • 森田 紗椰, 熊野 雅仁, 木村 昌弘
    p. 101-102
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    近年,非一様ポアソン過程に基づいて,科学論文の引用イベントやオンラインアイテムの共有イベントの到着過程を分析する研究が注目されている.そこでは,アイテムが新たなアテンションを獲得する能力に対して,時間減衰効果とrich-get-richer現象のような強化効果の分析が主要な課題となっている.本研究では、そのような研究を拡張し,Foursquareデータを用いて観光地へのアテンションの到着過程を分析することを考える.そして,観光地アクティビティの時間減衰効果および強化効果の性質を明らかにするとともに,それらを観光地の人気度,カテゴリおよび地理的位置の観点から総合的に分析し,観光マーケティングへの応用を模索する.

セッション7:感情・ソーシャルメディア(2)
  • 松谷 貫司, 熊野 雅仁, 木村 昌弘, 斉藤 和巳, 大原 剛三, 元田 浩
    p. 103-108
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    ソーシャルメディアサイトに投稿されたアイデアやニュース,オピニオンなどのオンラインアイテムは,多くの人々に高く評価され共有されていくことによって,そのポピュラリティを獲得していく.このような現象は,人々の日常生活や社会のトレンドにも大きな影響を及ぼす場合があることから,オンラインアイテムのアテンションダイナミクスのモデル化が注目されている.本論文では,対象とするオンラインアイテム群全体の協調構造を抽出することを目的として,ディリクレ過程とHawkes過程を融合した新たな確率過程モデルであるCHPモデルを提案する.人工データおよび料理レシピ共有サイトの実データを用いた実験により, CHPモデルが将来ポピュラリティの予測において有効であることを示す.さらに,CHPモデルに基づいて共有イベント時系列の発生過程の観点から,料理レシピ共有サイトにおける料理レシピ群の協調構造を明らかにする.

  • 藤原 稜, 熊野 雅仁, 木村 昌弘
    p. 109-110
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    NMFは,ソーシャルメディアにおけるユーザの行動分析に有効な手法であることが示されている.我々は,アイテムレビューサイトを対象として,2種類の潜在空間に基づき評点情報と感謝ポイントという属性情報をNMFに融合することにより,ユーザ間の信頼リンクを予測する手法を提案した.そして,そのような属性情報を融合したNMFは,通常のNMFよりもユーザ間の信頼リンクの予測精度が高いことを実証した.本研究では,その研究を拡張して,2種類の潜在空間に基づき属性情報を融合したNMFにより,オンラインアイテムのユーザによる共有イベントを予測する手法を提案し,コスメ・美容の総合サイトと料理レシピ共有サイトの実データを用いた実験でその有効性を評価する.

  • 島 仁誠, 吉田 光男, 梅村 恭司
    p. 111-114
    発行日: 2017年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    ソーシャルメディアにおいて,ユーザのことを知るためにアカウント名,自己紹介文,ロケーション名などを見る.ユーザの生活環境が変化すると,これらのプロフィールも変更される可能性がある.本稿では,Twitterでのプロフィールの変更に着目し,プロフィールの変更時期とその理由について分析した.その結果,日本語ではプロフィールの変更時期のピークが4月1日にあるという結果が得られたが,英語では1年をとおして変更時期のピークは観測されなかった.英語ではプロフィールを変更するときに,誕生日に関係するキーワード(BIRTHDAY, birthday, BDAY)がアカウント名に挿入される傾向があり,日本語ではプロフィールを変更するときに,Twitterでの活動を控えるときは「低浮上」,他のユーザに何かをアピールしたいときは「固定ツイ」のキーワードをアカウント名に挿入される傾向があることが分かった.

feedback
Top