Webインテリジェンスとインタラクション研究会 予稿集
Online ISSN : 2758-2922
第16回研究会
選択された号の論文の25件中1~25を表示しています
セッション1:地理情報
  • 福島 秀敏, 荒木 徹也, 石川 博
    p. 1-6
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    自動車をめぐる問題の一つに運転の難しさがある.道路を運転する難しさを定量的に表すことができれば,交通事故の分析や,運転経路の探索など様々な研究に役立てることができる.運転は,認知,判断,操作の連続によって行われており,事故の要因としては,認知の失敗が最も多く挙げられている.そこで本研究では人間の認知に着目した運転難易度の評価手法を提案する.また,それを用いた特定地域の運転の難しさの可視化を行う.具体的には,Google Street ViewとOpenStreetMapを組み合わせて運転画像を収集し,顕著性マップを適用する.運転者の視界は中央に偏るため,適用範囲をトリミングにより変更して実験を行なった.結果,トリミングを用いた場合,計算結果とアンケート結果の間に-0.6160の相関値が得られた.可視化結果からは,見晴らしの良い道路は運転が容易であるという考察が得られた.

  • 劉 瀚聡, 荒木 徹也, 遠藤 雅樹, 石川 博
    p. 7-10
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    SNSへの投稿の中には,投稿者が実際に行った地域の写真や感想など,有益な情報が存在する.しかし,SNSには膨大な量の投稿がある.そのため,SNSを利用した自分好みの観光地の発見や類似性のある観光地同士の比較などが難しい.SNSを観光への分析に生かすには,観光に関する適切な情報を統合することが必要である.本研究ではSNS上の写真や投稿に添付されているタグ,位置情報などの情報を利用し,観光地ごとに特徴量を抽出する.また,それらを利用し,地域間の類似度を分析する.具体的には,Word2Vecを使用して地域ごとにタグの特徴量を抽出し,特徴量ベクトルを生成する.それにより,地域間の類似度の比較をすることができる.また,VGG16を使用して投稿写真を処理し,類似度の高い観光地を発見する手法を提案する.

  • 夏 思浩, 井嶋 蒼, 横山 昌平
    p. 11-14
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    LBSN(Location Based Social Network)の発展により,情報量が急激に増加し,ユーザが自らPOI(Point of Interest)をフィルタイングすることが困難である.そこで,ユーザーに適した場所を判別して提示するルート推薦が求められる.本論文では大規模Flickrデータを用い,ユーザが指定した出発地と目的地より,ある範囲内のユーザのルート情報を抽出し,ルート行列と有向グラフを生成し,ワーシャル-フロイド法を使い,ユーザが与えた二点間に存在する適した寄り道ルート順位5位を発見する.そして,発見した寄り道スポットをGoogle Places APIでVenueを取得し,その中から美食ルートと買い物ルートを推薦する.

  • 塩崎 イサム, 奥 健太
    p. 15-18
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    地図ベースのインタフェースを採用した観光情報推薦システムは多いが,地図上に過度に情報を提示することにより,散策時の発見性を損なう問題もある.本研究では,散策時の発見性を促すために,ユーザの訪問経験に応じてマップを隠蔽/解放する動的散策マップシステムを提案する.本システムでは,初期状態はマップのすべての領域を隠蔽しておき,その後,ユーザの訪問経験に応じて,隠蔽されていた領域を解放していく.このような要素により,散策に対する娯楽性の向上とともに,散策時の発見性の向上が期待できる.

セッション2:分散表現
  • Shirafuji Daiki, Rzepka Rafal, Araki Kenji
    p. 19-24
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    Many datasets with large number of arguments are used in the field of argument mining. To make a concise summary (key point) from a set of arguments in such datasets, two basic tasks are necessary: match scoring, a step to cluster arguments into similar groups; and key point generation. The previous studies focus on clustering arguments to key points for the first step. However, those studies utilize manually created key points which is time-consuming and costly. To address this problem, we experiment with the classical summarization baselines. We also propose an unsupervised approach for summarizing arguments. In our previous work, we show the Sentence-BERT-large model is most accurate for arguments without labelled data. Therefore, we summarize arguments in our created data with our proposed method. We apply a key phrase extraction method, i.e. EmbedRank, to key point generation using Sentence-BERT. Experimental results show the usefulness of Sentence-BERT for summarizing arguments.

  • 石田 哲也, 関 洋平
    p. 25-30
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    行政の政策や接客業のサービスの質を向上させるためには,都市で暮らす市民によるフィードバックが重要となる.本研究では,ソーシャルメディアのつぶやきに現れる多様な市民意見を整理して抽出する手法を提案する.この際,アプレイザル理論を用いた言語学的なアプローチによって意見のタイプをつぶやきに付与することで,対象に着目した市民意見の抽出が可能となる.提案手法では,BERTモデルをファインチューニングすることで意見タイプ,地域依存性,極性といった複数の属性をつぶやきに付与し,これらの属性を利用して市民意見を抽出する.実験では,5名の実験参加者によって作成されたデータセットを用いており,各属性がBERTモデルのファインチューニングによって高い精度で推定できることを確認した.さらに,推定した属性を利用して時系列ごとの市民意見の出現頻度を分析することで,市民意見と社会情勢や自治体の対応との強い相関が確認できた.

  • Shirafuji Daiki, Rzepka Rafal, Araki Kenji
    p. 31-36
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    There might be hundreds of arguments for a single debate topic. and it is usually difficult to read them all. Therefore, some of the existing studies have attempted to summarize and aggregate these arguments manually into about 14 types of content (key point) in order to make them easier to understand. Some researchers pair key points with arguments and use BERT to identify whether an argument and a key point are matching or not. However, the previous study averaged word vectors to compute sentence vectors, which resulted in the unbalance of important word information. This means that the important words should be weighted more than other words, but the previous study does not consider about that. To solve this problem, we implemented a sentence embedding model called Sentence-BERT, which is fine-tuned on NLI dataset with BERT. The results are better than the existing SOTA method, i.e. BERT. Furthermore, to compare each words between two sentences, we introduce MoverScore, which yield the best results.

招待パネル
セッション3:テキスト処理
  • 安武 凌, 野中 健一, 岩井 将行
    p. 38-41
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    電子書籍の利用者は増加傾向であるが,読書離れが上昇傾向となっている.電子図書館と呼ばれる青空文庫は,年間アクセス数が1000万件弱,作品数は1万4000件以上あるにも関わらず,作品ページに作品の内容に関する記載が一切ない.そのため,利用者はどのようなジャンルなのか,どのような内容なのかを読むまで把握できず,読書離れを促進してしまうといった問題がある.そこで我々は,小説文章を基にした自動要約システムを開発することで,自動要約された文章を利用者が読み,作品に対する興味を抱かせ,読書離れを抑えることを目的とする.事前調査として代表文抽出手法が小説作品の自動要約として有用であるかを調査し,その考察と今後の展望について述べる.

  • 蔦ヶ谷 文月, 土田 正士, 石川 博
    p. 42-45
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    本稿では,コールセンタの応対履歴や'yahoo知恵袋のやりとりなどから,問い合わせとその回答になる文の適切な結び付けを行う手法の考察を述べる.上記のような人間同士のやりとりには記述の際の決まった型やタグのような規則がないため,それらを使った機械的な文の関連付けができない.また関連付けた文同士が適切なQAか判断する指標が一般化されておらず,人の目が必要となってしまっている.そこでTF-IDFの考え方を用いて各単語がどれくらいその文を特徴付けているかをスコア化した上で,共通単語をもつ文同士をQA候補とした.さらにその候補から最適なものを選択するための指標として,共通単語のスコアから算出したQAスコアを用いて比較を行った.問い合わせ内容と回答が事前に結び付けられていることによって,類似内容の過去事例を参照して回答を探す際の手間を省くことができると考えられる.

  • 茂島 祐太, 當間 愛晃
    p. 46-49
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    人には心と呼ばれるものがある.本研究では心についての理解を深めるために,心を情動と意識の二つに分け,さらに段階的な理解のために情動のうち,感情を生成するプロセスを観察することを目的とする.そのため,現在感情の生成において提唱されている,末梢起源説および中枢起源説の二つについてモデル構築を行い,表現可能数を比較することにより計算機を用いた感情生成の表現により適した説を検討した結果としてわずかに末梢起源説の方が表現可能数が多かった.しかしながら,より表現可能数を増やすべくデータセットのバリエーションの向上や,モデルの複雑化を目指す.

セッション4:機械学習と推薦システム
  • 松嶋 理香子, 土方 嘉徳, Berkovsky Shlomo
    p. 50-55
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    推薦システム(RS)は幅広く活用されているが,多くのユーザは他のユーザのロコミも参考にしており,特に実世界の友人や専門家からのロコミは,より強い影馨力を持つと言われる.本稿では,推薦結果の提示において,推薦者を提示することがユーザのアイテム受容に影響を与えるか否かを調査した.また,推薦者として実世界で親しい「友人」と,専門家の「映画コメンテーター」,より人間らしいRSである「映画ロボット」,既存のRSと同じ「推薦者なし」の間でアイテム受容への影響に差があるかを調べた.被験者実験の結果,推薦者の有無は受容に影響しないが,推薦者の種類によって受容に差があり,特に「友人」はより強い影警を持つとわかった.

  • 梛木 佑真, 岡本 一志
    p. 56-59
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    本研究では,セッションデータに対してItem2Vecによるアイテム分散表現を導入した推薦システムを提案する.さらに,セッションデータに特化したユーザ分散表現(リアルタイムユーザ表現)を推薦時に導入することで,推薦の精度の向上を目指す.リアルタイムユーザ表現は推薦のタイミングに応じて,単純な計算でリアルタイムに構築されるという特徴を持っており,ユーザ嗜好のリアルタイムな追跡を試みている.推薦アイテムの探索時にはリアルタイムユーザ表現に加え,他のユーザ分散表現も考慮している.実験結果として,提案手法のRecall@k・MRR@kはItem2Vecよりも高く,FPMCのMRR@kと同等のスコアになることを確認している.またFPMCと比較して,提案手法はモデル訓練が短時間で可能なことを確認している.

  • 佐藤 匠, 當間 愛晃
    p. 60-63
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    近年提案されている機械学習を用いた推薦モデルは解釈が難しいブラックボックスとなっているものが多く,学習済みモデルの状態から推薦理由を解釈することは困難である.先行研究として機械学習モデルの予測結果を解釈するアルゴリズムであるLIMEを推薦システムに適用し,解釈結果から推薦理由の説明をユーザに提示する手法が提案されている.LIMEは近似により単純な線形回帰を作成することで重要な特徴量を推論する.この際に単純な線形回帰を使うために起きうる望ましくない近似の結果により誤った重要度を得る場合はないだろうか.LIMEの推薦モデルヘの適用による特徴量の重要度の算出を行い,LIMEの線形回帰の決定係数を用いて,推薦結果の考察をする.

  • 石原 正敏, 荒木 徹也, 石川 博
    p. 64-67
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    本稿では超解像とガウシアンノイズ除去の二つの観点からデータ高品質化を行う.近年,火星地表画像の超解像やヒートマップの高品質化など,様々なデータの高品質化が求められる.提案手法の汎用性の評価の為,DIV2K画像データセットを利用する.画像データセットから,128X128X3のカラーの部分画像をランダムに切り出したものを学習に使用する.過剰適合を防ぎつつ精度を向上させる為,入出力に直通の迂回路を設置することで過剰適応と精度の両立を行う.解像度の向上とノイズ除去では適切な手法が異なる為,其々の手法を組み合わせることで両立する.この様な工夫により,様々なケースに柔軟に対応した2次元データ高品質化が可能となる.

セッション5:SNS
  • 中田 朋寛, 三浦 拓也, 宮坂 和希, 荒木 徹也, 遠藤 雅樹, 土田 正士, 山根 康男, 平手 守浩, 眞浦 雅夫, 石川 博
    p. 68-73
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    SNSでは,日々多くのユーザによって実世界での出来事が大量に投稿されている.そのため,実世界で起きているイベントやトレンドなどの影響により,しばしば平常時の投稿数と比べ,大きく増加するバーストと呼ばれる現象が観測される.SNS内のトレンドは一般に公開されているが,トレンドの地域性やトレンドの場所(トレンドスポット)を知ることは難しい.そこで本研究では,SNSの一つであるTwitterを用いて地域のトレンドワードとトレンドスポットを検出する手法の提案を行う.具体的には以下の4段階の検出を行う.(1)トレンドワード候補検出(2)トレンドワード検出(3)トレンドスポット候補検出(4)トレンドスポット検出名古屋市のTwitterデータを用いてトレンドスポットの検出を行い,提案手法の有効性を検証した.本研究により,SNSのトレンドをナビゲーションなどのサービスへの応用の可能性を示した.

  • 宮坂 和希, 中田 朋寛, 三浦 拓也, 荒木 徹也, 土田 正士, 山根 康男, 平手 守浩, 眞浦 雅夫, 石川 博
    p. 74-79
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    株価やオリンピックなど不特定多数が関わるイベントに対する世論の反応を予測するとき,SNSの分析を活用することがある.SNSで分析することで比較的低コストにイベントに対する反応を把握できる.しかし,オリンピックなど1日以上続くイベントに対する分析は存在するが,1日未満の短期間イベントに対する分析は現状ほとんど存在しない.短期間イベントにも,2020年に東京で発生したブルーインパルスや日本中で発生した打ち上げ花火など,国民の関心が非常に高いイベントは存在する.そのため短期間イベントをSNSで分析することは有用である.そこで本研究では代表的なSNSであるツイッターを用いて,前述のブルーインパルスや花火などの短期イベントに関する投稿を感情分析することでSNS上の世論の分析を行った.本研究の結果により,短期間イベントに対して比較的低コストで世論の反応を把握することが可能になることが期待できる.

  • 中本 優希, 比嘉 彗太, 土方 嘉徳
    p. 80-85
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    近年,lnstagramは多くの人々によって利用されるようになった.lnstagramでは次々と新しい機能が追加されているが,2017年5月にアーカイブ機能が追加された.アーカイブ機能とは,一度lnstagram上に投稿及び公開した写真や動画を非公開にする機能のことである.この機能を用い,最近若者を中心に「アーカイブ投稿」という新しい投稿スタイルで写真や動画が投稿されるようになった.若者はこのアーカイブ投稿を通常投稿(タイムラインに流れるように投稿するスタイル)に織り交ぜ,lnstagramでの投稿を楽しんでいる.我々は人に見られたい投稿スタイルである通常投稿と,投稿はしたいが人目につかないように投稿したいアーカイブ投稿では投稿される内容に違いがあるのではないかと考えた.本研究では,どのような写真がアーカイブ投稿を引き起こすのかを明らかにする.ペルソナを用いた被検者実験により,人が写る写真よりも人が写らない写真の方がアーカイブ投稿を引き起こしやすく,人が多く写る写真よりもより少ない人数で写る写真の方がアーカイブ投稿を引き起こしやすいことが分かった.

セッション6:学術情報
  • 小林 和央, 風間 一洋, 吉田 光男, 大向 一輝, 佐藤 翔, 桂井 麻里衣
    p. 86-91
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    ソーシャルメディア上の反応を用いるオルトメトリクスは,既存の被引用数などの論文評価指標との相関が低く,異なる種類のユーザ評価が混在していると考えられる.本稿では,ユーザに応じた論文評価指標の実現のために,インターネット上の情報拡散や学術活動由来のバーストと,オルトメトリクスに用いられる評価指標との関連を分析する.具体的には,ソーシャルメディア上の論文言及数と論文検索サービス上の論文閲覧数に関する行動的バーストと,論文検索システムの検索語に関する意味的バーストを抽出し,バーストの有無や数,期間と各指標との関連性を分析する.実際に,2年間のソーシャルメディア上の論文言及データとCiNii Articlesの検索ログを用いて,バースト論文は各指標が高くなりやすい傾向や,言及バーストは閲覧バーストを引き起こしやすいが言及由来ではないバーストも存在すること,意味的バーストする単語の傾向の違いなどを明らかにする.

  • 嶋田 恭助, 風間 一洋, 吉田 光男, 大向 一輝, 佐藤 翔, 桂井 麻里衣
    p. 92-97
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    本稿では,プレプリントサービスが世の中に与えている影響を分析するために,arXiv論文の情報拡散者のツイートと情報収集者のリツイートやお気に入りを2部グラフでモデル化し,学術情報流通におけるキーパーソンの関係と役割を分析する.そのために,情報収集者集合の類似性から作成した情報拡散者の関連ネットワークからコミュニティ抽出し,KleinbergのHITSアルゴリズムのオーソリティ度を情報拡散者の重要度とする.まず,論文の分野から,大部分が人工知能関連であり,特に最大コミュニティは深層学習のキーパーソンを多数含むことを示す.さらに,Twitterのプロフィール言語とコミュニケーション言語から最大コミュニティは英語でも,関連コミュニティはコミュニケーション言語が異なり,プロフィール言語との不一致も多いことから,国際コミュニティと地域コミュニティを橋渡しするキーパーソンの存在を示す.

  • 豊島 秀典, 吉田 光男, 梅村 恭司
    p. 98-101
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    学術情報流通の分析では,ソーシャルネットワーク上のユーザに対して重要度を示す指標が用いられる.一方で,学術情報流通において,ネットワーク作成方法の違いによる,指標の変化やユーザアクティビティとの関係は知られていない.本研究では,論文言及への反応を用いたネットワークとフォロワを用いたネットワークによる,HITSスコアの変化を調べた.さらに,それぞれのHITSスコアと学術情報に関するユーザアクティビティの関係について調べた.それらの結果,高いHITSオーソリティ度をもつユーザのHITSスコアはネットワークの違いにより,大きく変化することが分かった.また,両ネットワークとユーザアクティビティとの関係がある程度一致していることが分かった.これらの結果は,フォロワを用いたネットワークと言及への反応を用いたネットワークのいずれにおいても,HITSスコアがある意味での重要度を表していることを示している.

  • 中村 幹太, 岡本 一志
    p. 102-105
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    本研究では,Random Walk with Restartと研究内容のコサイン類似度に基づいた,有向グラフによる研究者推薦モデルを提案する.有向グラフは科学研究費助成事業データベースから構築し,過去の共同研究関係,研究内容のコサイン類似度,およびそれらを組み合わせた3種類のエッジを定義し,それぞれをhistoryモデル,similarityモデル,combinationモデルとする.3つのモデルごとに推薦精度としてnDCG@kを比較する.実験結果として,過去の共同研究関係とコサイン類似度を組み合わせたcombinationモデルのnDCG@kが最も高くなることを確認している.また,ネットワーク構造の比較により,エッジ数の増加だけでなく次数の分布も推薦精度に影響することを確認している.

セッション7:人物情報
  • 小林 達哉, 松下 光範
    p. 106-111
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    本研究の目的は,ユーザの好みのキャラクタが登場するコミックを検索する技術の実現である.現在広く用いられているコミック検索では,作品名や著者名,ジャンル情報などコミックに付与された情報をクエリとしているが,コミックに登場するキャラクタの性格や外見といった情報は,コミックの選択に大きく影響するにも関わらず,それに基づく検索は十分に検討されていない.これを解決するための一助として,本稿ではキャラクタを表現する性格要素(e.g., 真面目,優しい)や外見要素(e.g., 金髪,長身)をクエリとして利用する検索手法を提案する.提案手法では,これらの要素を既知のキャラクタに加減算できるようにして好みのキャラクタを表現することで類似キャラクタの検索を可能にする.

  • 樋口 亮太, 山西 良典, 松下 光範
    p. 112-115
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    本稿では,ストーリに基づいたコミックの検索を目指し,ストーリの構成要素のひとつであるキャラクタの性格に着目する.ストーリは,「どのようなキャラクタ」が「どのように活躍するか」で捉えられると考えた.このうち,「どのようなキャラクタ」に相当するキャラクタの性格などを示した文章はWeb上に存在するが,その記述は作品によって多様であるため,説明文自体をクエリとしてコミックの検索に用いることはできない.一方で,「どのようなキャラクタ」であるかを作品を超えて同一の基準で端的に表すために性格タグを用いることもある.しかし,性格タグの付与には膨大なコストと性格タグに対する解釈の曖昧性が存在する.本稿では,単語分散表現を用いて表現したWeb上のキャラクタ説明文と性格タグの関連性を機械学習によりモデル化し,説明文からの性格タグを推定する.推定結果の分析から,キャラクタの説明文の記述の傾向と性格タグとの関係性を考察する.

  • 村上 晴美
    p. 116-117
    発行日: 2020年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    著者の研究室では,テキストやデータからの人物の理解に関する研究を行っている.その中で,Web上の人物の理解のために,Web人物検索における要約と可視化の研究を行っている.研究の目的は,Web上の人名検索においてユーザによる人物の選択と理解を支援するインタフェースの開発である.先行研究において2000年代の研究の進捗報告を行った.本稿では,2010年代の研究の進捗の概要をまとめる.内容は,NDC人物ディレクトリ,人間による同姓同名人物の分離,履歴書と地図の表示,Wikipedia風概要文の作成,件名の付与である.

feedback
Top