Webインテリジェンスとインタラクション研究会 予稿集
Online ISSN : 2758-2922
第3回研究会
選択された号の論文の21件中1~21を表示しています
セッション1:マイクロブログ・SNS
  • 中井戸 晃彦, 山西 良典, 福本 淳一
    p. 1-6
    発行日: 2013年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    本稿では,tweet中の情報を利用し,時間的に変化する階層的同位語の感性的結びつきを可視化する.階層的同位語とは,階層知識の中で共通の上位概念を持つ知識のことである.人はある知識について説明する場合,階層的同位語の中で対象知識に対して多くの人が共通して抱く印象が類似している知識を用いることで,対象知識の印象などの感性情報を伝える.知識についての感性情報は時間的に変化するため,印象が類似した知識を獲得するためには,静的な情報だけでなく,動的に更新される情報を参照すべきである.提案手法では,時間的に変化する情報が含まれるtweet中の情報を利用することにより,時間的に変化する階層的同位語の感性的結びつきを算出する.そして,対象知識と感性的に強く結びつく階層的に同位な知識を感性的に比較可能な知識とし,対象知識に対して感性的に比較可能な知識が時間的に変化する様を可視化する.

  • 山口 裕太郎, 山本 修平, 佐藤 哲司
    p. 7-12
    発行日: 2013年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    近年Twitterに代表されるマイクロブログの利用が定着してきている.Twitterでは,ユーザは,ツイートと呼ばれる長さが140文字に制限された記事を投稿できる.本論文では,ユーザがマイクロブログに記事を投稿する時間帯や頻度,リプライやリツイートなどの機能,ツイートの文字数といった,投稿活動を構成する要素を抽出し,投稿活動の時間的な遷移に基づいてユーザをクラスタリングする手法を提案する.ここでは,投稿活動を構成する要素のうち,投稿数の変動のパターンに着目し,変動のパターンと他の要素との関係を分析する.具体的には,投稿数の平均値からの差分に基づいた特徴量を使用してユーザをクラスタリングし,クラスタリング結果を解釈するために各クラスタの頻出する遷移パターンを抽出する.1年間にわたる日本語のツイートを対象に,遷移パターンとユーザの関係について分析を行い,提案法がユーザのクラスタリングに有効であるとの結果を得たので報告する.

  • 王 駿琪, 佐藤 栄一, 澤勢 一史, 前川 廣太郎, 延原 肇
    p. 13-14
    発行日: 2013年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    本稿では、データ圧縮手法に基づくtweetsの話題分類の枠組みおいて、種々の圧縮手法の比較検討を行い、適切な手法の模索を行うとともに、エントロピー法を用いた手法の分類性能の評価を行う。

セッション2:ユーザ分析・パーソナライゼーション
  • Md. Zia Ullah, Aono Masaki
    p. 15-20
    発行日: 2013年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    Users express their information needs in terms of queries in search engines to Lnd some relevant documents on the Internet. However, users' search queries are usually short, ambiguous and/or underspeci Led. Sometimes, users have been found to struggle formulating queries based on keywords given their limited vocabulary. To help users in formulating query, query suggestion by mining query logs plays an important role and has been attracted attention in the recent years. A query log is generally represented as a bipartite graph on a query set and a URL set. Most traditional approaches used the raw click frequency to weigh the link between a query and a URL on the click graph. In order to alleviate the spurious effects of raw click frequency, some entropy-biased model by incorporating raw click frequency with the inverse query frequency or inverse URL frequency was proposed as the weighting scheme for query representation. In this paper, we observe that popular query and URLs are very diverse in nature, and user click frequency can be considered as local property of the URL, and link structures of query and URLs from both sides of the bipartite graph can be considered as a global property on the click graph. Based on this understanding, we develop a weighting scheme to weight the link between a query and an URL in the bipartite click graph by incorporating the user click frequency, and the link structures of the query and URL from both sides with global consistency in a consistent manner. We conduct experiments on the AOL search engine query log dataset and evaluate the query suggestions by estimating the similarity between the user query and suggested query using the knowledge of the Dmoz open directory project. The results turns out that our global consistency scheme achieved better performance than the current entropy-biased model.

  • 芳野 肇洋, 尾崎 知伸
    p. 21-22
    発行日: 2013年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    近年,社会ネットワークの発展などに伴い,動的ネットワーク,すなわち時間と共に構造が変化するネットワークが容易に獲得できるようになった.本稿では,動的ネットワーク分析における一つの基準として,時間に着目した種々の最短経路に基づく中心性を提案する.加えて,これらの中心性を時系列へと展開することで多次元中心性時系列データを獲得し,その上での変化や類似性に着目して分析を行うことを提案する.

  • 深澤 佑介, 太田 順
    p. 23-24
    発行日: 2013年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    本稿では総務省が公開するオープンデータを利用したパーソナライゼーションサービスの可能性について検討する。

セッション3:情報推薦と情報検索
  • 吉田 真, 本村 陽一
    p. 25-26
    発行日: 2013年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    協調フィルタリングの特徴は,年齢や性別に関係なく嗜好が似ている人を参考にして,ユーザが最も欲するであろうアイテムを推薦できることである.しかし,嗜好が似ている人どうしで推薦しあうので,推薦できるアイテムに新規性や意外性がなくなる問題がある.人それぞれ好みは異なるが,ある一定の年齢層や性別に商品が流行するといた現象もあり,年齢や性別といったユーザの属性を推薦に応用することで推薦できるアイテムの幅が広がる.本研究ではベイジアンネットワークによるpLSA のセグメント説明モデルを構築し,映画の推薦へ応用する方法を提案する.ベイジアンネットワークを介すことで,ユーザの属性を推薦結果に反映することができ,従来では推薦できなかったアイテムを推薦することができるようになる.

  • 伊藤 寛明, 吉川 大弘, 古橋 武
    p. 27-28
    発行日: 2013年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    近年,インターネットの普及による電子商取引の増加により,推薦システムが注目されている.その中で,“精度”は推薦システムにおいて重要な指標であるが,ユーザの満足度の観点から,近年,“意外性”も必要とされている.本稿では,推薦システムの代表的な方法である協調フィルタリングにおいて,データマイニングの一手法であるアソシエーション分析に基づくアイテム推薦手法について検討する.推薦対象となるユーザとは異なる評価をしたユーザの嗜好を用いることで,推薦システムの意外性を向上させることを目的とする.また,推薦に用いるスコアのパラメータを変化させることにより,精度・意外性が調節可能であることを示し,従来手法との比較を行う.

  • 越智 洋司, 楠木 貴士
    p. 29-30
    発行日: 2013年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    大学の専門科目における授業内容の理解ために,シラバス上の参考図書等の籍は理解をする上で助力となる.本研究ではシラバスを利用した書籍(教科,参考書)データベスを構築し,授業内容の理解を支援する書籍推薦システムを提案する.シラバスに掲載されている科目間の関係から関連する書籍の探索を支援する.

セッション4:コンテキスト・トピック分析
  • 佐藤 宙, 高木 友博
    p. 31-36
    発行日: 2013年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    近年の推薦システムに関する研究では,ユーザ付帯する情報やユーザが置かれている状況,すなわちユーザコンテキストが強く注目されている.ユーザコンテキストは,商品を購入するさいなどのユーザの嗜好に大きく影響するため,システムがこれを考慮することでより質も高い推薦が可能となることが知られている.通常,ユーザコンテキストにはデータセット等によって明示的に与えられた情報を用いるが,一方で,明示的に取得可能な情報以外をユーザコンテキストとして用いる試みはあまり行われていない.本稿では,暗黙的に与えられたデータや外部情報などを用いてユーザの嗜好コンテキストの同定を行い,これを用いた推薦手法を提案する.実験結果から,提案手法がTop-N推薦において,コンテキストを用いない既存手法よりも優位であることを示せた.

  • 鈴木 篤, 小島 直己, 東 佑美, 三浦 直子, 高木 友博
    p. 37-42
    発行日: 2013年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    従来の推薦システムの手法では,現在地,時間,天気などのユーザーを取り巻く状況の考慮はされずに推薦が行われているため,状況次第では適切でない推薦が行われている可能性がある.本稿では,その問題を解決するためにユーザーの購買時の状況を考慮した推薦システムを提案する.提案手法では,購買アイテムに付加された日付や天気などの情報を用いることにより,状況に依存したユーザーの嗜好情報を獲得し,現在の状況に最適なアイテムを推薦する.スーパーマーケットにおける購買履歴を用いた比較実験の結果,従来手法に比べ,提案手法の方がより直近の購買に対する精度が高いことを確認した.

  • 重松 遥, 小林 一郎
    p. 43-48
    発行日: 2013年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    近年,大量の文書データと接する機会の増加にともない,文書要約技術の必要性が高まっている.文書要約における一般的な手法としては,冗長性などを考慮してバランスの良い重要文の組合せを求めることにより要約文を生成する手法がある.最適な文の組合せを求めるのには整数計画法などが用いられるが,整数計画法はNP困難に属し,要約対象とする文書集合が大きい場合には厳密解を求めるために膨大な計算時間を要するという問題が存在する.一方,厳密な解を追求せず実用的な時間で近似解を求める最適化手法として,進化的アルゴリズムの有効性が報告されている.そのような背景を踏まえて,本研究では,進化的アルゴリズムの中でも解の精度や計算時間の点で優れているとされている差分進化アルゴリズムを用いて組合せ最適化を行う要約文生成を行う.また,文書中には複数のトピックが含まれているという仮定の下に,文書内の潜在トピックを潜在的ディリクレ配分法を用いて抽出し,各トピックの内容を万遍なく含むような文の組合せを要約文として生成する.

  • 山下 真一郎, 本村 陽一, 櫻井 瑛一, 竹中 毅
    p. 49-50
    発行日: 2013年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    トピックモデルの一種である確率的潜在意味解析(pLSA)を用いて集団匿名化することで情報損失を少なくしつつ,パーソナルデータを利活用するための実質的個人識別を不可能にする手法を提案する.また情報損失を平均情報エントロピーを用いて定義し,属性の一般化による情報損失とpLSAによる情報損失を比較した.

セッション5:オープンデータ
  • 一瀬 詩織, 小林 一郎, 岩爪 道昭, 田中 康司
    p. 51-56
    発行日: 2013年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    近年,Web上の共有資源としてLinked Open Data(LOD)の公開が活発に行われ,Web上に大きなSemantic Webデータベースが形成されつつある.これに伴い,それらのデータベースから様々な目的に応じてデータを抽出するための手法が必要になってきている.本研究ではSemantic Webデータベースからのデータ抽出手法として,データセット内のプロパティの出現頻度やトリプルの結びつきによるリンク情報を用い,SPARQL問い合わせの取得結果をランキングする手法を提案する.提案手法の評価を行うために2つのケースのSPARQLクエリ使用目的を設定し,LODの中心的なデータセットであるDBpediaを用いてそれぞれのケースに応じたクエリ検索結果のランキングを行った.またその結果を被験者実験により従来手法と比較することで,本手法の有効性を示した.

  • 山西 良典, 福本 淳一
    p. 57-62
    発行日: 2013年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    本稿では,Wikipediaの構造特徴および表記特徴を利用した別称コーパス生成ツールを開発した.正式名称の他に別称を持つ知識は多く,特にWeb上では別称での記述が多い.提案ツールは,正式名称と「略称」「愛称」「通称」それぞれが対応づいたコーパスを,Wikipediaの構造と表記特徴を利用して生成する.ダイナミックに編集・更新され,固有名詞に関する記事が多く存在するWikipediaを情報源とすることで,日々増加する固有名詞についても対応したコーパスの自動生成が可能となる.評価実験の結果,生成された各コーパスは自動抽出されたコーパスとしては非常に高い精度で別称が収集されていることを確認した.正式名称と別称が対応付いたコーパスを生成することで,Web上で別称を用いて記述された意見・評判の取得が可能となるだけでなく,正式名称からの別称推定研究における学習データとしての応用も期待される.

  • 張 丘平, 前川 廣太郎, 延原 肇
    p. 63-64
    発行日: 2013年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    2008年に提案された分散型電子決済システムBitcoin は,2013年現在,その換金価格が上昇しており,注目を集めている.Bitcoinの持つ,独特の設計思想に関して,政治,経済,金融,法律などの方面から議論がなされており,特に注目を集めているのが,本質的な価値をもたない貨幣が引き起こしやすい投機的バブル問題である.本研究は,分散型電子貨幣Bitcoinの公開型取引履歴Blockchainに対する統計的解析を行い,独自の解析データベースを構築することで,Bitcoinの支払先を代表する各アドレスの残高の歴史推移を視覚化する.また,実世界の換金市場の価格変動と比較することで,Bitcoinの投機的バブル問題の原因が,Bitcoinのユーザーの急増であることを明らかにする.

招待講演:「Webとジャーナリズム」
  • 赤倉 優蔵
    p. 65
    発行日: 2013年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    オープンデータやソーシャルメディアの普及に伴い、「データからニュースを発見し、読者に伝える手段」であるデータジャーナリズムは世界中の報道機関にとって不可欠なものとなった。後発の日本でも、7月の参院選報道で複数の大手メディアが取り組むなど広がりを見せる。データジャーナリズムの最大の特徴は「ジャーナリストだけでは取り組めない」ことだろう。既存の報道手法と異なり、データ分析やデータ・ビジュアライゼーションを要するデータジャーナリズムの現場では、ジャーナリストのほか、デザイナー、アナリスト、そしてエンジニアが活躍する。D3.jsを開発したマイク・ボストック氏もその一人。ニューヨークタイムズのエンジニアだ。そして、異業種によるコラボレーションは創造性を加速させ、ニュースにイノベーションを起こしはじめた。本講義では、世界中の報道機関が取り組むデータジャーナリズムの現場でいま何が起きているのかを探る。

  • 立薗 理彦
    p. 66
    発行日: 2013年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    データ・ジャーナリズムという言葉が、海外のメディアを中心に注目を集めています。データ・ジャーナリズムは、データの集まりを分析して注目すべきストーリーを発見し、インタラクティブなグラフなどを使って表現を行う手法で、各国政府が進めるデータのオープン化の流れや、検証可能な事実をベースとした報道への要求の中から生まれた新しいジャーナリズムの姿と言えます。今回の発表では、米ニューヨーク・タイムズや英ガーディアンなどの事例を元にデータ・ジャーナリズムとはなにか?をご紹介し、この新しい手法が生み出す新しい価値と将来への展望、そして課題についてを考えます。

セッション6:マルチメディア
  • 小林 瑞季, 小林 一郎, 麻生 英樹
    p. 67-72
    発行日: 2013年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    センサなどによって観測される情報の殆どは時系列データであり,ビッグデークを扱う時代においては,観測された時系列データの中から有益な情報を取得し,その内容を理解する手法の開発が重要となる.時系列データの分析方法には,トレンドの予測や複数データ間の相関関係の分析など様々な方法が存在する.一方で,時系列データの内容を理解するには可視化などの手法が用いられている.しかし,ロボットなど複数のセンサによって取得された時系列データの情報に基づき状況を認識する必要がある場合,取得された情報をより抽象度の高いレベルで観測されたデークを表現する必要がある.そのことに着目し,我々は観測された時系列デークの振る舞いを言語で説明する手法の開発を目指し,その一つとして,Kinectから得られた動画像の情報を入力とした確率的なテキスト生成手法を提案する.

  • 山本 岳洋, 中村 聡史
    p. 73-78
    発行日: 2013年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    本研究では,“可愛らしい”,“切ない”,“元気がでる”といった印象に基づく楽曲検索を実現するための評価基盤として,動画共有サイト上に投稿された500件の楽曲動画について,8つの印象クラスに対する評価値を評価者から収集した.本稿では,得られたデータセットの統計情報を分析することで,楽曲動画の印象間の関連性や,評価者間による評価値のばらつきを検証する.また,これまで我々が提案してきた,楽曲動画の印象推定技術を得られたデータセットに適用することで,楽曲動画の印象推定手法の現状の精度と課題を明らかにする.

  • 梶並 知記
    p. 79-84
    発行日: 2013年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    本稿では,e-Sportsの一種である対戦型格闘ゲームを対象にした,動画コンテンツを用いたプレイ分析支援のために必要な要素について検討する.対戦型格闘ゲームの文化的価値向上を目指す上で,伝統的な盤上ゲームのようにプレイヤーの思考分析が可能であること,また他者へプレイヤーの思考の伝達が可能であることが重要であると考える.本稿では,対戦型格闘ゲームにおけるプレイ技能のうち,戦略的な思考に着目し,それをプレイヤー自身または他者が理解可能な可視化手法について検討する.対戦型格闘ゲームのプレイの特徴を,時間的な側面と空間的な側面から捉え,それらの特徴を考慮して,プレイヤーの戦略的思考の可視化を考える.本稿では,プレイヤーの思考の変化をグラフ構造の変化で表現する方法,ゲームフィールド内のプレイヤーの着目箇所について,参照枠を応用し矩形,円,矢印といった基本図形で表現する方法,これら2つのコンセプトについて述べる.

feedback
Top