Webインテリジェンスとインタラクション研究会 予稿集
Online ISSN : 2758-2922
最新号
選択された号の論文の15件中1~15を表示しています
セッション1:QA・データ構造
  • 青柳 拓志, 金澤 輝一, 高須 淳宏, 上野 史, 太田 学
    p. 1-8
    発行日: 2022年
    公開日: 2023/01/23
    会議録・要旨集 フリー

    学術論文では,実験結果を示すのに表が頻繁に用いられる.しかしながら,多くの数値を効率良く把握するにはグラフのほうが視覚的に優れている.そのため,表構造を自動解析して表データをグラフ化する研究などがある.本稿では,表検出を含むエンドツーエンドの表構造解析手法を提案しその精度を評価する.表検出には,複数の表検出データセットで優れた成果を残したCascadeTabNetを利用する.また,表構造解析には,ICDAR 2013 table datasetの解析において,そのコンペティションの参加者の最高成績を上回った我々が提案した表構造解析手法を用いる.本稿の評価実験でも評価対象としてICDAR 2013 table datasetを用い,評価指標にはICDAR 2013で採用されたセルの隣接関係に基づいた評価指標およびICDAR 2021で採用されたTree-Edit-Distance-based Similarityを用いる.評価実験ではまた,商用システムであるABBYY FineReader PDFと比較する.評価実験の結果,表検出ではABBYY FineReader PDFの表検出率が0.968,提案手法で用いたCascadeTabNetが0.962となった.また,表構造解析では,提案手法はABBYY FineReader PDFと比較して,セルの隣接関係に基づく評価指標のF値が0.962となり0.2ポイント上回った一方で,TEDSが0.948となり1ポイント下回る結果だった.

  • 渋木 英潔, 内田 ゆず, 小川 泰弘, 門脇 一真, 木村 泰知
    p. 9-12
    発行日: 2022年
    公開日: 2023/01/23
    会議録・要旨集 フリー

    近年,機械学習ライブラリの充実により,アノテーションデータさえあれば誰でも比較的容易に文書分類などのシステムを実装することが可能となった.一方で,既存のアノテーションデータは数量が限られている.特に,精度改善のためにはシステムが間違いやすい部分に焦点を当てたデータが必要であるが,そのようなデータが十分にあるとは限らない.この問題を解決するために,本稿では,地方議会会議録を用いた質問応答タスクを対象として,ゲーミフィケーション的にアノテーションデータを拡充するGamified Dynamic Adversarial Data Collection (GDADC)を提案する.また,GDADCの実践に向けて,NTCIR-17におけるQA Lab-PoliInfo-4のAnswer Verificationタスクの説明をする.

セッション2:情報推薦(1)
  • 菅沼 修祐, 飯塚 洸二郎, 関 喜史, 森田 一, 鳥海 不二夫
    p. 13-20
    発行日: 2022年
    公開日: 2023/01/23
    会議録・要旨集 フリー

    ユーザーが触れる情報が偏るフィルターバブル等の問題は,重要な社会課題である.先行研究や本研究の事前分析で,ユーザーに多様なニュースを読んでもらうことが,長期的には社会と事業者の双方に有益なことが分かっている.では,ユーザーの満足度を損なわずに,視野を広げて多様な記事を読んでもらうにはどうすればよいか.本論文では,ユーザーが記事をクリックした直後に,その関連記事かつユーザーが普段は読まないような記事を推薦する手法を提案する.因果推論の手法でニュースサービスの行動ログを分析した結果,提案手法の推薦を受けた介入群は,クリックした記事のGSスコアが0.029低い,つまりより多様な記事を読んでおり,短期的な満足度の指標のクリック率が1.1%高く,長期的な満足度の指標の継続利用率が6.2%高かった.これは,フィルターバブル等の問題を,事業者とユーザーにメリットがある形で解決できることを示唆している.

  • 伊集院 大将, 山田 哲男
    p. 21-22
    発行日: 2022年
    公開日: 2023/01/23
    会議録・要旨集 フリー

    近年,個人売買プラットフォームを通じた個人間の中古商品取引の市場が拡大している.この市場のメリットとしては,ユーザが気軽に出品できる点や,中古商品の出品価格を自由に決められることが挙げられる.その一方で,ユーザにとって,一品一品で価格や使用状態が異なる中古商品に購入者がいるか,またコストを含めた中古商品の仕入れたときにどのような価値があるのか事前にわからないため,商品の仕入れや販売利益の予測,中古商品の出品価格の値付けが難しいことがある.決定木は,データマイニング手法の一つであり,意思決定や物事の分類を多段階で繰り返し実行する場合,その多段の分岐過程を階層化した樹形図として表現することができる.本研究では,個人売買プラットフォーム出品者の実際の販売・コスト履歴データを例に,決定木を用いることで中古商品の価値の分類を予測するモデルを作成し,どの決定変数が精度に影響を与えるかを考察する.

  • 井上 碧惟, 奥 健太
    p. 23-26
    発行日: 2022年
    公開日: 2023/01/23
    会議録・要旨集 フリー

    映画推薦システムは,膨大な映画集合の中からユーザの映画における評価履歴に基づき,そのユーザの嗜好に合った映画を推薦する.映画推薦システムにおいて推薦精度を向上させるためには,映画の内容に関する映画特徴の抽出が課題となる.本研究は,映画特徴抽出の情報源として映画ポスターに着目している.映画ポスターからはその映画の印象を受け取ることができる.ポスター画像の色彩や構図特徴のパターンによって映画を分類し,そのパターンを映画の補助特徴とする.そして,評価履歴と補助特徴を組み合わせたハイブリッド型推薦システムとして,内容ブーステッド協調フィルタリングおよびFactorization Machinesを実装する.MovieLens 100K Datasetを用いた評価実験において,補助特徴の有無による推薦の正確性をRMSEにより比較評価した.結果,補助特徴ありの手法の方が,補助特徴なしの手法に比べてRMSEが低くなった.

  • 森 大河, 山田 光穗, 石井 英里子, 星野 祐子
    p. 27-30
    発行日: 2022年
    公開日: 2023/01/23
    会議録・要旨集 フリー

    近年では情報通信技術の普及によってWebブラウジングやSNSなどインターネットを活用した情報収集の割合が増えてきており、レコメンドシステムによる情報収集支援の需要も高まっている.今回我々は暗黙的な方法による推薦,特に視線情報の活用に着目し,Webブラウジングによる情報収集を支援する手法の検討を行った.本システムはユーザの視線に基づき,閲覧中のWebページのテキスト要素を取得した後,重要語解析や感情分析等の自然言語処理技術の活用により,ユーザが閲覧したページに関連する追加情報の取得に役立つ検索キーワードの推薦を行う.検証ではユーザの興味のあるトピックに合わせて推薦されるキーワードが適切に変化することを確認しており,ユーザの検索意図を反映させた推薦が可能であった.

  • 梛木 佑真, 岡本 一志
    p. 31-34
    発行日: 2022年
    公開日: 2023/01/23
    会議録・要旨集 フリー

    POI(Point of Interest)推薦システムの研究では,POIへのチェックイン(C/I: Check-ins)ログが評価に用いられる.先行研究ではC/Iログは単純な前処理をもって使用されるが,C/Iログには非観光行動が含まれており,システムの性能を公平に比較できていない可能性がある.本研究では,観光行動抽出法により非観光行動を除外したC/Iログを用いて代表的なPOI推薦システムを評価することで,非観光行動が推薦精度に与える影響を確認する.評価結果として,非観光行動を一定数除外した際に多くのシステムは精度が低下するが,GRU4Recは除外前の精度を比較的維持する傾向があり,非観光行動がシステムの性能比較に影響を与えることを確認している.

セッション3:CGM/SNS 分析・応用
  • 豊島 秀典, 廣中 詩織, 吉田 光男, 梅村 恭司
    p. 35-42
    発行日: 2022年
    公開日: 2023/01/23
    会議録・要旨集 フリー

    論文推薦システムなどでは,論文間の引用関係を表現した引用ネットワークが用いられている.しかし,論文出版には時間がかかるため引用関係が表れるまで時間がかかり,また研究者による評価しか与えられないという問題点がある.ソーシャルメディアなどでの言及量をもとにした論文の社会的インパクトを測るオルトメトリクスは,これらの問題点を解消するが,オルトメトリクスで注目されるTwitter言及をもとに作成した論文間の関係と,一般に論文間の関係として用いられる引用の関係の違いは調査されていない.本論文ではTwitter言及をもとにした関係と引用の関係とのネットワーク上の近傍論文をカテゴリと投稿年などの観点で比べる.その結果,引用関係の方が言及類似度よりも,学術的なカテゴリが同じ論文が近くに存在することがわかった.引用のネットワークは,研究者による研究発展の流れの情報を含むため同じ学術的なカテゴリを持つ論文が近くなり,言及類似度のネットワークはユーザの興味の情報を含むため,同じ学術的なカテゴリの論文が引用ほど近くならないと考えられる.

  • 竹内 皓紀, 林 克彦
    p. 43-50
    発行日: 2022年
    公開日: 2023/01/23
    会議録・要旨集 フリー

    様々なドメインを対象としたエンティティ間の類似度推定は,推薦・検索・自然言語処理などに応用される.従来の研究ではエンティティ間の類似度を推定するため,エンティティに対応するWikipedia記事の概要文やハイパーリンクなどのコンテンツ情報を利用することが一般的であった.しかし,このようなコンテンツは対象ドメインの表層的な属性情報に限られるため,従来法では人間の嗜好性などに内在するエンティティ間の複雑な類似性を捉えることは難しかった.本稿では,協調フィルタリングを参考に,Wikipedia記事の編集者情報を利用した新しいエンティティ類似度推定手法を提案する.一般に,Wikipediaの編集者は本人が関心を持つ記事に対して編集を行うため,同一ユーザに編集された記事に対応するエンティティ同士は高い類似性を持つことが期待される.本稿では映画,音楽,書籍のドメインに関する推薦タスクを用いて,提案手法の有効性を確認した.

  • 乙黒 拓哉, 岡本 一志, 柴田 淳司
    p. 51-54
    発行日: 2022年
    公開日: 2023/01/23
    会議録・要旨集 フリー

    電子市場では,店舗の総合評価を表すために,レビュワーから付与されたレーティングを集計する中央型評判システムが採用されている.評判システムが算出する値はユーザの意思決定を支援する重要な指標であり,店舗評価を意図的に操作する評判攻撃を適切に排除する防御戦略が提案されている.Wangらが提案しているImpression Based Strategy(IBS)は,レビュワーに対して「印象」という概念を導入し,これに基づいたレビュワー分類を行うことで評判攻撃に対して頑健な店舗評価の推定を可能にしている.一方で,2020年頃には新たな評判攻撃として「賄賂操作」が報告されるようになった.賄賂操作は,店舗が取引を行ったユーザに対して金券などの賄賂取引を持ち掛け,見返りとして高評価を付与してもらう評判操作の一種である.本研究では,中華料理店過程を利用した模擬市場を作成し,IBSが賄賂操作に対して脆弱性を持つ市場状況の調査および改善箇所を検討する.

  • 二之宮 大聖, 鳥海 不二夫, 山本 仁志
    p. 55-58
    発行日: 2022年
    公開日: 2023/01/23
    会議録・要旨集 フリー

    近年のSNSの発達に伴う分極化は炎上や政治的停滞の一因となっており,分極化抑制の社会システム設計に向け,発生メカニズムの理解が求められている.既存の分極化モデルは意見変化をベースにしているが,現実の社会的状況において内的意見は簡単には変わらないと言われており,孤立の回避の結果として沈黙の螺旋と呼ばれる現象が発生することも確認されている.そこで本研究では,内的意見と表明意見を区別し,他人の信念推定に基づき対立を回避し意見表明を行うモデルを提案する.結果として,多様な内的意見を保つ場合であっても,周囲の意見を誤推定することで表明意見の極化が発生した.また,外集団との差別化によって二極化が促進されることが明らかとなった.

招待講演
セッション4:情報推薦(2)・情報抽出
  • 竹元 亨舟, 山西 良典, 西原 陽子
    p. 60-67
    発行日: 2022年
    公開日: 2023/01/23
    会議録・要旨集 フリー

    本研究では,楽曲の歌詞に見られる特徴的な言語表現技法やセクション役割(Verse,Chorusなど)の理解の手がかりとして,音楽の知識共有プラットフォームで公開されているユーザ投稿の活用を試みる.歌詞は,文法規則を無視した抽象的な表現が多用されるため,意味の解釈が難しい.歌詞の意味の解釈を助けることができれば,音楽を楽しむための難易度を下げ,作詞家の創作補助や,聴取者のコンテンツの理解促進につながると考えた.本稿では,ユーザ投稿から歌詞で用いられる詩的な言い換え表現技法とその解説文を抽出することを試みた.楽曲に紐づけられた知識が文書や画像で共有されるユーザ投稿コンテンツを参照することで,事例ベースの知識を獲得する.提案手法では,入力文章の構文に対するルール集合を構築し,知識工学的アプローチで知識抽出を行う.実在する洋楽歌詞に対する559,811件のユーザ投稿文書から,歌詞中の詩的な言い換え表現とその解説を5,053件抽出し,これらについての統計的分析と考察を行なった.

  • 野本 輝, 太田 学
    p. 68-74
    発行日: 2022年
    公開日: 2023/01/23
    会議録・要旨集 フリー

    Social Networking Service(SNS)や観光サイトでは認知度の高い観光スポットの投稿が多いため,認知度の低い観光スポットの情報が埋もれてしまう傾向がある.本稿では,観光サイトに投稿されているレビュー文を用い,観光スポットの観点ごとの評価値を表す観点ベクトルとユーザがどの観点に興味があるかを表す興味ベクトルを定義し,それらのマッチングにより観光スポットを推薦する手法を提案する.提案手法では,観光スポットの認知度に過度に依存しないように観点ベクトルを定めるため,推薦する観光スポットがその認知度の影響を受けにくい.実験では,観光サイトで観光レビューを投稿しているユーザが実際に訪れたスポットと提案手法で推薦した観光スポットを比較し,推薦結果の適切性について考察した.また被験者実験により,提案手法で推薦されたスポットを認知度,魅力,興味の三項目で評価し,認知度を考慮した場合の推薦スポットと比較した.

  • 佐々木 謙人, 関 洋平
    p. 75-78
    発行日: 2022年
    公開日: 2023/01/23
    会議録・要旨集 フリー

    将棋解説文の自動生成には1) 局面や指し手の特徴量から解説すべき対象を特定し2) その対象について自然言語による解説を行うことが必要である. 本研究では,将棋解説文の自動生成のための第一歩として, 将棋解説文に含まれる構成要素を定義し, 人手によるアノテーションで将棋解説文コーパスを作成した. アノテーションの定義と作成したコーパスの統計情報について報告する. また, 作成した将棋解説文コーパスを用いて事前学習言語モデルT5とBERTのファインチューニングを行い, 構成要素ラベルの自動判別が行えるか検証した. T5では, F値のマクロ平均0.769で自動判別ができることを示した. 作成したコーパスは, 解説文が付与された局面や指し手と紐付けられており, 局面と指し手を入力として解説すべき構成要素を判別する課題への活用が期待できる.

feedback
Top