Webインテリジェンスとインタラクション研究会 予稿集
Online ISSN : 2758-2922
第17回研究会
選択された号の論文の17件中1~17を表示しています
セッション1:学習支援と質問生成
  • 江原 遥
    p. 1-6
    発行日: 2021年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    外国語の語彙学習では、多く出現する語(高頻度語)ほど学習上重要と一般的に考えられている。一方、高頻度語には、語の出現ごとに意味が異なる場合が多くある(多義語)。高頻度語の中にも、学習上の優先度が低い語の使い方(用例)がある。理想的には、単に語の頻度に基づいて学習上の重要度(難しさ)を決めるのではなく、母語話者が書いたテキストの語の出現(用例)ごとに、語の用例の学習上の優先度まで出力してくれることが望ましいが、そのようなシステムは現状ない。本研究では、BERT[Devlin+,2019]に基づく深層言語モデルと深層外れ値検知モデルを組み合わせ、意味的に例外的な用例を除外し学習上の優先度を自動決定して学習者に提示するシステムを提案する。そして、英語母語話者の監修のもと、語の用例を学習者が知っているか否かを問う評価用データセットを新たに作成し、このデータセットを用いた提案手法の評価について述べる。提案手法は、例えば母語話者のTwitterコーパス中で主要な表現を特定することによって、文法的には正しくとも口語表現としては外れ値であるような表現を特定し、自然な口語表現の学習などに利用できる可能性がある。

  • 松本 涼, 遠藤 聡志
    p. 7-12
    発行日: 2021年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    人工知能技術で大学入試問題を解くことに挑戦する「ロボットは東大に入れるか」プロジェクトは,大学入試センター試験の模擬試験において,全教科合計の偏差値57.1を達成した.しかしながら,東ロボくんの入力は独自のXML規格を前提としており,「人がXMLデータを作成しないと回答動作を行えない」「XMLデータの作成にコストがかかる」などの問題がある.このため,試験問題画像からEnd-to-EndでXMLデータを生成する必要がある.そこで本研究では,センター試験のページ画像からXMLデータを生成するタスクを,「要素,属性,構造,内容の4種類の情報の抽出,推定タスク」と「XML定義に従って再配置するタスク」の5つのタスクに分解して再定義した.また,要素,構造および一部の属性情報について,抽出,推定実験を行った.

  • 三浦 拓也, 土田 正士, 石川 博
    p. 13-18
    発行日: 2021年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    コールセンタには,オペレータとユーザ間の問い合わせと回答のやりとりを記録した応対履歴が存在する.応対履歴には,人間同士のやり取りで明確な記述ルールやタグが存在しないため,機械的に質問文と回答文を結びつけることができない.従来研究で,応対履歴をQ文とA文に分類して一文対一文のQAペアを作成した際に,分類の際に省かれてしまっている前後に存在するQ文,A文以外の文も問い合わせに関する文として評価する必要があることがわかっている.そこで本研究では,QAペアの前後の文を評価するために,文の文末表現に基づいて,これまでの質問文,回答文に加えて,叙述文とその他に分類を追加して各文に新たなフラグを付与した.また,フラグを付与した文を用いて,Q文,A文の結合ルールの作成と評価をする.さらに,Q文,A文の結合ルールに基づいて,一文または二文のQAペアを作成し,新たなQAペアの生成ルールを検証し,その有効性を示す.

セッション2:機械学習と最適化
  • 三宅 悠介, 峯 恒憲
    p. 19-24
    発行日: 2021年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    多腕バンディット問題は,腕と呼ばれる複数の候補から得られる報酬を最大化する問題である.同問題のWebサービスへの応用では,利用者の嗜好傾向が多様かつ継続的に変化する課題に対処するため,文脈や時間の経過を考慮した問題設定への拡張と方策が提案されている.しかし従来の方策は,腕の相対的な有用性が逆転する環境で,不充分な追従性や非効率な探索に起因する機会損失が増加してしまう.本研究では,このような番狂わせを含む環境であっても機会損失を低減可能な方策を提案する.提案手法では,線形カルマンフィルタを用いた継続的な状態推定によって文脈や時間の経過に応じた変化に迅速に追従する.さらに,状態推定の欠損値処理を仮想的な探索に見立て,探索効率を高める.評価では,方策の追従性と探索効率を分析するための新たな指標を導入し,これらが従来の方策と比べて提案手法により改善することを確認した.

  • 荒川 瞭平, 金澤 輝一, 高須 淳宏, 上野 史, 太田 学
    p. 25-28
    発行日: 2021年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    多数の学術論文を蓄積する電子図書館のサービス運用には, 書誌情報データベースの整備が必須であり, 学術論文の参考文献欄から書誌情報を自動抽出する研究が行われている. しかし, 高精度な書誌情報抽出のためには, 参考文献文字列の書式が異なる雑誌ごとに一定量の参考文献文字列を学習データとして用意する必要があり, その生成コストが課題となる. そこで本研究では, 自然言語処理の多くのタスクで良い性能を示している, Bidirectional Encoder Representations from Transformers (BERT)を利用した書誌情報抽出において, 擬似学習データの利用方法を検討する. 実験では, 擬似学習データの量と書誌情報抽出精度の関係を明らかにするとともに,書誌要素の位置の入れ替えや,書誌要素を挿入した擬似学習データの有効性を評価する.

  • 川根 龍人, 伊集院 大将, 杉 正夫, 中嶋 良介, 山田 哲男
    p. 29-30
    発行日: 2021年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    製造業では,デジタルデータやAIの活用による生産革新が進んでいる.機械学習とは,大量のデータからアルゴリズムを使ってデータの関係性や特徴などを学習し,新たな知識や規則を抽出するAI技術のことであり,作業者の身体動作の分析が期待されている.従来研究の一つでは,加速度・地磁気センサーを用いて,作業現場における人間の測位計測を行う研究がある.しかし,高精度な位置情報が得られる光学式モーションキャプチャーを用いた工場の作業者の分析は,十分に行われていなかった.本研究では,光学式モーションキャプチャーを用いて工場における複数の作業者の動きを高精度にデータ化し,機械学習ソフトウェアによって分析することで,各作業者の動作の分析を試みる.

  • 松野 省吾, 嶋田 香, 荒平 高章
    p. 31-32
    発行日: 2021年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    本稿では,進化計算の一手法であるGNP-based rule mining method (GNMiner)を用いて検出されたルール集合の特性に沿って,その最適なパラメータ設定を検証した.一般的な進化計算手法は最終世代におけるエリート個体を課題に対する解とする。そのため,「獲得できるルール数」に着目した評価がされる.一方,GNMinerは与えられた条件を満たす解を世代継続的に蓄積する戦略をとる.このため,進化時の選択・再生の操作法,パラメータ群の設定法が従来の進化計算とは異なり,目的に沿った設定の評価が必要である.そこで,筆者らは蓄積されることとなるルール集合の特性に対する評価の観点から進化操作時のパラメータ設定を検証する.その初段の評価対象として,分類問題に用いたときの精度,ルールを構成する属性数(ルールの複雑度合い),ルール蓄積における進化過程の動態(パラメータの変化),に注目したシミュレーション実験を実施することで,GNMinerにおける効果的な進化設定を考察する.

セッション3:可視化
  • 松本 真拓, 安藤 一秋
    p. 33-38
    発行日: 2021年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    本研究では,Twitterから病気・症状を含む日本語ツイートを収集,分析することで,新型コロナウイルス感染症などの流行状況や各種症状の発症状況を都道府県別や時系列別などに可視化するシステムの構築を目的とする.本研究で提案するシステムを利用することにより,病気の流行や症状の発症状況を迅速に察知できる.提案システムは,ツイートされる病気・症状の事実性解析部と病気・症状をツイートしたユーザの居住地推定部で構成される.本稿では,居住地推定部の実現に向けて,Twitter内のツイート内容とTwitter外の情報である天気情報を組み合わせた深層学習モデルを提案する.天気情報を含むツイートを1件以上発信しているユーザに対する都道府県別の居住地推定実験により,ツイート内容のみを用いた手法よりも提案モデルの方が約1.6ポイント高い0.733のF値が得られることを確認した.

  • 箕浦 悠人, 熊野 雅仁, 木村 昌弘
    p. 39-42
    発行日: 2021年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    位置情報ベースSNSの普及にともない,実世界でのヒューマンモビリティに関する大規模な時空間情報が利用可能となりつつあり,このようなビッグデータを有効活用することに期待が高まっている.本研究では,ヒューマンモビリティデータを活用してPOI(point-of-interest)群の地理的影響構造を視覚的に分析できるシステムの構築を目指す.このために,Hawkes過程,RH(receiver homogeneous)モデルおよびSH(sender homogeneous)モデルに基づいてPOI群の地理的影響構造を抽出し,それらを可視化分析する手法を提案する.そして,Foursquareデータを用いたケーススタディを通して提案法の有効性を検証する.

  • CHEN Xueyi, WAKITA Ken
    p. 43-46
    発行日: 2021年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    For practitioners working in different fields, reports describing a variety of data facts are authored and analyzed by lots of people every day. To get insights efficiently from such kind of data-rich document, people naturally take notes by using visual marks such as highlights, underlines, circles traditionally. Recently, as business reporting goes electronic gradually, there is a surge of attention and interest in effective support for such kind of report analysis with the power of computer science. In this paper, we design a visual-guided method focusing on business reports exploration, especially, so as to help build visual links among charts and data-facts embedding in the text. The proposed method aims to simplify the authoring of interactive business reports, as well as empower people to comprehend the key information effectively. Several use cases generated by our system based on real business reports are presented to show the usage and capability of the implemented architecture.

  • 笹方 育也, 柴田 祐樹, 高間 康史
    p. 47-50
    発行日: 2021年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    本稿は,映像における音情報を可視化する手法を提案する.複数の動画を同時に確認したい場合や,公共交通機関で移動中などにヘッドホンなしでも動画を視聴したい場合など,音声を再生せずに動画を視聴したい場合も存在する.このような状況に対し,音による情報を代替する手段として,字幕が一般に用いられている.しかし字幕表現だけでは,発話者の感情や映像中の音楽,物音といった情報まで提示し,音声再生時と同じ印象を与えることは難しい.そこで本稿では,それらの音情報を吹き出し,枠線,集中線という表現を用いて可視化する手法を提案する.提案手法と字幕表現を比較するユーザ実験を行った結果を示し,提案手法の有効性及び特性について考察する.

セッション4:SNS
  • 加藤 大貴, 藤代 裕之
    p. 51-56
    発行日: 2021年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    台風や豪雨災害は人的・物的両面に甚大な被害を発生させる.ソーシャルメディアは災害時において有益な情報共有手段とされているが,避難には十分に活用されていない.活用には人々の情報欲求に対応した情報発信を行う必要があるとされているが,情報欲求を把握する方法は明確に示されていない.そこで本研究では,量的・質的手法を組み合わせてツイートから情報欲求を分析する.2021(令和3)年8月から10月にかけて「避難」を含むツイートを収集して関連語の抽出を行った.収集した1日分の全ツイートといいね数の上位100ツイートの関連語を比較し,これを手がかりとしてツイート本文を確認することで情報欲求を分析する.

  • 藤兼 由生, 風間 一洋, 吉田 光男, 土方 嘉徳
    p. 57-62
    発行日: 2021年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    ソーシャルグラフの対立構造を定量化する研究が行われているが,小規模グラフに対して適切に定量できないことや,計算時のパラメータを経験的に設定する必要があるといった問題が存在する.そこで本稿ではグラフサイズの影響を受けにくく,パラメータ設定を必要としない新しいグラフの分極度である適応型RWC(A-RWC)を提案すると共に,その有効性について述べる.まず初めに,人工グラフを用いたA-RWCの妥当性検証を行うことで,グラフの分極度としての有効性を示す.また,既存のグラフデータセットを用いて既存手法とA-RWCの結果を比較し,A-RWCの妥当性を示すとともに,小規模グラフに対するA-RWCの有効性を示す.さらに,Twitterのリツイートグラフを用いて既存手法とA-RWCの結果を比較し,グラフの統計量,可視化結果から妥当性を検証する.

  • 安田 莉子, 栗 達, 熊本 忠彦, 河合 由起子
    p. 63-66
    発行日: 2021年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    書籍等の専門性の高い書品に加え,食品や服,コスメ等の利用時期や利用場所に依存する商品を自宅で購入するネットショッピングの利用は急増している. しかしながら,ネットショッピングのユーザは服やコスメの商品購入時にそれら商品がどのような場所で利用されているかを想起することは難しい. すなわち,購入時に利用場所の多様性を示すことは,商品推薦の適合性と網羅性の向上につながると考えられる.そこで,本研究では,購入時と利用場所が異なるコスメ商品を対象とし,利用スポットごとに商品との関連度を抽出し提供することで,利用場所を想起させる商品推薦を提案する.具体的には,楽天市場のコスメ商品約5,600件を対象に,利用スポットの大学や病院といったカテゴリごとの関連度からランキング提示する. 一般的なコスメ商品のネットショッピングのレビューでは,商品の色や質感の情報は含まれるが,飲食店のレビューと異なり,利用場面の入力は少ない.そこで,位置情報付きツイートの投稿内容とコスメ商品のレビューから学習モデルを生成し,ツイートとレビューの特徴語ベクトルを生成することで,場所ごとにツイートとの類似度の平均値を関連度として算出する.本稿では,5つのカテゴリで関連度の高い12商品に対して50人のユーザによる適合率と再現率を検証する.

セッション5:行動分析
  • 佃 洸摂, 濱崎 雅弘, 後藤 真孝
    p. 67-72
    発行日: 2021年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    人はなぜ・どのように歌詞を閲覧するのだろうか.歌詞に基づく楽曲検索を始めとして,歌詞を用いた様々なシステムの開発が行われてきたが,この基礎的な疑問に関しては手つかずのままである.歌詞の閲覧行動を理解することは,研究者と音楽配信プラットフォームの双方にとって,歌詞に基づくシステムや機能を実現するうえで有用であると考えられる.そこで本稿では特にスマートフォンでの楽曲聴取時に,人がなぜ・どのように歌詞を閲覧しているのかについて調査する.「なぜ」に答えるためにアンケートを実施し,206名から得られた回答を分析する.また,「どのように」に答えるために,スマートフォンの音楽再生アプリから収集された2,300万件以上の歌詞閲覧ログを分析する.さらに,分析から得られた知見を活用することで,人々がより積極的に歌詞を閲覧したり未知の楽曲を聴いたりしたくなるようなアプリケーション例も提示する.

  • 新福 一貴, 谷口 紘太朗, 泰山 幸大, 平田 有里佳, 桑田 若菜, 平尾 星音, 壷坂 嶺, 熊野 駿人, 三浦 大貴, 前川 浩基, ...
    p. 73-78
    発行日: 2021年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    本稿では,様々な業種において,顧客満足度に関するアンケート結果を入力とし,その業種において改善すべき経営課題の優先順位を決定するための分析手法を提案する.手法を複数の業種のアンケートデータに適用し,提案方式で決定した経営課題の優先順位と中小企業診断士が判断した経営課題との比較を行った.その結果,カフェのような利用者が同業種間のサービスを比較しやすい業種において,提案方式を適用した結果と中小企業診断士の判断結果が一致した.つまり,この手法により,顧客満足度向上のために優先して解決すべき課題に関連する評価軸を提示し,経営者の意思決定をサポートできること示した.

  • 松尾 健汰, 熊野 雅仁, 木村 昌弘
    p. 79-82
    発行日: 2021年
    公開日: 2022/11/07
    会議録・要旨集 フリー

    多くのソーシャルメディアでは多様なコミュニティやカテゴリが設定されており,ユーザーのそれらへのエンゲージメントを分析する研究が,サイバー空間における行動分析の研究として近年注目されている.オンラインマルチコミュニティプラットフォームのRedditでのコミュニティ選択におけるユーザーエンゲージメントに対しては,エントロピー,最大頻度,新しいコミュニティの選択確率を特徴量とし,NMFを用いることにより,興味深い3つの解釈可能なユーザー行動パターンが同定されている.本研究では,楽天市場でのレビューカテゴリ選択におけるユーザーエンゲージメント分析に対して先行研究の分析法を拡張し,行動予測の観点からその有効性を評価するとともに,それにより抽出されたユーザー行動パターン群をアクティビティ指向性の観点から調査する.

feedback
Top