Webインテリジェンスとインタラクション研究会 予稿集
Online ISSN : 2758-2922
最新号
選択された号の論文の21件中1~21を表示しています
セッション1:大規模言語モデル・生成AI応用
  • Kawane Ryuto, Karube Koki, Sugi Masao, Nakada Tomohiro, Yamada Tetsuo
    p. 1-2
    発行日: 2023年
    公開日: 2024/01/26
    会議録・要旨集 フリー

    In assembly work, the digitization of body movement skill using motion capture has been progressed to solve issues such as human resource development and skill transfer against declining birthrate and aging population. However, the amount of body movement data obtained from the motion capture is enormous. This study proposes an assembly elemental work analysis using motion capture and machine learning for the movement differences between experienced and inexperienced workers.

  • 板井 孝樹, 柴田 祐樹, 高間 康史
    p. 3-6
    発行日: 2023年
    公開日: 2024/01/26
    会議録・要旨集 フリー

    本稿では大規模言語モデルを適用し,レビュー文から価値観モデリングを行う手法について,その予備的検討を行った結果について報告する.価値観モデリングは,ユーザの価値観をモデル化し情報推薦に利用する手法である.アイテムの属性に対する評価極性と総合評価の極性が一致する割合を評価一致率として求め,これが高い属性をユーザがこだわりを持つ属性と判断する.推薦における有効性が示されているが,既存手法では明示的に属性評価が与えられる必要があった.この問題に対し提案手法では,大規模言語モデルを用いることにより,レビューで言及されている評価属性の極性を抽出し,評価一致率を求める.本稿では映画レビューサイトであるYahoo!映画に投稿されたレビューを対象として,大規模言語モデルによる抽出精度や明示的に与えられた属性評価との違いなどについて考察する.

  • 元満 丈寛, 林 克彦, 坂井 優介, 上垣外 英剛
    p. 7-10
    発行日: 2023年
    公開日: 2024/01/26
    会議録・要旨集 フリー

    近年,自然言語を用いた音楽検索・生成モデルの研究が盛んに行われている.これらモデルの学習や評価には,音楽とテキストの対応データが必要となるが,規模の大きな公開データはほとんど存在しない.特に,自然言語による音楽の説明記述として,聴きたいシチュエーションや季節等の非音楽的なアスペクト情報は重要であるが,このようなアスペクトが記述された音楽キャプションデータは少ない.この問題に対処するため,本研究ではサムネイル画像から想起される非音楽的なアスペクト(聴きたいシチュエーションや時間,季節,聴いた時の感情)を付与した音楽キャプションデータの生成法を提案し,人手評価によって提案手法の有効性を確認した.

  • 田村 光太郎
    p. 11-14
    発行日: 2023年
    公開日: 2024/01/26
    会議録・要旨集 フリー

    ニューステキストデータは,大量かつ高頻度に生成され,その瞬時の情報の整理・構造化が求められる. 我々は, ニューステキストの情報構造化を, 固有表現抽出タスクとして解くためにモデルを構築した. 一方で,固有表現抽出の学習データを継続的に高品質に構築することが求められるが, 高いコストがかかるため, 少量のデータを利用した効率的な学習が課題となっている. この課題へのアプローチとして, 教師データのテキストに対する拡張手法を適用することを試みた. 固有表現のデータ拡張としては, トークン操作が主流となるが,ここでは,生成AIに疑似ニュースを生成させることで,教師データには見られない特徴のテキストを生成し,拡張手法におけるデータ量やその強度での精度変化を調べ, モデルの精度向上を行った.

セッション2:SNS・機械学習
  • 大下 颯斗, 廣中 詩織, 梅村 恭司
    p. 15-22
    発行日: 2023年
    公開日: 2024/01/26
    会議録・要旨集 フリー

    SNSにおけるユーザ分析にはネットワーク構造が用いられることがある。我々のこれまでの研究では、フォロー数とフォロワー数の比(フォロー比)をユーザのフォロー行動の分析に利用した。しかし、フォロー比が似た値を持つユーザであっても、相互フォロー関係の有無によってユーザの特徴が異なるのではないかと考える。そこで本研究では、相互フォロー関係の割合をもとに定義する、相互フォロイー率と相互フォロワー率によるユーザ分類を提案する。提案する分類では、相互フォロー関係があまりない、偏らず多い、フォローされる側に多い、フォローする側に多い、の4つのカテゴリにユーザを分類する。そして、投稿数やフォロー数などのユーザプロパティと、カテゴリ間のユーザの投稿内容の類似度を調査し、各カテゴリの特徴を調べる。さらに、カテゴリごとに特徴語抽出を行い、各カテゴリの特徴を表す異なった傾向の単語が得られることを示す。その結果、フォロー比では分類が難しかったユーザが、相互フォロイー率と相互フォロワー率を用いることで分類できることがわかった。

  • 川﨑 優輝, 伏見 卓恭
    p. 23-28
    発行日: 2023年
    公開日: 2024/01/26
    会議録・要旨集 フリー

    グラフデータの機械学習においてノードやエッジに関する研究は多く行われており,ベクトル空間に埋め込む手法も多く提案されている.それに対してノード列に関する研究は少なく,ノード列をベクトル空間に埋め込む手法は確立されていない.本研究ではSNS上での情報拡散経路や道路上での交通ルートなどのノード列におけるノードの出現順序を考慮してグラフ内の類似の性質を有するノード列は類似のベクトルになるようにベクトル空間に埋め込む手法を提案する.具体的には,ランダムウォークに基づきノード列をデータ拡張することで,類似ノード列や非類似ノード列を生成する.そして,対照学習の枠組みで,ノードベクトルと出現順序を考慮してエンコードしたベクトルを射影することで,ノード列の表現ベクトルを学習する.現実の道路網データを用いた評価実験により,類似するノード列同士を類似ベクトルで,逆ノード列を非類似なベクトルとして表現できることを確認した.

  • 大西 雄真, 林 克彦
    p. 29-35
    発行日: 2023年
    公開日: 2024/01/26
    会議録・要旨集 フリー

    大規模マルチラベル学習(XMC; Extream Multi-label Classification)は膨大なラベル集合から各データ事例に対して複数のラベルを付与するタスクである.XMCタスクにおいて,現在,高精度を達成しているモデルの多くは膨大なハイパーパラメータで構成されるため,再現性の観点から問題が残されている.また,モデル自体もXMCに特化した工夫がなされており,再実装も容易ではない.そこで,本稿ではXMCタスクに対して,リッジ回帰に基づく単純な手法を提案する.提案法は閉形式解を持つことに加え,単一のハイパーパラメータで構成される.XMCタスクに単純なリッジ回帰を適用した前例はないため,本稿では複数のXMCベンチマークデータを用いて,提案法の性能を検証した.実験結果から,提案法のような非常に単純な方法でも既存モデルに匹敵,もしくは,それらを上回る性能を達成できることが明らかとなったのでここに報告する.

  • 宮崎 拓海, 伏見 卓恭, 鳥海 不二夫
    p. 36-39
    発行日: 2023年
    公開日: 2024/01/26
    会議録・要旨集 フリー

    TwitterなどのSNSでは,意図や目的の違いによりコミュニケーションの取り方や密度,対称性に違いが出る.本研究では,Twitterにおけるリツイート,リプライ,メンションの3種のコミュニケーションに着目し,レイヤーモチーフとよぶ新たなグラフ分析手法を提案する.提案するレイヤーモチーフは,フォロー意図の分類,コミュニティ抽出,重要ノード抽出の高精度化などの下流タスクで利用可能である.実際のTwitterデータを用いた評価実験により,提案モチーフの有効性を検証する.

セッション3:感性情報処理
  • 光畑 陽登, 関 洋平, 柏野 和佳子
    p. 40-46
    発行日: 2023年
    公開日: 2024/01/26
    会議録・要旨集 フリー

    本研究ではユーモアの一種であるなぞかけを生成することを目的としている.面白さがあるなぞかけには,意外性と納得感が求められる.まず,意外性を推定するために,人手で作られたなぞかけについて,その意外性を人手で分類し,なぞかけのお題と1つ目の心からなる文と,解と2つ目の心からなる文の2文間の意味的類似性と意外性の関係を分析する.意味的類似性と意外性の関係性を分析した結果,意味的類似性が低くなるに連れて意外性が高くなる結果が得られた.その上で,納得感が得られるように,単語の親密度データを利用して親密度の低い単語を排し,入力であるお題から意外性が高く,納得感が得られるなぞかけを生成する手法を提案する.また,生成されたなぞかけの評価を比較することにより,既存手法に対して意外性においては52%有意に向上することを確認した.最後に,生成されたなぞかけについて,意外性が高く,納得感が得られれば,面白さを感じられるのかといった点について考察を行った.

  • 多田 智貴, 林 克彦, 上垣外 英剛
    p. 47-54
    発行日: 2023年
    公開日: 2024/01/26
    会議録・要旨集 フリー

    Wikipediaには幅広い種類の記事が存在し,普通の百科事典には見られないような項目も存在する.その一つに,珍妙で面白い記事を集めた“珍項目”が存在するが,登録記事数は少なく,コミュニティの活動は停滞している.この理由として,珍項目の編集には幅広い知識が必要であるため,記事の編集が難しく,それが珍妙で面白いかという判断も容易ではないことが考えられる.本研究では珍項目コミュニティにおける編集活動の活性化を目的として,珍項目編集者や珍項目の候補となり得る記事の分析を行なった.分析を通して,珍項目を好む編集者の存在が明らかとなり,多くの珍項目編集者は珍項目以外にも珍妙で面白い記事を編集していることが分かった.この分析手法は珍妙で面白い記事候補の自動抽出に活用でき,大規模言語モデルを併用することで,候補記事を珍項目に登録するかどうかの判断補助も可能となるため,コミュニティ活性化への応用も期待できる.

  • 中野 卓代, 林 良平
    p. 55-57
    発行日: 2023年
    公開日: 2024/01/26
    会議録・要旨集 フリー

    本研究では,欠陥のあるユーザインタフェース(UI)を含むWebサイトを作成し,被験者にデータを入力させ,使いにくいWebサイトほど選択されにくいか否かを比較した.欠陥のあるUIとは,データ入力を妨害されたり,表示が不適切であったりするものであり,いずれもユーザを困惑させるが,欠陥を回避することで入力を完了することはできる.本研究では,中村[1]の提唱するBADUI(バッドユーアイ)の典型例9カテゴリを用いて,各WebサイトにBADUIを1カテゴリずつ配置した.また,欠陥のないWebサイトをベースラインとして作成し,計10サイトの中から被験者に自由に選択させた.クラウドソーシングサービスを利用し,被験者300人にタスクを遂行させた.当該サイトを選択したか否かを目的変数としてロジスティック回帰分析を行ったところ,ベースラインとBADUIを施したサイトの間で選択されやすさに差があるとは言えないと結論された.

  • 高橋 春成, 金澤 輝一, 上野 史, 太田 学
    p. 58-61
    発行日: 2023年
    公開日: 2024/01/26
    会議録・要旨集 フリー

    初学者が学術論文のような専門性の高い文書を読む場合,多くの専門用語に遭遇すると内容を理解するのが難しい.我々は,このような初学者の閲覧支援を目指して,学術論文閲覧支援インタフェースを開発している.本稿では,論文中の専門用語の解説や専門用語を表す画像を読者に提示することで,専門用語の理解を助ける新たな学術論文閲覧支援の機能を検討する.具体的には,論文中の専門用語にリンクを埋め込み,読者がそれをクリックするとクリックされた専門用語に対する解説と画像を提示する.解説と画像は,OpenAIが提供するAPIで利用できるモデルの一つであるGPT-3.5 TurboとDALL·E 3をそれぞれ利用して生成する.また,論文閲覧支援の観点から,提示する解説や画像を評価した.

セッション4:社会課題解決
  • 安藤 樹, 安藤 一秋
    p. 62-65
    発行日: 2023年
    公開日: 2024/01/26
    会議録・要旨集 フリー

    本研究では,公衆衛生監視の1つとして,感染症の流行状況や多様な病気症状の発症状況を観測・分析し,都道府県別・時系列別に可視化するシステムの開発を目的とする.提案システムは,SNS上で発信される病気症状を含む投稿が投稿者自身の発症を意図したものであるか否かを判定する事実性解析モジュールと投稿者の居住地を推定する位置推定モジュールで構成される.本稿では,患者表現辞書に定義された11種類の標準病名のうち,86種類の症状表現を対象に,これらの表現を含む投稿の事実性解析手法として,Support Vector Machine,ロジスティック回帰,多層パーセプトロン,PubMedBERTモデルを提案し,それぞれの性能を比較する.実験の結果,PubMedBERTモデルが,11の病気症状のうち9つの病気症状で最も優れた分類性能を持つことを確認した.

  • 伊集院 大将
    p. 66-68
    発行日: 2023年
    公開日: 2024/01/26
    会議録・要旨集 フリー

    環境問題への取組が世界的な課題として取り挙げられている現代において,社会が継続的に発展していくためには,リサイクルによる再資源化が求められている.しかし,実際の日本における各都道府県のリサイクル率は平均20.0%と低く,また県によっては,リサイクル率の差が10%以上も違いが見られることがある.日本全体のリサイクル率を向上するために,リサイクルに影響を与える要因の分析が必要である.ランダムフォレストは,機械学習による分類器の一つであり,意思決定や物事の分類を行う決定木を複数用いることで過学習を抑えた分類を行うことができる.本研究では,各都道府県の統計データに対して,決定木やランダムフォレストを用いることでリサイクル率に影響を与える要因について考察を行う.

セッション5:テキスト処理
  • 古田島 侑希, 亀井 清華, 泉 朋子, 森本 康彦
    p. 69-76
    発行日: 2023年
    公開日: 2024/01/26
    会議録・要旨集 フリー

    近年,一般のユーザが料理レシピを共有し,そのレシピを検索できるサイトが普及しているが,検索結果の材料リストから味を想像したり,その想像した味を検索結果の複数のレシピで比較することは困難である.そこで,レシピ間の比較に効果的な数値的表現である味特徴ベクトルに着目し,人がイメージする味を表現する.レシピを見た時に人がイメージする味特徴ベクトルを,レシピで使用されている調味料とその分量を基に計算する.本研究では,この味特徴ベクトルの有用性を検証するために,レシピから人が想像する各味覚の強さと味特徴ベクトルとの関連性を評価した.具体的には,肉じゃが,麻婆豆腐の2つの料理に適応させ,各味特徴に対してサーストンの一対比較法によるアンケート実験を行った.その結果,味特徴ベクトルの順位と人によって想像される味の強弱のとの間に概ね相関がみられた.

  • 大社 綾乃, 小出 智士, 大滝 啓介, 馬場 雪乃
    p. 77-84
    発行日: 2023年
    公開日: 2024/01/26
    会議録・要旨集 フリー

    推薦システムにおいて,説明の提示はユーザの意思決定を支援する重要な役割を果たす.特に自然言語による説明文は,アイテム消費を促すのに有効であると知られている.しかしながら,従来研究で扱われてきた説明文は定型文のように表現が画一的なものが多く,そのトーン(フォーマル,ユーモラスなど)には焦点が置かれてこなかった.そこで本研究では,映画推薦を対象とし,ユーザのアイテムへの関与(クリック,閲覧など)を高めることを目的として,説明文のトーンの個人化に取り組む.本稿では,クラウドソーシングを用いて,説明文のトーンとアイテム関与に関するデータセットを構築し,ユーザのアイテム関与が高まるトーンと内容の両方を持つ説明文を予測する行列分解に基づく手法を提案する.収集したデータのクラスタ分析および提案手法のオフライン評価の結果から,トーンと内容の両方を考慮した説明文によりユーザのアイテム関与を高められることが示唆され,個人によってアイテム関与が高まるトーンが異なることが明らかになった.

  • 金光 駿弥, 櫻井 凜, 伏見 卓恭
    p. 85-88
    発行日: 2023年
    公開日: 2024/01/26
    会議録・要旨集 フリー

    ユーザが投稿するレビューには,不満情報が含まれていることがある.ユーザが投稿した大量のレビューから不満情報を抽出し,その不満を解消するようなスタイリストをレコメンドする手法を提案する.不満情報の抽出のために,まず,スタイリストの技量に関わるサービスポイントとテクニックポイントに着目し,5点満点のうち3点以下のレビューを抽出する.対応するレビュー文の不満情報から構築したベクトルと,各スタイリストの得意技術,自己PRから構築したベクトル間の類似度を計算することで,不満を解消するスタイリストをレコメンドする.実際の美容院に関するホットペッパービューティーのデータセットを用いて,レビュー文の不満情報に対応するスタイリストをレコメンドすることを確認していく.

  • 黄川田 拓実, 櫻井 凜, 伏見 卓恭
    p. 89-91
    発行日: 2023年
    公開日: 2024/01/26
    会議録・要旨集 フリー

    ユーザ投稿型のオークションサイトやフリマアプリでは,企業型ECサイトとは異なり,商品説明文が適切でない場合が散見される.本研究では,企業型ECサイトにおける商品説明文で学習したLLMを多クラス分類タスクで学習し,その後転移学習したモデルを利用してユーザが投稿した商品説明文を分類する.この際,分類確率の高低により適切な文か否かを判別する手法を提案する.実際のECサイトに投稿された公式と一般ユーザによる商品説明文を用いた評価実験により,提案手法の有効性を確認する.

セッション6:自然言語処理
  • 櫻井 凜, 伏見 卓恭
    p. 92-98
    発行日: 2023年
    公開日: 2024/01/26
    会議録・要旨集 フリー

    歌詞の機械翻訳タスクにおいて,意味内容を重視した既存の機械翻訳では,歌詞のリズムを考慮することが困難である.そこで,発話において等時的に繰り返される長さの単位であるモーラを考慮した歌詞翻訳を提案する.具体的には,日本語歌詞を入力として,入力文のモーラ数に近い英語歌詞を出力するために,バイリンガルLLMに対して人間のフィードバックからの強化学習であるRLHFを用いたモーラ数制御を提案する.高品質なデータセットを作成することが難しい歌詞翻訳において,教師データに歌詞を用いずにモーラ数制御を報酬モデルとして強化学習させることで,歌詞翻訳タスクの難易度を下げることができると考えられる.実際の歌唱データを用いた評価実験では,ベースとしたLLMと比較して,15%近いモーラ数のRMSEの減少を確認した.

  • 松下 颯一郎, 上野 史, 太田 学
    p. 99-105
    発行日: 2023年
    公開日: 2024/01/26
    会議録・要旨集 フリー

    英語を母語としない人にとって適切な前置詞の選択は難しく,この問題に対処するため,自然言語処理モデルのBERTを利用した英文前置詞誤りの検出や修正の手法が提案されている.本稿では,英語で書かれたニュース記事の前置詞箇所をマスクした空所補充問題に焦点を当て, BERTとその後継モデルであるRoBERTa, ALBERT, DistilRoBERTaの性能を比較する.具体的には,選択肢のない英文前置詞の空所補充問題に対する各モデルの正解数,処理時間を評価した.実験の結果, BERTの正解率は89.1%, ALBERTの正解率は80.0%, DistilRoBERTaの正解率は82.1%, RoBERTaの正解率は93.8%であった.一方,最も正解率が高いRoBERTaの処理時間はBERTの処理時間の約1.1倍となった.

  • 中谷 聡, 上野 史, 太田 学
    p. 106-113
    発行日: 2023年
    公開日: 2024/01/26
    会議録・要旨集 フリー

    本稿では,自然言語処理モデルであるRoBERTaとELECTRAを利用して,英文に含まれる前置詞誤りを自動で検出し,それを修正する手法を提案する.具体的には,RoBERTaは英文中のマスクした前置詞をMasked Language Model(MLM)で予測する問題とマスクした箇所に前置詞が挿入されるかを判定する分類問題で,ELECTRAはマスクした箇所に前置詞が挿入されるかを判定する分類問題と,前置詞を置換または削除すべきかを判定する分類問題でファインチューニングする.これらのモデルから,MLMを利用した単語の出現確率,前置詞の有無の分類問題を利用した前置詞の出現確率,前置詞の分類問題を利用したラベルごとの確率を得て,前置詞誤りを自動で検出して修正する.実験では,検出と修正の精度を英文修正サービスであるGrammarlyおよびAIチャットサービスであるChatGPTと比較した.英語学習者の実際の前置詞誤りを含む英文に対し,誤検出なく正しく修正した文の割合で,挿入誤りでは,提案手法は0.92を示しGrammarlyを8ポイント,ChatGPTを10ポイント上回った.置換誤りでは,提案手法は0.62を示しGrammarlyを12ポイント上回ったものの,ChatGPTを2ポイント下回った.欠落誤りでは,提案手法は0.54となり,Grammarlyを2ポイント,ChatGPTを8ポイント下回った.

feedback
Top