音楽クリップのサムネイル画像から音楽情報以外のアスペクト情報は抽出できるのか？

Webインテリジェンスとインタラクション研究会予稿集

Online ISSN : 2758-2922

第19回研究会

DOI https://doi.org/10.57413/wii.19.0_7

会議情報

主催: Webインテリジェンスとインタラクション研究会

会議名: WI2研究会

回次: 19

開催地: 大阪公立大学杉本キャンパス学術情報総合センター

開催日: 2023/12/16 - 2023/12/17

セッション1：大規模言語モデル・生成AI応用

音楽クリップのサムネイル画像から音楽情報以外のアスペクト情報は抽出できるのか？

元満丈寛, 林克彦, 坂井優介, 上垣外英剛

著者情報

キーワード: 音楽キャプションデータ, 音楽検索, 音楽生成, ヴィジョン型大規模言語モデル

会議録・要旨集フリー

p. 7-10

詳細

抄録

近年，自然言語を用いた音楽検索・生成モデルの研究が盛んに行われている．これらモデルの学習や評価には，音楽とテキストの対応データが必要となるが，規模の大きな公開データはほとんど存在しない．特に，自然言語による音楽の説明記述として，聴きたいシチュエーションや季節等の非音楽的なアスペクト情報は重要であるが，このようなアスペクトが記述された音楽キャプションデータは少ない．この問題に対処するため，本研究ではサムネイル画像から想起される非音楽的なアスペクト（聴きたいシチュエーションや時間，季節，聴いた時の感情）を付与した音楽キャプションデータの生成法を提案し，人手評価によって提案手法の有効性を確認した.

著者関連情報

2023 この論文のすべての権利と著作権は著者に帰属します。

お気に入り & アラート

関連記事

閲覧履歴

Top