人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
セッションID: 3E1-GS-10-05
会議情報

局所的に傾いた楽譜スマホ写真からMusicXMLを作成する小節ベースの複数深層学習モデルを使用した音符組み立て方法
楽譜スマホ写真から音楽を再生するアプリimg2Mxml
*宍戸 知行ファティ フェヒミユ徳重 大輔小野 靖弘熊澤 逸夫
著者情報
会議録・要旨集 フリー

詳細
抄録

ディープラーニングは光学楽譜認識(OMR)に応用されている。しかし、様々な楽譜画像からのOMR処理は、広く適用するにはまだ精度が不足している。本研究では、傾斜した写真画像を含む様々な画像からOMR処理を可能にする小節ベース複数深層学習駆動組立(MMdA)手法を提案する。本手法では、深層学習モデルを用いて小節を抽出し、整列させ、複数の深層学習モデルを直列または並列に用いて、音楽記号成分の再構成を実行する。標準化された各小節の使用は、深層学習モデルの効率的な学習と、各小節に含まれる5本の五線譜の正確な調整を可能とし、局所的に傾いた楽譜画像からの音符再構成を可能とする。したがって、既存のOMRアプリでは不可能な局所的に傾いた楽譜を再現することができる。少数の特徴タイプを持つ複数の音楽記号成分特徴により、音符や和音を含む多様な音楽記号を表現することができる。MMdA法は、エンドツーエンドのOMR処理を可能とし、スマホ楽譜写真画像のOMRの実用性を高める。

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top