後段タスクの精度向上のためのマルチレベルな分かち書きの最適化

小田倉 史麿; 若林 啓

doi:10.11517/pjsai.JSAI2022.0_3C4GS603

抄録

分かち書きは，後段タスクの精度に影響を与えることが知られている．平岡らは，後段タスクの精度を向上させるように分かち書きを最適化する手法であるoptok4atを提案した．しかし，optok4atで用いられている分かち書きモデルは一種類であり，教師なし学習によって語彙が形成されるため，低頻度だが重要であるフレーズを見落としてしまい，十分に精度を発揮できない懸念がある．本稿では，後段タスクの精度向上を目的とした，マルチレベルな分かち書きの最適化手法を提案する．提案手法は，異なる語彙を持つ2つの分かち書きモデルの出力を連結して後段モデルに入力する．教師なし学習による分かち書きモデルだけでなく，頻出のフレーズを語彙に含む辞書ベースの分かち書きモデルを併用することで，後段モデルの精度向上を試みる．いくつかのテキスト分類タスクにおける実験によって，提案手法はフレーズを分かち書きするにもかかわらず，精度の向上に寄与しないことが確認された．

著者関連情報

お気に入り & アラート

閲覧履歴

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）