人工知能学会全国大会論文集
Online ISSN : 2758-7347
第35回 (2021)
セッションID: 4J1-GS-6d-02
会議情報

日本語形態素解析器の知識蒸留
*田上 青空戸次 大介
著者情報
会議録・要旨集 フリー

詳細
抄録

本稿は、知識蒸留を用いて日本語形態素解析器rakkyoをさらに圧縮する手法を提案する. 日本語形態素解析器は現在非常に高い精度となっている.しかし、実用化においてはモデルサイズの大きさという課題が残されている. そこでArsenyらによるrakkyoモデルでは、Juman++によって作成された5億文のシルバーデータを学習し、文字ユニグラムのみを用いることでモデルサイズを大幅に圧縮した. 本研究では、深層学習モデルの圧縮手法の1つである知識蒸留をすることで、rakkyoをさらに圧縮し大規模なデータを必要としない形態素解析器を構築し、小規模なデータでrakkyoの精度に近づけるかを評価した.

著者関連情報
© 2021 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top