主催: 一般社団法人 人工知能学会
会議名: 2021年度人工知能学会全国大会(第35回)
回次: 35
開催地: オンライン
開催日: 2021/06/08 - 2021/06/11
本稿は、知識蒸留を用いて日本語形態素解析器rakkyoをさらに圧縮する手法を提案する. 日本語形態素解析器は現在非常に高い精度となっている.しかし、実用化においてはモデルサイズの大きさという課題が残されている. そこでArsenyらによるrakkyoモデルでは、Juman++によって作成された5億文のシルバーデータを学習し、文字ユニグラムのみを用いることでモデルサイズを大幅に圧縮した. 本研究では、深層学習モデルの圧縮手法の1つである知識蒸留をすることで、rakkyoをさらに圧縮し大規模なデータを必要としない形態素解析器を構築し、小規模なデータでrakkyoの精度に近づけるかを評価した.