人工知能学会全国大会論文集
Online ISSN : 2758-7347
第36回 (2022)
セッションID: 4D3-GS-6-05
会議情報

k近傍言語モデルを用いたテキスト中の数字の予測
*阪本 拓功相澤 彰子
著者情報
会議録・要旨集 フリー

詳細
抄録

k近傍言語モデルは,事前学習済み機械学習言語モデルをk近傍法のアイデアによって拡張した言語モデルである.本研究では,文中のマスクされた数字を文脈から予測する数字穴埋めタスクに対してk近傍言語モデルを適用し,精度の向上を図る.実験では,k近傍言語モデルが数字穴埋めタスクにおいてもベースの言語モデルを上回る精度で予測を行えることを確認した.また,従来手法ではk近傍探索に用いる文脈表現を得る際にマスクより前の文章全体を使用していたが,本研究ではマスクとその周辺語のみ,マスクとその後続語のみという異なる文脈範囲を利用する手法を比較し,より密接にマスク数字に関わる単語のみを用いることで探索精度の向上を図る.その結果,数字穴埋めタスクでは,数字のマスクトークンの埋め込み表現のみを用いてk近傍探索を行う手法が最も効果的であることが確認された.

著者関連情報
© 2022 人工知能学会
前の記事 次の記事
feedback
Top