自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
一般論文(査読有)
場所参照表現抽出における言語モデルの時代横断型評価
片山 歩希東山 翔平大内 啓樹坂井 優介竹内 綾乃坂東 諒橋本 雄太小木曽 智信渡辺 太郎
著者情報
ジャーナル フリー

2025 年 32 巻 4 号 p. 1103-1128

詳細
抄録

歴史的テキストからの場所参照表現の抽出は,大規模な史料に対する人文学的分析を支援するための基盤技術として重要である.本研究では,近世・近代日本語紀行文の場所参照表現抽出ラベル付きデータを構築するとともに,既存の近世災害記録,現代旅行記のラベル付きデータを活用し,これら近世・近代・現代の 3 時代のテキストに対する現代語 Transformer 言語モデル(マスク言語モデル,自己回帰言語モデル)による場所参照表現抽出精度を調査した.実験から,歴史的テキストからの抽出において現代語ラベル付きデータを活用することの有効性を確認した.一方で,現代語テキストで高い抽出精度(最大 F1 値 0.890)が達成されたのに対し,歴史的テキストでは低~中程度の精度(最大 F1 値 0.506–0.739)となり,現代語向けモデルの歴史的テキストへのより良い適応のために,さらなる手法の改善が必要であることも示された.

著者関連情報
© 2025 一般社団法人 言語処理学会
前の記事 次の記事
feedback
Top