情報知識学会誌
Online ISSN : 1881-7661
Print ISSN : 0917-1436
ISSN-L : 0917-1436
著者推定におけるBERTの比較分析とアンサンブル学習
神田 泰誠金 明哲
著者情報
ジャーナル フリー

2024 年 34 巻 3 号 p. 244-255

詳細
抄録

 BERTは大量の学習データを用いて事前学習を行い,微調整して個別分野のタスクに適応させる汎用言語モデルである.日本語では比較的に入手しやすいWikipedia,青空文庫,日本語ビジネスニュース記事などに基づいて学習したBERTが続々と公開されている.本研究では,著者推定において異なる事前学習データから構築された複数のBERTの性能比較を行い,事前学習データが個別タスクに与える影響を分析した.また,複数のBERTのアンサンブル学習で著者推定モデルの精度を向上させる方法について研究を行った.その結果,青空文庫内の著者の推定において青空文庫から構築されたBERTの性能が高いことがわかった.よって,事前学習データが個別タスクを解く際のモデルの性能に影響を与えていることが明らかになった.また,複数のBERTのアンサンブル学習モデルの性能は,BERTを単体で用いた場合の性能に比べて向上することがわかった.

著者関連情報
© 2024 情報知識学会
前の記事 次の記事
feedback
Top