論文ID: 2020_033
Wikipedia 上での学術文献の参照記述の追加という事象を明らかにするための前提となる方法論として,参照記述の初出時点を特定するための手法を提案し,評価実験を行った.提案手法は,まず,参照記述の参照先を判定し,ページ情報,文献タイトル,識別子を取得する.次に,対象のページの全編集履歴およびページ本文に対して識別子または文献タイトルを用いた手法を適用し,複数の初出時点候補を取得する.最後に,候補から編集日時が最古のものを選択する.英語版のDOI リンクの初出時点データセットを基に評価実験を行った結果,精度は全体で93.3%,22 分野中20 分野で90%以上であり,研究分野を問わず概ね高い精度で参照記述の初出時点を特定できる手法であることが明らかになった.