人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
セッションID: 2N1-GS-4-05
会議情報

学術論文PDFからの著者所属情報の抽出と分類
*山内 一礼桂井 麻里衣
著者情報
会議録・要旨集 フリー

詳細
抄録

学術論文の著者の所属情報は,科学計量学における様々な分析で重要な役割を果たす.先行研究の多くは論文の著者所属情報を入手する上で,出版社のデータベースやオープンデータベースを情報源とする.しかし,これらのデータベースは必ずしも分析対象の著者所属情報をメタデータとして格納しているとは限らない.このことは分析のカバレッジを低下させる原因となる.所属情報をPDFファイルから抽出することは,この問題を解決する手段となりうる.本研究では,学術論文PDFから直接著者の所属情報に該当する文字列を抽出し,その研究機関がアカデミアと企業のいずれに属するかを分類する手法を提案した.その結果,約90%の研究機関を正しく分類することができ,実応用上の提案では手作業による分類を約63%削減することができた.

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top