主催: 一般社団法人 人工知能学会
会議名: 2024年度人工知能学会全国大会(第38回)
回次: 38
開催地: アクトシティ浜松+オンライン
開催日: 2024/05/28 - 2024/05/31
学術論文の著者の所属情報は,科学計量学における様々な分析で重要な役割を果たす.先行研究の多くは論文の著者所属情報を入手する上で,出版社のデータベースやオープンデータベースを情報源とする.しかし,これらのデータベースは必ずしも分析対象の著者所属情報をメタデータとして格納しているとは限らない.このことは分析のカバレッジを低下させる原因となる.所属情報をPDFファイルから抽出することは,この問題を解決する手段となりうる.本研究では,学術論文PDFから直接著者の所属情報に該当する文字列を抽出し,その研究機関がアカデミアと企業のいずれに属するかを分類する手法を提案した.その結果,約90%の研究機関を正しく分類することができ,実応用上の提案では手作業による分類を約63%削減することができた.