筑波大学大学院図書館情報メディア研究科
筑波大学図書館情報メディア系
2019 年 29 巻 3 号 p. 238-246
(EndNote、Reference Manager、ProCite、RefWorksとの互換性あり)
(BibDesk、LaTeXとの互換性あり)
化学物質名は,多様であり,記載法も書き手に委ねられているため自動抽出が難しく化学知識の共有化を妨げている.化学物質名を自動抽出できれば,共有化に役立つ.日本語の化学物質名を抽出するために,化学物質名をタグ付けした特許公開公報のコーパスの作成を行い,文章から形態素の切り出し,切り出した形態素の連結をすることによる化学物質名の認識法を確立した.あわせて連結した単語群から化学物質名を選択する方法の基礎的な検討,及び化学物質名と間違えやすい置換基名との選択比較も行った.
情報知識学会研究報告会講演論文集
すでにアカウントをお持ちの場合 サインインはこちら