ケモインフォマティクス討論会予稿集
第41回ケモインフォマティクス討論会 熊本
会議情報

口頭発表
特許公開公報文章からの化学物質名の切出しと選別法の検討
*田中 るみ子中山 伸一
著者情報
会議録・要旨集 フリー

p. 1A04-

詳細
抄録

特許公開公報に記載されている化学物質名は、多様であり、記載法も書き手に委ねられているため共有化を妨げている。化学物質名を自動抽出できれば、共有化に役立つ。日本語の化学物質名を抽出するために、化学物質名をタグ付けしたコーパスの作成を行い、文章から単語の切り出し、切り出した単語の連結、連結した単語群から化学物質名を取り出す方法を検討した。化学物質名と間違えやすい官能基名との選別比較も行った。

著者関連情報
前の記事 次の記事
feedback
Top