人工知能学会全国大会論文集
第32回 (2018)
セッションID: 2C2-03
会議情報

ソーシャルメディアストリームからの新固有表現の発見
*赤崎 智吉永 直樹豊田 正史
著者情報
会議録・要旨集 フリー

詳細
抄録

現実世界では日々新しい事物や概念が誕生しており,それらの情報を網羅したデータベースは文書理解や情報検索,ウェブの監視など様々な場面で必要不可欠なものとなる.しかし,これら全てを人手で発見し補完することはもはや不可能であるため,計算機により自動でかつできる限り迅速に収集することが望ましい. そこで本研究では,事物のデータベース構築の支援のため,リアルタイムに次々と新しい情報が発信されるソーシャルメディアストリームを対象とし,そこから新しい事物や概念を指す新固有表現を精度良く発見することを目指す. 提案手法は新固有表現が最初に出現する時にその新規性を示唆するような文脈で出現することに着目し,そのような文脈を含むツイートをWikipediaを用いたDistant Supervisionで自動的かつ大量に獲得し,それらのツイートから新固有表現を発見する系列ラベリングモデルを学習する. 実験では実際の一週間分のツイートに対して,辞書に未登録のものを新固有表現と判定するベースラインと提案手法を適用し,後者がより精度良く新固有表現を発見できることを示す.

著者関連情報
© 2018 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top