参照記述の表記揺れ同定問題に対するアプローチ

相澤 彰子; 宮田 淳平

doi:10.14864/fss.25.0.144.0

抄録

データベースを利用した統計データ分析において、同じ対象を指示する記述のグループ化は避けて通ることができない重要な前処理である。特に大規模なデータベースで表記のばらつきが大きい場合には、辞書や正規化ルールの構築に要するコストは大きなものになる。そこで本稿では、名前同定の自動化の可能性について検討し、(i) 与えられた任意の２つの記述が同じ対象を指示するかどうかを判定する２値分類器、および (ii) 同一指示の記述どうしを結んで得られるネットワーク構造上でのグラフ・クラスタリングの適用について考察する。

著者関連情報

お気に入り & アラート

お気に入りに追加
追加情報アラート
被引用アラート
認証解除アラート

閲覧履歴

回復期リハビリテーション病棟での漢方薬導入の補完療法としての意義
Validation of Sink Capacity Estimation Based on the Product of Thousand Grain Weight and Number of Grains in High-yielding Rice Cultivars
石油産業におけるデジタル技術適用の動き
仙台青葉山・川内だより
Patient-oriented prosthetic treatment; a case report of a patient with a few teeth existing teeth and cardiovascular disorders

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）