自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
関係データベースを用いた構文木付きコーパス検索手法
橋本 泰一吉田 恭介野口 正樹徳永 健伸田中 穂積
著者情報
ジャーナル フリー

2007 年 14 巻 4 号 p. 3-22

詳細
抄録

本論文では, 構文木をクエリとして与え, 構文木付きコーパスからクエリと同じ構文木を部分木として含む文を検索する手法を提案する.構文木付きコーパスは, 関係データベースに格納する.このような構造検索の過去の研究では, クエリの節点数が増加すると, 検索時間が大幅に増加する問題があった.本論文で提案する手法は, 節点数が多いクエリを部分木に分割し, 漸進的に検索することで検索を効率化する.クエリの分割の単位やその検索順序は, 検索対象となるコーパス中の規則の出現頻度をもとに自動的に決定する.本手法の有効性を確認するために7種類のコーパスを用いて評価実験を行ったところ, 4種類のコーパスで分割の有効性が確認できた.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top