電気関係学会九州支部連合大会講演論文集
平成21年度電気関係学会九州支部連合大会(第62回連合大会)講演論文集
セッションID: 02-1A-09
会議情報

高速復元可能な接尾辞配列圧縮法
田中 洋輔小野 廣隆定兼 邦彦山下 雅史
著者情報
キーワード: 情報基礎論
会議録・要旨集 フリー

詳細
抄録
大規模データに対する高速な文字列検索は接尾辞配列 (SA) を用いて実現できるが, SAには多くの容量が必要になってしまう. SAを圧縮する様々な方法が提案されているが, 本論文では出現頻度の高いフレーズの検索が既存の圧縮法に比べて性能が良いような圧縮方法を提案する. 提案手法では, SAを大きさSのブロックに分割し, そのブロック内でソートを行い, 差分を取ったものを保存し, 検索時は差分からソート後のSAを取り戻し, 区間S内を全て逐次的に検索する. 最終的には実験により特に検索フレーズの頻度が高い場合, 多くの入力データで提案手法の性能が既存の方法より優れていることを示す.
著者関連情報
© 2009 電気関係学会九州支部連合大会委員会
前の記事 次の記事
feedback
Top