コンピュータ ソフトウェア
Print ISSN : 0289-6540
Cross-Polytope LSH を用いた コードクローン検出のためのパラメータ決定手法
徳井 翔梧吉田 則裕崔 恩瀞井上 克郎
著者情報
ジャーナル フリー

2021 年 38 巻 4 号 p. 4_60-4_82

詳細
抄録

コードクローンとは,ソースコード中に存在する互いに一致または類似した部分を持つコード片のことである.横井らが提案したコードクローン検出ツールCCVoltiは,情報検索技術であるTF-IDFと近似最近傍探索アルゴリズムCross-Polytope LSHを利用して,従来の手法では困難であった意味的に類似するコードクローンを高速に検出可能とした.しかし,CCVoltiは検出時間がCross-Polytope LSHに大きく依存し,Cross-Polytope LSHによるコードクローンの検出漏れが発生するという問題点がある.本研究では,クローン検出の利用者が与えた再現率の目標値を満たしつつ,できるだけ時間を短縮することを目的として,プロジェクトの規模から適切なパラメータ値を求める線形回帰モデルを構築し,コードクローン検出対象に適したCross-Polytope LSHに与えるパラメータ値の組を決定する手法を提案する.さらに,20個のプロジェクトに対して本手法で決定されたパラメータ値をCCVoltiに適用し,コードクローン検出する評価実験を実施して本手法の有効性を示す.

著者関連情報
© 2021, 日本ソフトウェア科学会
前の記事 次の記事
feedback
Top