ソフトウェア工学の基礎ワークショップ論文集
Online ISSN : 2436-634X
第31回ソフトウェア工学の基礎ワークショップ(FOSE2024)
会議情報

CodeT5 と正規表現を活用した\\不適切な変数名の自動検出法とその評価
森 哉尋阿萬 裕久川原 稔
著者情報
会議録・要旨集 フリー

p. 35-44

詳細
抄録

変数名は単なる識別子というだけでなく,処理内容を適切に表現していることが望ましい. 一般に変数名の適切さ評価には人手によるコードレビューが必要であり,それだけに工数のかかる作業となっている.これまでに,変数名そのものやそれを取り巻くソースコードの特徴をメトリクスによって数値化し,機械学習(ランダムフォレスト)によって名前変更発生の有無を予測する手法が知られているが,コードの文脈までは考慮できていなかった.そこで本論文では,大規模言語モデルの 1 つである CodeT5 を使ってコードの文脈を考慮した評価を行うことを考え,そこに正規表現によるパターンマッチングも組み合わせることで不適切な変数名を自動的に検出する新たな手法を提案している.そして,実際に人手によって行われたコードレビューデータに対する評価実験を行い,提案手法をランダムフォレストを用いた従来手法と併用することでより良い検出が可能であることを報告している.

著者関連情報
前の記事 次の記事
feedback
Top