人工知能学会全国大会論文集
Online ISSN : 2758-7347
第37回 (2023)
セッションID: 4Xin1-08
会議情報

大規模言語モデルとヒューリスティクスに基づくreadme生成
*是枝 祐太森下 皓文今一 修十河 泰弘
著者情報
会議録・要旨集 フリー

詳細
抄録

プログラムコードの再利用はソフトウェア開発における基本的な生産性向上方法であるが,コードレポジトリの説明文 (readme) は整備コストが高く,しばしばreadmeが整備されないことがコードの再利用を妨げている.近年報告された研究は関数・クラスなど数十行のコードに具体性の高いコメントを付与するが, readmeの生成においては数万から数百万行のコードを抽象的に要約して生成を行う必要があるため,コメント生成技術をreadme生成の問題にそのまま適用することはできない.本研究では,レポジトリが実施することの概要を示す代表的なコード断片 (代表コード) をヒューリスティクスと弱教師付き学習により抽出することで,大規模言語モデルでreadmeを生成できることを示した.主観評価と自動評価により,提案手法の有効性を確認した.

著者関連情報
© 2023 人工知能学会
前の記事 次の記事
feedback
Top