主催: 吉田 則裕, 槇原 絵里奈
会議名: 第30回ソフトウェア工学の基礎ワークショップ(FOSE2023)
開催地: 三重県鳥羽市
開催日: 2023/11/09 - 2023/11/11
p. 135-140
近年,IT需要の拡大に伴って,開発効率向上のため,開発支援ツールを活用して開発が行われている. その中の一つとして,2022年にGitHubが公開したGitHub Copilotがある. GitHub Copilotは大規模言語モデルをベースとしたコード推薦ツールの一種であり, 仕様を記述したコメントや,記述中のプログラムをもとに開発者に対してコードやライブラリを推薦する. 一方,大規模な事前学習済み言語モデルは,入力によって出力が大きく異なることが知られている. そこで,本稿では,言語間の学習データ量の違いに着目し,入力言語の違いがCopilotの性能にどのような影響を与えるのか調査を行った. 調査の結果,入力言語の違いによってGitHub Copilotの性能に差が生じることが明らかになった. また,調査結果によって明らかとなった大規模言語モデルに対する問題点を示す.