人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
セッションID: 2G6-GS-6-04
会議情報

プログラミングコードとコメント解析による分析者意図の抽出
*黒岩 久登早矢仕 晃章
著者情報
会議録・要旨集 フリー

詳細
抄録

近年ビッグデータの普及によりデータサイエンスが発展している一方、データサイエンス人材不足が課題となっている。その原因の一つに、データ分析手法の複雑化などが考えられる。本研究では、データ分析における専門知識の習得と理解を促進するため、Kaggleプラットフォームに提出されたPythonノートブック形式データから分析者とコードの関係性を探索した。具体的には、コードをタイトルで分類し、Tier(熟練度)別にコード行数、マークダウンセル行数、ユーザ定義関数の数を集計、更にCovid-19に関する分析のマークダウンセルコメントに関して単語の共起ネットワークを作成し、異なるTier間での共起パターンを把握した。結果として、分析トピックやコード行数、マークダウンコメント行数はTierごとに異なることが確認された。また、コメント内で共起する単語は、Tier間でも共通性が見られたが、Covid-19というトピックにおいては異なる手法が混在しており、またコメントに多国語が使用されるなど、新たな分析手法の確立が必要であることが課題として挙げられた。

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top