人工知能学会全国大会論文集
Online ISSN : 2758-7347
第37回 (2023)
セッションID: 2D4-GS-2-04
会議情報

SoC環境におけるGPUベース物体検出CNNの性能評価
*上杉 拓也後町 将人河上 裕太酒巻 洋
著者情報
会議録・要旨集 フリー

詳細
抄録

画像認識および物体検出に利用され、近年ではSystem on Chip(SoC)環境にも実装されているCNN(Convolutional Neural Network)は、Convolution層の演算量が多いため、SoC環境では性能が劣化する可能性がある。本研究では、Convolution演算のSoC内蔵GPU向け高速化検討として、Convolutionを行列積で解くアルゴリズムをOpenCLで実装して物体検出アルゴリズムYOLO-Nanoの処理時間をIntelおよびQualcommのSoC内蔵GPUで測定した。その結果、Tensorflow Lite CPUに対し、QualcommおよびIntelのCPUでは、それぞれ1.04倍、6.37倍の速度改善効果が得られ、GPUでは、それぞれ1.21倍、1.52倍の速度改善効果が得られた。

著者関連情報
© 2023 人工知能学会
前の記事 次の記事
feedback
Top