主催: 一般社団法人 人工知能学会
会議名: 2024年度人工知能学会全国大会(第38回)
回次: 38
開催地: アクトシティ浜松+オンライン
開催日: 2024/05/28 - 2024/05/31
・ 本稿においては、生成AI開発のためのデータセットを構築・利用・公開する際に問題となる法規制とそのクリア方法について、特によく問題となる法規制(著作権法及び個人情報保護法)の概要について解説をした後に、収集対象データをテキスト、画像、音声に分けて個別に検討する。 ・ 日本著作権法上、データセットの構築・利用のために他人の著作物を収集・複製することは、アカデミアに限らず民間企業においても原則として自由である。もっとも近時、特にウェブ上のテキストデータを大規模に収集する行為に関して批判的な意見も増えてきており注意が必要である。 ・ 日本の個人情報保護法上、個人情報を収集する行為については、原則として不正な手段による個人情報の取得禁止と利用目的の特定・公表等のみが義務づけられている。そのため、AI開発のためのデータセット構築の際に個人情報を含むデータを収集する点については要配慮個人情報の取得を除いて大きな法的障害はないが、個人情報を含むデータセットを公開する場合にはいくつかの点に留意が必要である。