主催: 人工知能学会
会議名: 第102回言語・音声理解と対話処理研究会
回次: 102
開催地: 国立国語研究所 講堂
開催日: 2024/11/28 - 2024/11/29
p. 18-19
国立国語研究所共同研究プロジェクト「多世代会話コーパスに基づく話し言葉の総合的研究」(2022~2027年度)では、2022年に公開した『日本語日常会話コーパス』(CEJC)で不足する子どものデータを補充するために、子どもを中心とする多様な場面・相手との会話を対象とする『子ども版日本語日常会話コーパス』(CEJC-Child)の構築を進めている。CEJC-Childは、CEJCと同様、日常場面の中で自然に生じる会話を対象とし、音声データだけでなく映像データも記録・公開することを目指している。収録対象は8世帯12名の子どもであり、コーパスの規模は100時間である。このうち50時間のデータを対象に2024年度中にモニター公開する予定である。本発表は、CEJC-Childの会話の収録法やコーパスの構築状況について説明し、モニター版として公開するデータの一部を紹介する。