人工知能学会研究会資料 言語・音声理解と対話処理研究会
Online ISSN : 2436-4576
Print ISSN : 0918-5682
102回 (2024/11)
会議情報

『子ども版日本語日常会話コーパス』モニター版
川端 良子居關 友里子小磯 花絵
著者情報
会議録・要旨集 フリー

p. 18-19

詳細
抄録

国立国語研究所共同研究プロジェクト「多世代会話コーパスに基づく話し言葉の総合的研究」(2022~2027年度)では、2022年に公開した『日本語日常会話コーパス』(CEJC)で不足する子どものデータを補充するために、子どもを中心とする多様な場面・相手との会話を対象とする『子ども版日本語日常会話コーパス』(CEJC-Child)の構築を進めている。CEJC-Childは、CEJCと同様、日常場面の中で自然に生じる会話を対象とし、音声データだけでなく映像データも記録・公開することを目指している。収録対象は8世帯12名の子どもであり、コーパスの規模は100時間である。このうち50時間のデータを対象に2024年度中にモニター公開する予定である。本発表は、CEJC-Childの会話の収録法やコーパスの構築状況について説明し、モニター版として公開するデータの一部を紹介する。

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top