抄録
神田(2019b)[1]では,考察において,伝統的な手話学の枠組みである「手話の音素」による類似手話の成分分析とOpenPose[2]による光学的なデータ分析が対比された.これまでの手話の光学的分析は手話の音素を先験的情報として画像処理をしており,モーションキャプチャ(mocap)を用いた分析も同様であった.このため手型データ取得に拘り,大がかりな仕組みと設備を用意し,人的資源と高額資金を要してきた.それはそれなりの研究価値をもつと考えられるが,反面研究者数が限定されるという弱点があった.本論では次の仮説を検証した.
仮説 片手手話では手首に変化が大きく表れる
本論での検証の結果,手話の動きには特徴的な成分があり,その成分をコアにすることで,認識率を高める可能性があることが示された.とくに本論が対象とした片手手話においては右手首の動きに特徴が出ることが示された.本論の着想は髙橋(2019)の弱点を補強するという視点であるから,検証対象の手話を認識率の低かった語彙に限定している.そのため手話全般に敷衍できるかどうかは,他の語彙についても検証を要するであろう.
本論ではz軸(前後)方向の重要性も示された.本論ではOpenPoseによるxy軸データとmocapデータの比較であったが,z軸による分析も必要性も暗示している.この方法は実験室のような環境で録画と同時に分析する場合には有効だが,社会実装する段階や,既にある大量のビデオ画像を活用するには適用できない.新たに2カメラによる大量の手話データをとることは容易ではない.2次元座標データから3次元データを推定する手法の開発が望まれる.それには運動生理学的知見を取り込む必要があろう。
本論の結果は伝統的手話学の枠組みを援用した手話の工学的分析は非能率であることも副次的に証明したともいえる.本論で活用したmocapやOpenPoseといった最近の技術を活用するには,伝統的手話学の枠組みである手話の音素に拘らず,新手話学の像素の概念利用が有効であることも示されたと考える.