知能と情報
Online ISSN : 1881-7203
Print ISSN : 1347-7986
23 巻 , 2 号
選択された号の論文の24件中1~24を表示しています
目次
巻頭言
特集:「顔の情報処理」
解説特集
特集論文: 顔の情報処理
原著論文
  • 山口 純平, 嶋田 和孝, 榎田 修一, 江島 俊朗, 遠藤 勉
    2011 年 23 巻 2 号 p. 137-145
    発行日: 2011/04/15
    公開日: 2011/07/08
    ジャーナル フリー
    本稿では,隠れに頑健な人物識別手法として,顔特徴とコンテキスト情報を用いた手法について報告する.本手法では,顔特徴として正面顔と目,鼻などの顔部品を用い,CLAFIC法により類似度を求める.またコンテキスト情報には衣服の情報を使用し,衣服特徴として4つの特徴を用い,それぞれ類似度を求める.これらの特徴から得られた類似度を統合し,人物識別を行う.顔の一部が隠れた画像に対して,顔特徴のみで識別を行った場合の結果と本手法で識別を行った場合の結果を比べることで,コンテキスト情報として衣服特徴を用いることの有効性を確認した.
  • 高橋 毅, 景山 陽一, 西田 眞, 若狭 亜希奈
    2011 年 23 巻 2 号 p. 146-156
    発行日: 2011/04/15
    公開日: 2011/07/08
    ジャーナル フリー
    論文概要:L*a*b*表色系を用いて得られた口唇の形状および発話に伴う動き特徴は,個人識別や非接触インタフェースの有用な入力情報となること,口唇の動きは発話されたコマンドを識別する特徴量として有効であることが明らかとなっている.しかしながら,L*a*b*表色系に着目した従来技術は,発話動画像における発話区間の検出をオペレータの目視で行っており,自動推定を行うまでには至っていない.そこで本論文は,個人識別ならびに発話認識などのインタフェースにおける発話区間の自動推定を目的とし,発話動画像の連続したフレームから発話フレームを自動検出する手法を提案する.提案手法は,発話時の口唇画像における L*a*b*表色系の色彩情報および口唇形状の時系列変化を特徴量として用いる手法であり,次の3つのステップから構成される.はじめに,発話時の時系列顔画像から口唇を抽出する.次に,口唇の垂線上におけるL*およびa*の推移に着目して口裂(口を閉じたときの上唇と下唇の境界)の有無を調べ,各フレームにおける口の開閉状態を判定する.最後に,3フレーム間における口唇形状の時系列変化から発音の過程で閉口状態となった発話フレームを判定する.5つの母音全てを含む人名を発話内容として,被験者5名による実験を行った結果,約99.2%の精度で発話フレーム検出が可能であることが明らかとなった.
  • 間所 洋和, 佐藤 和人, 門脇 さくら
    2011 年 23 巻 2 号 p. 157-169
    発行日: 2011/04/15
    公開日: 2011/07/08
    ジャーナル フリー
    本論文では,表情空間の動的多様性を定量化する表情空間チャートという枠組みを提案する.表情空間チャートは,「喜び」,「怒り」,「悲しみ」の3表情を対象として,各表情の覚醒度を軸とする表情の表出レベルをチャート状に表現したものであり,教師なしニューラルネットワークのSOM(Self-Organizing Maps)とFuzzy ART(Adaptive Resonance Theory)を用いて生成する.評価実験では,Ekman が定義した基本6表情の中から「喜び」,「怒り」,「悲しみ」の3表情を対象として,被験者 10 名の7週間から 20 週間に及ぶ独自の長期表情画像データセットを構築し,各被験者の表情空間チャートを生成した結果,被験者間の表情の多様性と各被験者における時系列変化を可視化することができた.更に,表情空間チャートから人間が抱える心理的ストレスが表情に与える影響について分析するために,心理的ストレスシートを用いて慢性的ストレスを測定し,SVM(Support Vector Machines)によりストレスレベルを推定した.その結果,10 名全体で 68.6%,10 週間以上の被験者5名では 77.4%の推定率が得られたことから,表情空間チャートからストレスレベルを推定できる見通しが得られた.
  • 野宮 浩揮, 宝珍 輝尚
    2011 年 23 巻 2 号 p. 170-185
    発行日: 2011/04/15
    公開日: 2011/07/08
    ジャーナル フリー
    表情の表出に深く関与していると考えられる,眉と目の端点や鼻と口の周囲の顔特徴点を顔画像から抽出し,無表情時と表情表出時の特徴点の相互関係の変化から表情を認識する手法を提案する.顔特徴点から容易に求めることのできる,2つの顔特徴点間の距離の変化や,3つの顔特徴点で構成される領域内の画素の輝度分布変化を特徴量として表情認識に使用するため,効率的な認識が可能となる.さらに,特徴量の分散比に基づいて特徴量の有用性を推定し,有用な特徴量のみを用いて主成分分析による特徴抽出を行うことにより,認識精度と認識速度のトレードオフを考慮した表情認識を行う.
  • 益子 行弘, 萱場 奈津美, 齋藤 美穂
    2011 年 23 巻 2 号 p. 186-197
    発行日: 2011/04/15
    公開日: 2011/07/08
    ジャーナル フリー
    これまで「笑顔」は「喜び」の感情が表出した表情として扱われてきた.しかしながら「笑顔」には「喜び」といったポジティブな感情だけでなく,「苦笑い」などネガティブな感情を示す語も日常的に用いられる.本研究では,日常用いられ,意味の違う5種類の「笑い」語から表出された表情について,表情の変化量とポジティブ度から分類を行った.クラスター分析およびクラスター間に検定を行い,変化量が小さくややネガティブな笑顔,変化量が中程度でポジティブ度も中程度の笑顔,変化量が大きくポジティブ度も大きな笑顔の3つのクラスターを設定した.さらにこれらの特徴を検討するため,運動解析ソフトを用いて顔の各部位の変化量を測定した.その結果,ポジティブ度が高くなるにつれ,眉尻は上がり,目の縦幅は狭くなり,口の縦幅は広くなるが口角の変化は小さくなることがわかった.特に変化の小さな笑顔は,口の変化量に対して眉・目は変化量が小さいため,口元の変化を元に笑顔の度合いが判断される可能性があると考えられる.3種の笑顔の心理的な影響を検討するため,それら笑顔について,人物印象評定を行った.因子分析の結果,[好感度][活力性][支配性][女性らしさ]の4因子まで検討した.変化が大きくなるほど[活力性][支配性][女性らしさ]が高いと評定されるが,[好感度]については変化量が大きくなるほど低くなることが明らかとなった.
  • 瀬尾 昌孝, 陳 延偉
    2011 年 23 巻 2 号 p. 198-210
    発行日: 2011/04/15
    公開日: 2011/07/08
    ジャーナル フリー
    従来,ワーピングは撮影機器中のレンズにより生じる歪み補正等で広く使用されてきた.近年では多くの映像作品や幅広い研究分野においても多用されており,これに関してメッシュワープやフィールドモーフィング・放射基底関数を用いた形状変化手法やB-spline変換(free-form deformation法)等,多くの手法が提案されている.このうちB-spline変換を基にしたfree-form deformation法はワーピング目標形状と実際のワーピング結果に多少の誤差を含有するものの,自然で滑らかな形状変化が可能な非常に有用なワーピング手法である.また,このワーピング誤差低減手法としてmulti-level B-spline変換という手法が提案されている.この手法はB-spline変換によるワーピングの特徴である自然さ・滑らかさを保ちつつ,誤差の低減を実現する手法である.しかしその反面,ワーピング誤差の低減に伴い従来のB-spline変換に比べ必要となる計算量も大幅に増加し,これが使用上のボトルネックとなっている.本論文ではこれらの問題を考慮し,適応的格子法と部分変形法という手法を提案することでB-spline変換・multi-level B-spline変換の計算時間削減と,ワーピング結果画像の見た目の自然さの向上を両立した.
  • 伊師 華江
    2011 年 23 巻 2 号 p. 211-217
    発行日: 2011/04/15
    公開日: 2011/07/08
    ジャーナル フリー
    本研究は,表情顔の魅力評価に関わる心理印象要因を明らかにすることを目的として,特定の感情を表出しないニュートラル形態(真顔),幸福の感情を表出するポジティブ形態(幸福表情顔),悲しみの感情を表出するネガティブ形態(悲しみ表情顔)の3種類の表出形態の顔画像を呈示刺激とする評定実験を行った.評定実験1では魅力度評定が行われ,真顔に比べて幸福表情顔の魅力度は高く,逆に悲しみ表情顔の魅力度は低いことが示された.評定実験2では魅力度評定とセマンティック・ディファレンシャル法による印象評定が行われ,表出形態ごとに魅力と印象の関係が分析された.その結果,真顔と悲しみ表情顔の魅力評価には顔の知的美感の印象が重要な要因であるのに対して,幸福表情顔の魅力評価には知的美感印象に加えて柔和印象も重要な要因であることが示された.このことから,表情間で魅力評価に関わる心理印象要因が異なる可能性が示された.幸福表情顔とは異なり,悲しみ表情顔の魅力評価には真顔と共通する心理的な基準が使われていると考えられる.
  • 小越 康宏, 三橋 美典, 小越 咲子, 中井 昭夫, 松浦 慎也, 荒木 睦大
    2011 年 23 巻 2 号 p. 218-227
    発行日: 2011/04/15
    公開日: 2011/07/08
    ジャーナル フリー
    表情認識の研究は,心理学の分野において古くから行われており,工学分野における表情認識の研究は心理学分野の研究の延長線上にある.代表的な方法に FACS (Facial Action Cording System) を用いたものがあり,これは解剖学的な観点から表情筋がどのように働くかを考慮し,視覚的に認識が可能な表情筋の特徴点を与え,それらの特徴点の動きを解析するものである.このような原理から表情解析は大掛かりとなる.我々は,従来の表情認識の研究ではあまり考慮されていない黒眼領域の変化に着目し,表情認識に非常に有効な情報となると考えた.実験により検証した結果,瞼の表情筋により黒眼領域の形状に独特のパターンが表れることと,瞬き動作を伴うことによって,その形状変化は表情により特有の変化をもつことが分かった.このことを応用し表情認識の可能性を論じる.
解説
報告
書評
用語解説
一般論文
原著論文
  • 宮田 龍太, 伊達 章, 倉田 耕治
    2011 年 23 巻 2 号 p. 243-253
    発行日: 2011/04/15
    公開日: 2011/07/08
    ジャーナル フリー
    これまで神経場のダイナミクスに関する研究が数多くされてきた.特に,局在興奮をもつ神経場は自己組織化マップ(SOM,Self-Organizing Map)のアルゴリズムの基礎をなしている.そこで我々は神経振動子場に着目し,局在振動をもつ3層の神経振動子場のモデルを提案する.2つのメキシカンハット型層内結合をもつ神経振動子場は1つないし2つ以上の局在振動を外部入力の複数の極大付近に安定して保持し,また各局在振動内では同位相に,そして異なる局在振動間では位相差を最大にするように位相を引き込むことがわかった.この神経振動子場は,情報分離に伴う結び付け問題を解く振動子型SOMの構成要素になりうる.
  • 市橋 秀友, 本多 克宏, 野津 亮
    2011 年 23 巻 2 号 p. 254-263
    発行日: 2011/04/15
    公開日: 2011/07/08
    ジャーナル フリー
    ファジィc平均識別器(Fuzzy c-Means Based Classifier, FCMC)はクラスタリングを基にした識別器であり,訓練データが大量であればクラスター数を多くすることで訓練データに対する精度を向上できると考えられ,そのような性能比較も行われている.一方,テストデータに対する性能(汎化性能)はクラスター数を増やしても必ずしも改善されない.特に比較的少量の訓練データではクラスター数を多くするとオーバーフィットするだけでなく,各クラスターに含まれる訓練データが少なくなるために,共分散行列やクラスター中心が正確に求まらず性能が悪くなる.クラス毎のクラスター数を2とし,1000件以下の訓練データでの性能は既に報告されている.本論文では大量訓練データを用いて訓練データ数が変化した場合の性能をクラス毎のクラスター数を8まで増やして比較する.訓練データが比較的少量の場合を考慮し,識別器はクラスター数を余り多くせずに,逆に訓練データに対して最適化するパラメータ数を多くした場合の比較とする.世界的に実用可能なツールとして認められているLibSVMを用いて,訓練データ数が変化することによるテストデータの識別精度と訓練時間とテスト時間(検出時間)への影響を比較する.訓練データが10倍になった時の訓練時間は,FCMCでは10倍になるが,LibSVMでは約100倍になる.
学会から
会告
feedback
Top