画像電子学会誌
Online ISSN : 1348-0316
Print ISSN : 0285-9831
ISSN-L : 0285-9831
48 巻, 2 号
選択された号の論文の18件中1~18を表示しています
随想
IoT社会の進展を支える画像電子関連技術論文特集
論文
  • 河村 尚登(フェロー)
    2019 年 48 巻 2 号 p. 221-227
    発行日: 2019年
    公開日: 2022/02/10
    ジャーナル フリー

    グリーンノイズ特性を示すドットパターンを用いて画像データに情報を埋め込むブロック型の不可視電子透かし法において,コード情報からなる主情報のほかに,二値パターンを副情報として情報の多重埋め込みを可能とする手法を提案する.主情報はグリーンノイズパターンで透かし情報として埋め込み,視認されにくく,強靭(robust)な耐性を示す.副情報は,主情報のスペクトルと重ならない高周波数域に分布するパターンで埋め込み,脆弱(fragile)な透かしとなる.それぞれ異なる抽出器により抽出することが可能である.利用形態として,著作権の保護,改竄検出,原本確認,不正流出の追跡などへの適用を可能とする.また,副情報は印刷用地紋や,ブロック同期用のマーカとしても利用可能である.

  • 八木 賢太郎, 長谷川 邦洋, 斎藤 英雄(正会員)
    2019 年 48 巻 2 号 p. 228-236
    発行日: 2019年
    公開日: 2022/02/10
    ジャーナル フリー

    近年,画像中から任意の物体を消去し,まるでその物体が存在していないかのような画像を生成する技術が盛んに研究されている.こうした技術は画像中に写り込んだ人物のプライバシーの保護など様々な目的で用いられている.しかしながら既存研究には「複数カメラが必要である.」,「消去対象物体が静止している必要がある.」,「背景が平面である」といった制約があった.そこで本研究ではハンドヘルドカメラ一台のみを用いて撮影され,かつカメラ撮影者と消去対象人物の両方が移動を行うような,動的シーンに対して使用可能な人物消去技術を提案する.また,背景の3次元形状復元を行い,それを元に人物消去を行うため,任意の背景を持つシーンに対して使用可能である.実験では物体消去を行う複数の既存手法との比較を行い提案手法の優位性を示す.

システム開発論文
  • 初田 慎弥, 大野 真史, 孟 林, 泉 知論(正会員)
    2019 年 48 巻 2 号 p. 237-247
    発行日: 2019年
    公開日: 2022/02/10
    ジャーナル フリー

    本稿は,獣害対策のための監視カメラシステムの実現を目指し,アライグマを対象に機械学習の害獣認識への適用評価と組込み実装の試行,さらにデータセットの構築とそれによる認識精度の向上を報告する.まず,鳥獣飼育施設で撮影した動物の画像を用いて構築したデータセットに基づき,HOG特徴量とサポートベクタマシンによる分類器(HOG + SVM),HOG特徴量とニューラルネットワークによる分類器(HOG+NN),畳み込みニューラルネットワークによる分類器(CNN)の3つを作成した.正答率と実行時間を評価・比較したところ,HOG+NNが速度で勝り,CNN が正答率で勝ることがわかった.この2つを監視カメラ等で用いられる組込みプロセッサ上に実装し性能の基礎評価を行ったところ,HOG+NNは正答率88.5%でVGAサイズの画像の処理に約8.7秒と比較的高速であったのに対し,CNNは94.5%と高い正答率を示したが45.8秒を要した.次に,正答率の高いCNNについて実際に寺社の監視カメラで撮影されたアライグマ画像を用いて評価した.寺社での実際の画像では正答率が20-30%に低下したが,複数の異なる画像セットを組み合わせることで60%程度に向上することを示した.さらに高速化を検討し,背景差分を用いて候補を絞ることで組込みプロセッサ上でも,数秒以下に抑えることができた.学習データを注意深く作成したCNNに,背景差分などの既存の画像処理技術を組み合わせることで,監視カメラ上でもアライグマ自動検出が実現できることがわかった.

  • 菅谷 至寛, 坂井 清士郎, 宮崎 智, 大町 真一郎(正会員)
    2019 年 48 巻 2 号 p. 248-257
    発行日: 2019年
    公開日: 2022/02/10
    ジャーナル フリー

    スマートフォンのカメラで撮影した文字情報を認識し,それを基にした情報提供を行うアプリが普及しつつある.今後の発展が期待されるが,手を自由に使えない状況や,身体にハンディキャップがある方には利用しづらい.そのような状況での情報提供システムに適したデバイスとしてスマートグラスがあるが,著者らの知る限り,情景画像中の文字認識のために必要な性能を備え,作業や行動の邪魔にならないものは存在しなかった.そこで本稿では,環境中文字認識を利用した情報提供アプリケーションのためのウェアラブルシステムを開発した.試作したデバイスは情景画像中文字認識に耐えうるカメラと,装着したままの作業や行動に支障がないディスプレイを備える.また,外部PCまたはクラウド上のサーバと通信するための機能を持ち,そのためのAPIも整備した.さらに,試作デバイスはカメラ以外の入力デバイスを持たないため,そのような状況に適したユーザーインタフェースを開発した.路線図の駅名を認識して駅に関する情報を表示するサンプルアプリケーションを実装してユーザーインタフェース及びシステム全体の評価実験を行い,リトライが許されるタスクでは実用の範囲にあることを確認した.

ショートペーパー
画像電子の世界と現実世界を相互につなぐ技術論文特集
論文
  • 伊達 宗和, 越智 大介, 木全 英明(正会員)
    2019 年 48 巻 2 号 p. 264-272
    発行日: 2019年
    公開日: 2022/02/10
    ジャーナル フリー

    少数の指向性画像を演算処理せずにそのまま表示するだけで,なめらかな運動視差を再現可能な,フラットパネル裸眼3Dディスプレイを提案する.これまで,人間の視覚の二重像知覚の特性に着目し,指向性画像をディスプレイ内部で光学的にリニアブレンディングを行うことにより角度方向に補間する方法を提案してきた.しかし,投射型表示によるプロトタイプは,装置サイズが大きく,画像の歪の除去が困難であった.今回,RGB横ストライプの液晶パネルと,開口幅が画素の幅とほぼ等しいストライプ状のバリアを用いることだけで,水平方向のなめらかな運動視差を歪みなく表示できたので報告する.レンズのない構成は原理的に歪みやぼけを生じる要因がないので高画質となる.さらに,リニアブレンディングによる表示を空間周波数の観点から整理し,補間画像が知覚される原理を視覚システムのカットオフを想定するだけで光学的に説明できることを示した.

ショートペーパー
  • 川西 康友(正会員), 出口 大輔, 井手 一郎, 村瀬 洋
    2019 年 48 巻 2 号 p. 273-277
    発行日: 2019年
    公開日: 2022/02/10
    ジャーナル フリー

    本稿では,過去に別途検出されたことがある人物について,検出した時に得た知識を事前知識として利用することで,その人物を再び検出する際に精度よく検出する「人物再検出」という概念を提案する.また,この概念を車載カメラ映像中の人物検出に適用する方法を示す.本研究では自車がある地点で人物の検出をする際,自車より前にその人物の近くを通過した他車が,先にその場所の近くでその人物を検出している可能性が高いことに着目し,他車による観測を事前知識として人物再検出を行なう.実験により,独自に収集したデータセットを用いた評価において,事前知識を用いることで大きく検出性能が向上することを示す.

コーヒーブレイク
論文
  • 藤田 秀, 美川 翔, 高橋 桂太(正会員), 藤井 俊彰(正会員)
    2019 年 48 巻 2 号 p. 281-289
    発行日: 2019年
    公開日: 2022/02/10
    ジャーナル フリー

    密な多視点画像として一般に解釈される光線空間を取得するためのデバイスに,multi-focused plenoptic camera(MFPC) がある.MFPCで取得可能な多視点画像は,高い空間及び視点解像度をもつことに加え,深い被写界深度をもつ.そのため,コンピュータビジョンなどの分野において,MFPCに注目が集まっている.しかしながら,MFPCの光学系は複雑であることから,高品質な多視点画像を生成するために複雑な処理が求められる一方で,その多視点画像の生成手法を検討した研究はほとんどない.更に,MFPCから多視点画像を生成する点で我々の知る限り唯一であるソフトウェアは,カメラの構成によっては高品質に多視点画像を抽出できないことがある.したがって我々は,高品質な多視点画像を生成するための手法を提案し,提案手法を実装したソフトウェアを公開することとした.我々のソフトウェアは従来公開されていたソフトウェアと比べて,より高品質な多視点画像を生成可能であり,様々なカメラ構成でも動作が可能である.

  • 河村 尚登(フェロー)
    2019 年 48 巻 2 号 p. 290-302
    発行日: 2019年
    公開日: 2022/02/10
    ジャーナル フリー

    印刷耐性のある不可視型で可逆の高耐性電子透かし法を提案する.付加するグリーンノイズパターンは,そのスペクトルが特定の帯域fmaxfminに閉じ込められ,プリンタではMTF応答性が高いが,人の視覚系では明視の距離では低い応答性を示すため視認されにくい.このため,埋め込み強度を強くした印刷物でも高画質性が保たれたまま透かし情報が保持される.埋め込みは,実空間(画素空間)にて埋め込みビットの0,1に対応した2種類の異なるパターンでブロック単位に埋め込む.グリーンノイズパターンと画像のスペクトルとは重なりが少ないため,画質に与える影響は少ない.抽出は周波数空間でスペクトルパターンを識別して行う.埋め込みパターンは専用の“鍵”でのみ除去できる.この鍵は乱数のSEED値を変えればほぼ無限に発行できるため,画像ごとに鍵を変えれば,盗まれても他の画像の透かしを除去できない.秘密性はこの鍵に集約されるため,アルゴリズムの公開は第三者からの攻撃の助長とはならない.また,ブロック型の課題であるブロック同期の方法として,グリーンノイズスペクトルと重ならないマーカパターンを埋め込み,実空間で抽出することにより,高精度に同期をとることが可能となる.本論文では,著作権保護およびAnnotationの2つの運用形態について検討した.Annotationでは信頼度を見ながら,埋め込み強度(gain)を自動調整することにより,抽出の信頼度を向上することが可能である.

  • 加藤 卓哉, 深山 覚, 中野 倫靖, 後藤 真孝, 森島 繁生(正会員)
    2019 年 48 巻 2 号 p. 303-314
    発行日: 2019年
    公開日: 2022/02/10
    ジャーナル フリー

    3DCGスピーチアニメーションにおいて,口形と同程度に口形以外の表情や顔の回転はキャラクタの印象を大きく左右する.特に歌唱アニメーションでは,口形の動きや顔の回転が心理学的にも重要であることが知られており,その制作には多大な労力がかけられている.そのため簡易な入力から歌唱時の表情や頭部回転情報を推定する技術が求められている.本論文では,歌声から歌唱時の口形情報を推定し,歌声情報と楽曲情報と共に入力とすることで,目周辺の動作や頭部回転情報を自動生成する手法を提案する.歌声の音響特徴,歌唱者の口形などの表情特徴,ビートやメロディーなどの楽曲が持つ楽曲の特徴を入力として用いて,時系列データの学習に適した機械学習手法による表情パラメータの生成モデルを構築した.本論文の有効性を示すために,正解データとの精度評価に加えて,学習する歌唱者の違いや,学習する楽曲の違いなどに応じて生成された異なる表情アニメーションについて主観評価実験を行った.

連載技術解説
グループ紹介
スキャニング
feedback
Top