画像電子学会誌
Online ISSN : 1348-0316
Print ISSN : 0285-9831
ISSN-L : 0285-9831
39 巻, 5 号
Special Issue on Image Electronics and Related Technologies towards User Value Creation and Innovation
選択された号の論文の23件中1~23を表示しています
ユーザー価値の創造・革新を追及する画像電子関連技術論文特集号
論文
  • 上條 秀一, 宮島 雄一, 松井 淳, 中田 洋平, 村松 大吾, 松本 隆
    2010 年39 巻5 号 p. 571-579
    発行日: 2010/09/25
    公開日: 2011/08/25
    ジャーナル フリー
    パーティクルフィルタを用いた複数物体追跡において,尤度関数にCross Entropyを組み込んだ追跡手法を提案し,高速化を図る.従来,尤度関数にBhattacharyya距離やKL距離などを用いた手法が存在するが,これらは各時刻でのサンプルのヒストグラム生成に時間がかかる.これに対し,Cross Entropyを組み込む手法では,サンプルのヒストグラムを生成せずに尤度計算を実行できるため,高速化が期待できる.また,オクルージョンに対し頑健なアルゴリズムとするために,背景情報を考慮することが有効であると考えられる.Cross Entropyを尤度に組み込む手法では,計算コストを増加させずに 背景情報を考慮することができるため,高速でかつオクルージョンにも頑健なアルゴリズムとすることが可能である.Bhattacharyya距離(従来手法)による手法との比較実験により提案手法の有効性,並びにサンプル数による影響を検証する.
  • Chengjiao GUO, Ying LU, Takeshi IKENAGA
    2010 年39 巻5 号 p. 580-589
    発行日: 2010/09/25
    公開日: 2011/08/25
    ジャーナル フリー
    Object tracking is one of the most important applications in the field of computer vision. One of the common problems in object tracking is object occlusions. Especially in the presence of long-term full occlusion, or called long-lived full occlusion, during which the target remains invisible for tens of frames, the tracking is more difficult. This paper proposes an occlusion handling scheme based on particle filter. Compared with the conventional particle filter which usually utilizes color as tracking cue, multiple likelihood models: HSV color and gradient orientation likelihoods, are employed in the observation model during occlusion. The incorporation of these two features makes the target distinguishable even if it is occluded by a similar colored object in the background. Also, multiple state noises are introduced to ensure the redetection of the target at the end of full occlusion as well as keeping tracking accuracy under occlusion. Experimental results under different occlusion conditions show that the proposed particle filter achieves robust and accurate performance compared with the particle filter with appearance adaptive models and the color particle filter, even in the condition of long-lived full occlusion.
  • 佐々木 毅, 河根 広大, 池永 剛
    2010 年39 巻5 号 p. 590-597
    発行日: 2010/09/25
    公開日: 2011/08/25
    ジャーナル フリー
    安全・安心な社会の実現のため,監視カメラシステムの重要性が増している.監視映像から異常を検知するためには,特に実時間で対象物体の動きを解析する技術が重要となる.そこで,我々はオプティカルフローの一種であるKLT Trackerに注目し検討を進めてきているが,追跡精度や低コスト化に課題があった.本稿では,人などの動きを高精度に検出するための手法として,重みマスクによるスコア値操作と特徴点間隔の適応処理を提案する.また,これらの手法を低コストかつ実時間処理で実現するため,重み値生成回路,しきい値を用いた挿入位置計算回路,特徴点データ更新回路などのアーキテクチャを提案し,普及型FPGAへの実装を行った.提案アルゴリズムを種々の画像に適用した結果,動きベクトルを高精度に取得可能であることを確認した.また,ハードウェア設計を行い評価した結果,20%程度のFPGAリソースで実時間処理可能なことを確認した.
  • 張 放, 菅谷 至寛, 大町 真一郎, 阿曽 弘具
    2010 年39 巻5 号 p. 598-605
    発行日: 2010/09/25
    公開日: 2011/08/25
    ジャーナル フリー
    デジタルカメラなどで撮影された情景画像中の文字抽出および認識に 関する研究が活発に行われている.このような文字画像の認識を困難とする要因には,照明の非均一さや 幾何学的変形を受けることなどが挙げられる.本稿では,これらの要因のうち幾何学的変形に着目する.幾何学的変形がアフィン変換と仮定できる場合,回転角と傾斜角が推定できれば 正立した文字画像を得ることが可能である.回転角については,文字列の直線性に着目することで推定し,補正することは ある程度可能である.しかし,傾斜角を正しく推定することは困難である.そこで本稿では,傾斜角を推定して補正することなく 傾斜した文字を認識する手法を提案する.提案手法は部分空間法を基本とし,様々な傾斜角の文字パターンとの パターン整合を効率的に行うために高速フーリエ変換を用いる.実際にデジタルカメラで撮影した文字画像を用いて認識実験を行い,提案手法の有効性を確認する.
  • Dongzhu YIN, Yoshihiro SUGAYA, Shinichiro OMACHI, Hirotomo ASO
    2010 年39 巻5 号 p. 606-614
    発行日: 2010/09/25
    公開日: 2011/08/25
    ジャーナル フリー
    Although skin color segmentation using different color spaces has been investigated using various approaches, there is still much to explore. Previous comparative analyses of different color space models did not sufficiently address the performance of color space models against the cases where training samples for skin color and test samples are taken under different environments. In this paper, we present a comparative study on different color space models for skin color segmentation. To show the significance of choosing the proper color space model, we investigated thirteen different color space models using two different skin color samples on two databases. Results of comparative experiment show that the CIECAM02 color appearance model can most precisely segment the true skin color against various skin color samples.
  • 中村 槙介, 森島 繁生
    2010 年39 巻5 号 p. 615-620
    発行日: 2010/09/25
    公開日: 2011/08/25
    ジャーナル フリー
    人間の歩行動作には,個人性情報が含まれており,最近では歩容個人認証の研究も盛んである.しかし個人の特徴を強調し,反映する歩容アニメーションを作ることは困難である.
    本研究では,歩行動作における個人性とは平均的な歩行動作からの差異によって表現されるものであると仮定し,その差異を増大させることによって個人性を強調した歩行動作を合成する.合成される歩行動作は,複数のサンプル歩行動作の主成分分析によって構築される空間において表現する.また,増大させる差異の大きさについては,複数の人物の歩行動作の中から特定の人物の歩行動作を探す主観評価実験によって最も認識率の高くなる割合を推定し,それを用いる.
  • 嶌田 聡, 鈴木 章, 米村 俊一, 小島 明
    2010 年39 巻5 号 p. 621-630
    発行日: 2010/09/25
    公開日: 2011/08/25
    ジャーナル フリー
    本稿では,複数メンバで体験を共有している場合を対象として,各メンバの頭部に設置した視線カメラにより,撮影することを意識することなく,体験した内容をわかりやすく記録する方法と,記録した映像から体験共有者の視線連動性に着目して有効区間を自動検出する方法を提案する.体験に興味を持って参加しているメンバは,関心のある対象がよく見える位置や体験の状況に応じて適切な位置関係に自然と移動することから各メンバの視線カメラにより体験の記録に有効な素材映像が取得できると考えられる.また,体験共有者は同じ目的を持った集団なので,重要な場面で特定のオブジェクトに全員が同時に着目したり,体験者の役割に応じた視線変動の典型的なパターンが発生したり,体験の内容に応じて必然的に生じる視線変動に関する性質があると考えられる.このような仮説をクライミングレッスンやビリヤードを対象にした実験で検証した.
  • 後藤 道彦, 植松 裕子, 斎藤 英雄, 仙田 修司, 池谷 彰彦
    2010 年39 巻5 号 p. 631-643
    発行日: 2010/09/25
    公開日: 2011/08/25
    ジャーナル フリー
    Augmented Reality (AR)技術を利用した作業支援は,ユーザに対して直感的な支援が可能である.一般に,ARシステムを構築するためには,重畳するコンテンツを用意する必要があり,従来はそのコンテンツを用途に合わせてCGなどで新たに作り出していた.本稿で提案するARシステムでは,そのコンテンツを新たに作るのではなく,既に多く存在しているビデオをお手本となる教師ビデオとして利用する.このとき,ユーザの視点に合わせて教師ビデオの視点を変換して重畳表示することで,ユーザが理解しやすいような情報提示を行う.また,ユーザの作業と教師ビデオ映像が同時に表示されることで,両者が視覚的に混同しやすいという問題を解決するために,教師ビデオに対して透明度変化や輪郭線の強調表示などの様々な加工を施す.更に,作業内容に合わせて教師ビデオをいくつかの手順に分割し,ユーザ側の作業が完了してから次の手順へと進めるようなインタラクティブ性を持たせることで,ユーザが各自のペースで作業を行うことのできるシステムとなっている.本システムの有効性を検証するためのユーザ評価実験では,折り紙を折る作業とブロックを配置する作業の二つの状況を想定し,本システムでの教師ビデオの提示方法について評価を行った.その結果,本システムで提案するようにユーザの視点に合わせてビデオを提示することで,ユーザの視認性が向上するということがわかった.また,教師ビデオに施すエフェクトについての評価では,作業内容ごとに適したエフェクトを分類することができ,今後更に他の作業へと適用する際の指標を得ることができた.
  • 青木 輝勝, 安田 浩
    2010 年39 巻5 号 p. 644-653
    発行日: 2010/09/25
    公開日: 2011/08/25
    ジャーナル フリー
    近年,Web・ブログなどによる個人レベルでの情報発信が急増しているが,現在,Webに関しては受信者(Webページ閲覧者)保護が主流で送信者(Webページ提供者)を積極的に保護するための技術はほとんど存在せず,また法律の整備も十分には進んでいない.例えば,過去に発信したWebページ情報の一部を改ざんされ,マスメディアなどにもっともらしく掲載されたとして,送信者がその改ざんを証明するのは現在極めて困難である.本稿では,受信者保護のみならず送信者保護も考慮した包括的なWeb不整合解決の必要性を述べ,更に,Webページ不整合問題発生時の調停ならびに不正受信者の特定を可能とするWebFingerprint方式を提案する.また,試作を通じて提案システムの実現性について検討する.
  • Ye Kyaw Thu, Yoshiyori URANO
    2010 年39 巻5 号 p. 654-662
    発行日: 2010/09/25
    公開日: 2011/08/25
    ジャーナル フリー
    Mobile devices such as mobile phone, PDA, music player and game player are becoming to play an important role in today's communication, education and entertainment. Text typing with these small mobile devices is a challenging research topic for daily work such as emailing, word processing, browsing or searching information, note taking and adding a new contact address into a phone book and so on. In this paper, we propose a new text input interface for Khmer (language of Cambodia) for mobile devices using clickwheel like Apple iPod. We used our proposed Positional Prediction (PP) text input concept for predicting possible combinations of a consonant and vowels or a syllable, and named the new text input interface PP_Clickwheel (Positional Prediction with Clickwheel). We held user study for PP_Clickwheel with ten native participants in Phnom Penh city, Cambodia to judge its user-friendliness based on first-time users' typing speed. The results are acceptable and positive for the current version of PP_Clickwheel prototype.
  • Chen LIU, Tianruo ZHANG, Xin JIN, Minghui WANG, Satoshi GOTO
    2010 年39 巻5 号 p. 663-671
    発行日: 2010/09/25
    公開日: 2011/08/25
    ジャーナル フリー
    H.264/AVC introduces the variable block size motion estimation (VBSME), which brings huge computational cost of the encoder. In this paper, a novel fast inter mode decision algorithm for H.264/AVC has been proposed. The proposed algorithm evaluates the modes based on residual feature. The residual is obtained after the motion search of P16 × 16 mode or P8 × 8 mode. And then basing on the extracted residual feature, the complexity and similarity are evaluated for the inter mode decision. According to the evaluation of similarity between different sub-blocks and the complexity of each sub-block, the most possible inter modes for current block is chosen to be conducted. In the worst case, the proposed whole scheme of inter mode decision algorithm only conducts 4 modes, which is much more effective than conducting all the 8 modes in conventional approach. The simulation results show that, comparing to JM14.1, on average, the proposed algorithm achieves 57.98% and 55.72% time-saving on CIF and 720p sequences respectively, with equivalent 0.219dB PSNR drop and 5.55% bit rate increase for CIF and 0.107dB PSNR drop and 3.53% bit rate increase for 720p. Compared to existing inter mode decision algorithm, proposed algorithm achieves 10.68% and 13.26% timing-reduction on CIF and 720p sequences respectively with less performance loss.
  • Guifen TIAN, Tianruo ZHANG, Satoshi GOTO
    2010 年39 巻5 号 p. 672-681
    発行日: 2010/09/25
    公開日: 2011/08/25
    ジャーナル フリー
    The variable block sizes for intra and inter coding in H.264/AVC achieves significant coding gain compared with coding a macroblock (MB) with fixed size. However, extremely heavy computational burden is required when Rate Distortion Optimization (RDO) process runs in brutal force searching manner for selecting the optimal coding block. This paper proposes an MB homogeneity detection method to accelerate H.264/AVC intra and inter coding. All the luminance values of pixels in an MB are taken to calculate their entropy feature, which is defined as MB's spatial homogeneity. Based on homogeneity judgment, 16×16 or 4×4 block size is appropriately selected for intra coding; Meanwhile, either the large blocks in {16×16, 16×8, 8×16} or sub-blocks in {8×8, 8×4, 4×8, 4×4} are chosen for inter coding. Especially, a cost function is defined to select near optimal threshold for selecting optimal block size. Proposed methods are verified on a wide range of video sequences with different spatial-/motion characteristics. Sufficient simulations demonstrate that consistent encoding gain is achieved for all videos with different motion and spatial features. Encoding complexity for intra coding alone can be reduced by 31%-34% and time savings for inter mode decision is 43.7%-58.7%, both with negligible loss in bitrate and PSNR.
  • Minghui WANG, Tianruo ZHANG, Chen LIU, Satoshi GOTO
    2010 年39 巻5 号 p. 682-691
    発行日: 2010/09/25
    公開日: 2011/08/25
    ジャーナル フリー
    H.264/AVC achieves low bit-rate video stream which meets the requirement of video communication. The problem of H.264/AVC is the large computation burden. Thus fast algorithm should be adopted to reduce the computation burden to meet the limited power of the mobile device. This paper uses region-of-interest (ROI) detector to locate an “important” region and apply unequally coding in the encoder engine according ROI. Several coding parameters including quantization parameter (QP), candidates for mode decision, number of referencing frames and the search range of motion estimation are adaptively adjusted at the macroblock (MB) level. This design is decoding-friendly. Experimental result shows a large amount computation is saved and the subjective visual quality is kept or even improved.
論文
  • 山田 敬喜, 古木 一朗, 加瀬 隆明, 中谷 直司, 厚井 裕司
    2010 年39 巻5 号 p. 697-705
    発行日: 2010/09/25
    公開日: 2011/08/25
    ジャーナル フリー
    中間調記録可能なディジタルサイネージ(電子広告)への適用を考慮し,リライタブル記録媒体の記録消去特性に影響を及ぼす機構上の最適設計と冷却方法について検討した.まず,光学濃度に影響を与える機構的パラメータがニップ圧のみであることを示し,また記録消去動作に必要なニップ圧を得るための機構的条件(サーマルヘッドの発熱素子形状,ニップ幅,ニップポイントなど)を明らかにした.次に,プラテンローラ径・長さ,ゴム硬度などの機構設計パラメータとニップ圧の関係が三次元接触解析法で求められることを明確にし,サーマルヘッド押圧機構設計パラメータの同定にはシミュレーションによる解法の適用が可能であることを確認した.更に,冷却特性(放熱特性)の改善に対してヒートパイプと筺体を接続した冷却方法が有効であることを示した.
  • 伊藤 史人, プリマ オキディッキ, 上野 育子, 伊藤 憲三
    2010 年39 巻5 号 p. 706-713
    発行日: 2010/09/25
    公開日: 2011/08/25
    ジャーナル フリー
    高齢化社会の到来によって変形性膝関節症が急増しており,人工膝関節全置換術(total knee arthroplasty; TKA)の施行例も増加している.TKAの術前計画では,立位の膝関節の状態を知る必要があり,患者の立位X線透視像を参照して人工関節の設置位置が検討されるが,この画像から立体情報を読み取ることが困難なため,複雑な膝関節のTKAにおいては熟練した医師の解釈が必要である.CT画像を利用すれば,関節の構造を立体的に表示できるが,現在,立位でCT画像を撮影することは困難であり,そのままのCT画像では立位の立体情報を把握することは難しい.本研究は立位X線透視像を参考にしたCT画像のレジストレーション手法を提案し,立位三次元膝関節モデルの生成を試みた.下肢の解剖学的情報を考慮した 大腿骨と脛骨の個別レジストレーションを行った結果に対して,位置ズレによる客観評価とTKAに従事する臨床医からの評価およびコメントをもとに,本研究の立位三次元膝関節モデルの有用性を明らかにした.また,提案手法は重度変形性膝関節症疾患における 立位三次元膝関節モデルを生成できることも示唆した.
  • 方 明, 高氏 秀則, 金子 俊一, 渡邉 日出海
    2010 年39 巻5 号 p. 714-724
    発行日: 2010/09/25
    公開日: 2011/08/25
    ジャーナル フリー
    品質の低い動画像列に基づいてオプティカルフロー をロバストに推定する手法を提案する.局所領域を複数のサブ領域に分割し,方向符号照合法により算出される各々の類似度分布に基づき,オプティカルフローとなり得る「候補ベクトル」の生成とオプティカルフローが存在する可能性が低い「抑制領域」 の抽出を行う.正投票は候補ベクトルによりオプティカルフローの真値を強調するため,一方,負投票は抑制領域に基づいてノイズとなる偽ベクトルを抑えるために導入する.この正負投票に基づく補完的投票において,投票空間における信号対ノイズ比を最大にする.その過程において推定オプティカルフローの信頼度を計算する.最後に,多くのノイズを含む実映像(水中映像)に対して,オプティカルフロー推定実験を行い提案手法の有効性を確認した.
  • 田代 裕子, 齊藤 剛
    2010 年39 巻5 号 p. 725-732
    発行日: 2010/09/25
    公開日: 2011/08/25
    ジャーナル フリー
    今日,情報技術の向上と記憶媒体の廉価化により,多くの映像がディジタル化され,コンピュータ上に格納されている.これらの動画像や映像は固有な利用目的を持って蓄積されるが,特定画面の検索や閲覧および時刻をパラメータとする特徴抽出のための方策が必要である.本研究の目的は,固定カメラにより長時間撮影された特定空間の状況を簡潔に表現し,特定の情報に素早くアクセスできる映像表現手法,および,これを利用して撮影空間の特徴抽出を行う手法を開発することにある.本研究では,撮影空間内の特定部分空間を時系列的に表示するスリットカメラの原理を利用し,特定時間間隔の動画の内容を1枚のスリット画像として表現する.スリット画像の時間方向の位置は元の動画のフレーム番号に対応する.従って,スリット画像を元の動画像のインデックスとして利用できる.更に,生成したスリット画像に対してのみ画像処理することにより,元の動画像を参照することなく,撮影された動画像の特定時間区間の特徴抽出が可能となる.これらの具体的な適用事例として,牛舎内を自由行動する複数頭の牛を撮影した映像から,牛舎内のどの領域に牛が存在するかを時間推移と共に直観的にわかりやすく表示する方法を考案した.
  • 山守 隼人, 斉藤 文彦
    2010 年39 巻5 号 p. 733-740
    発行日: 2010/09/25
    公開日: 2011/08/25
    ジャーナル フリー
    市街地の道路脇には多くの看板があり,それらは大変有用な情報を提示している.多くの看板は矢印により目的の場所の方向を示しており,矢印の位置や示す方向を検出することは,看板に書かれている情報を得るためにも大変重要である.本稿では,多点組み合わせHough変換を用いて画像内における矢印の位置および角度を検出する手法を提案する.二つのエッジ画素の組から走査を開始し,矢印パタンの形状的特徴に基づいた条件を満たした場合,画像内における矢印のアローヘッドの頂点であると判断した点,および角度に対応するパラメータ空間に投票を行う.すべての投票が終了したら,パラメータ空間内を探索し,最大投票値を持つ点を対象画像中の矢印の位置,角度として検出する.実験により,提案手法を用いることで様々な形状の矢印を検出できることが確認できた.
  • 佐々木 友之, 工藤 純一
    2010 年39 巻5 号 p. 741-747
    発行日: 2010/09/25
    公開日: 2011/08/25
    ジャーナル フリー
    本稿では,衛星画像(NOAA/AVHRR,TERRA/MODIS)を用いた三次元ヒストグラムによる黄砂抽出法を提案する.現在までに開発されている黄砂抽出法は,黄砂と他の領域の判別がつきにくい問題点を持つ.そのため,本方法では植生,土壌,水に対応する指数を同時処理により可視化した.その後,目視によって黄砂を特定し,三次元ヒストグラムを用いて黄砂を抽出した.日本で黄砂を観測した日の画像を処理した結果,本方法が黄砂抽出に有効であることがわかった.
  • 神戸 陽介, 斉藤 文彦
    2010 年39 巻5 号 p. 748-755
    発行日: 2010/09/25
    公開日: 2011/08/25
    ジャーナル フリー
    教育の現場でよく用いられるドリルテキストは,繰り返しの学習により知識や技能を修得することを目的としている.しかし,ドリルテキストは,直接鉛筆で書き込んで使用する構成になっている場合が多く,繰り返し学習が困難である.本稿では,書き込み済みのドリル画像から,手書き鉛筆線のみを除去する手法を提案する.この処理をコピー機やスキャナに搭載することで,書き込み済みドリルテキストを再び使用することができるようになり,上記問題が解決すると考えられる.提案手法では,書き込み筆記具の画像特徴に着目する.鉛筆線の画像特徴を判別することで,書き込みの種類や形状によらない消去処理を行うことが可能となる.実験より,鉛筆線は99%程度の精度で除去することができた.また,印刷を誤って消去する誤消去も非常に少なかった.
  • 柴田 啓司, 前田 恵, 浦上 創史, 堀田 裕弘
    2010 年39 巻5 号 p. 756-763
    発行日: 2010/09/25
    公開日: 2011/08/25
    ジャーナル フリー
    ハザードマップは,主に地震・津波のための減災対策として作成されてきた.しかし,雪や豪雨などに対するハザードマップは従来のハザードマップでは対応できない点が多い.そこで本稿では,ハザードマップに対する利用者・媒体・内容などについて検討を行い,地上解像度にスケーラブルかつリアルタイムな新しいタイプのハザードマップの提案を行った.この考えに基づき雪ハザードマップのプロトタイプの構築を行った.空間補間によるレイヤの生成により地図的な地上解像度にスケーラブルでリアル タイムな雪ハザードマップを表現することが可能となった.
連載技術解説
次世代イメージ情報通信への誘い I
feedback
Top