知能と情報
Online ISSN : 1881-7203
Print ISSN : 1347-7986
26 巻 , 5 号
選択された号の論文の22件中1~22を表示しています
目次
巻頭言
特集:「コンピュータ将棋」
解説
コラム
理事会だより
書評
用語解説
  • 保木 邦仁
    原稿種別: 用語解説
    2014 年 26 巻 5 号 p. 216
    発行日: 2014/10/15
    公開日: 2017/11/18
    ジャーナル フリー

    近年のコンピュータ将棋では,プロ棋士などの棋譜(5万局程度)を利用して,評価関数に含まれる特長ベクトルの重みが機械学習される.Bonanza が2006年のコンピュータ将棋選手権で優勝して以降,このような学習法の実装は各将棋プログラムに急速に広まった.

    評価関数の機械学習は,最適化の枠組みで行われる.すなわち,プロ棋士の選択した手と,プログラムの選択した手の不一致度を測る目的関数を設計し,この目的関数を最小化する重みベクトルを求める.類似の枠組みは,古くは1982年,新しくは2001年のコンピュータチェスに関する文献にも見られるが[1, 2],2014年現在,将棋ほどの成功には至っていないようである.

    Bonanza 法やBonanza メソッドという用語は,コンピュータ将棋の技術に関する解説にしばしば見られる.これらの用語は,時にはこのような枠組みで将棋の評価関数を機械学習するという広い意味で使われ,時にはバージョン6.0のBonanza のソースコードで実装されている方法という狭い意味で使われる.Bonanza で実装されている学習手法のうち主要なものは,文献[3]にて解析されている.

    [1] T. Nitsche, A learning chess program, In advances in Computer Chess 3, pp.113-120, Pergamon Press(1982).

    [2] G. Tesauro, Comparison training of chess evaluation functions, In Machines that Learn to Play Games, pp.117-130, Nova Science Publishers( 2001).

    [3] K. Hoki & T. Kaneko, Large-Scale Optimization for Evaluation Functions with Minimax Search, Journal of Artificial Intelligence Research 49, pp.527-568( 2014).

  • 保木 邦仁
    原稿種別: 用語解説
    2014 年 26 巻 5 号 p. 216
    発行日: 2014/10/15
    公開日: 2017/11/18
    ジャーナル フリー

    現在の将棋プログラムは,計算資源の殆どをミニマックス木の探索に費やす.ミニマックス木は,ゲームの状態間の手による遷移及び評価値を表す.この木の平均的な分岐因子は80程度もあることから,現実的な対局時間で5手以上先を読むためには,枝刈りにより木探索の効率化を図る必要がある.

    ミニマックス木探索における枝刈り法は2つの種類に分けられる.ひとつは,a b 探索に代表される安全な枝刈りであり,探索の値を変えることなく木の枝が刈られる.a b 探索の他にもアスピレーション探索[1] がよく用いられている.もうひとつの種類は,前向き枝刈り法と呼ばれる,探索の値を変えてしまう可能性のあるものである.前向き枝刈り法のうち,Futility pruning,null move pruning 及び late move reduction 法の将棋における性能調査が文献[ 2]に示されている.他にも,ハッシュテーブルを用いた枝刈り法や Static ExchangeEvaluation[3]の値に基づく枝刈り法などもよく用いられている.

    これら枝刈り法は現在のコンピュータチェスにおいて成功している方法である.将棋独自の性質を利用した枝刈りも研究されてきたが,Bonanza がチェスの枝刈り法を組み合わせただけでも十分将棋に効果があることを示して以降,チェスプログラムの技術への注目が再び高まっている.

    [1] H. Kaindl, R. Shams, H. Horacek, Minimax search algorithms with and without aspiration windows, IEEE Transaction on Pattern Analysis and Machine Intelligence 13 pp.1225-1235(1991).

    [2] K. Hoki & M. Muramatsu, Efficiency of three forward-pruning techniques in shogi: Futility pruning, nullmove pruning, and late move reduction( LMR). Entertainment Computing, 3, pp.51-57(2012).

    [3] F. Reul, Static exchange evaluation with α-β-approach, ICGA Journal 33, pp.3-17(2010).

会告
論文概要
学会から
編集後記
一般論文
原著論文
  • 数原 良彦, 櫻井 彰人
    2014 年 26 巻 5 号 p. 809-819
    発行日: 2014/10/15
    公開日: 2014/12/12
    ジャーナル フリー
    本稿では,相対的な順位の高低を表す順序ラベルと特徴ベクトルで表現された事例ペアを元に,事例の順位を予測する教師あり自己組織化マップアルゴリズムであるOrderSOMを提案する.提案手法では事例ペアに対して選択されたBMU (Best Matching Unit) の競合層における位置情報と順序ラベルに基づいてBMUの位置を修正することで,事例の順位を予測する順序学習を実現する.人工データと実データを用いた評価実験を通じて,提案手法の有効性を検証した.
  • 佐藤 浩史, 井上 武, 岩本 秀明, 小柳 惠一
    2014 年 26 巻 5 号 p. 820-829
    発行日: 2014/10/15
    公開日: 2014/12/12
    ジャーナル フリー
    GPSなどの測位システムと携帯電話などの無線通信の普及により,ユーザの位置情報を正確かつリアルタイムに取得できるようになった.しかし,正確かつ即時性の高い位置情報の公開は,実空間でのユーザの特定を可能にし,匿名性を失わせる.ユーザの滞在位置に誤差を与えることで匿名性を維持できるが,位置精度の低下はサービス品質の劣化を招く.本論文は,k匿名性と位置精度をともに満足する新たな位置情報の曖昧化手法Virtual Scentを提案する.Virtual Scentは,個々のユーザをぼやっとした「匂い」として表示することで匿名性を確保する.複数のユーザが匂いを発すると,それらは互いに混ざり合い,正しい位置で強め合うため,曖昧化される位置情報でも精度を保証することができる.シミュレーションと実験でVirtual Scentを評価し,信頼性と有用性を示す.
  • 木村 大毅, PICHAI Kankuekul, 長谷川 修
    2014 年 26 巻 5 号 p. 830-843
    発行日: 2014/10/15
    公開日: 2014/12/12
    ジャーナル フリー
    人のために働く自律知能ロボットの開発には,人の生活環境下で人や実環境,インターネットとの相互作用から知識を追加的に獲得し,知的に発達する知能情報処理機構の実現が必要である.本稿では,その基盤技術の一つとして,オンライン学習が可能で非常に高速な属性知識の学習と転移手法を提案する.これは,実世界のノイズに頑健な学習器であるSelf-Organizing and Incremental Neural Network を改良し,それを活用して構築する.動物の属性知識を転移し,未学習の動物の種類を推定する実験を用いて本手法を評価した結果,従来のオンライン学習手法と同等の認識率を保ちつつ,学習時間と認識時間を大幅に短縮した.更に,従来手法と比べてノードの数も大きく削減し,情報量の軽量化も実現した.また,提案手法が持つノイズ耐性を用いることで,インターネット上のデータも活用することができた.
  • 細谷 優, 馬野 元秀
    2014 年 26 巻 5 号 p. 844-854
    発行日: 2014/10/15
    公開日: 2014/12/12
    ジャーナル フリー
    近年,離散状態しか取り扱えないQ-learning を拡張し,連続状態を扱えるようにしたファジィ Q-learningに関する研究が行なわれている.また,初期のQ表を与えておき,新しい状態と行動の組を動的に追加していくDynamic Fuzzy Q-Learning (DFQL) も提案されている.我々は,状態のファジィ集合の調整と状態と行動の組の削除機能を持つ,より動的で柔軟なファジィQ-learningを提案する.提案法では,Q値の学習を行ないながら状態の評価値であるV値のTD誤差を用いて状態のファジィ集合の中心値と幅の調整を行なう.そして,ファジィ集合とV値に忘却学習を適用することで不要なファジィ集合と不要な状態と行動の組を削除する.この方法を実数値環境下の追跡問題に適用する.
  • 大倉 和博, 保田 俊行, 和田 七海, 松村 嘉之
    2014 年 26 巻 5 号 p. 855-865
    発行日: 2014/10/15
    公開日: 2014/12/12
    ジャーナル フリー
    スワームロボットシステム(Swarm Robotics System,SRS)は,協調採餌問題のように,与えられたタスクの達成に複数台のロボットが適切に協調することが必要な難易度の高い問題に対して適用される.主に,SRSでは,群れ挙動の生成に関する話題に注目が集まることが多いが,群れ挙動の評価や解析方法に関しては,未だに定石的手法がない.本稿では,これに焦点を当て,動物行動学の挙動解析で用いられている解析手法の適用を提案する.SRSを構成するロボット群をいくつかのサブグループに分割し,そのおのおのがある役割を担うとみなす.そして,SRSの動機となっている社会性生物における役割分担の観点から行動連鎖の概念を適用することで,観察される群れ挙動の特徴抽出を試みる.
feedback
Top