詳細検索結果

均衡選択の方法としての実験室実験―投票モデルの検証―

黒阪健吾, 肥前洋一

シミュレーション＆ゲーミング
2011年 21 巻 1 号 60-68
発行日: 2011/06/25
公開日: 2020/07/06

DOI https://doi.org/10.32165/jasag.21.1_60

ジャーナルフリー

抄録を表示する抄録を非表示にする

本論文の目的は，複数の
ナッシュ均衡
が存在する投票のゲーム理論モデルにおいて，どの
ナッシュ均衡
が実現しやすいかを実験室実験によって特定することである．理論的にはどの
ナッシュ均衡
が実現しやすいといえるかを「ブロック投票」という概念を用いた均衡選択により検討したうえで，その理論的帰結を実験室実験により検証する．実験では，セッションごとに，また投票の回ごとに，異なる
ナッシュ均衡
に対応する結果がしばしば観察されたものの，どのセッシヨンの結果にも理論的帰結と一部整合的な特徴を見出すことができた．したがって，本論文が取り上げる投票のモデルでは，複数の
ナッシュ均衡
のうち常にいずれか1つの
ナッシュ均衡
が実現するわけではないが，平均的には，理論的帰結と一部整合的な特徴を持つ結果が実現しやすいとの結論を得た．

抄録全体を表示

PDF形式でダウンロード (1174K)
自己評価により学習するエージェントに関する研究(エージェント・分散人工知能)(<特集>人工知能分野における博士論文)

森山甲一

人工知能
2004年 19 巻 1 号 101_2
発行日: 2004/01/01
公開日: 2020/09/29

DOI https://doi.org/10.11517/jjsai.19.1_101_2

解説誌・一般情報誌フリー

抄録を表示する抄録を非表示にする

本論文ではマルチエージェント環境での強化学習を扱う.従来のマルチエージェント強化学習はゲーム理論の
ナッシュ均衡
に収束させることを目的とするが,囚人のジレンマのように
ナッシュ均衡
がパレート最適とならないゲームが存在する.一方で,報酬を操作することにより
ナッシュ均衡
から逸脱する行動を学習させる研究が存在するが,
ナッシュ均衡
がパレート最適となるゲームでは逆に悪影響を与えることがある.したがって本研究では,おのおのの立場が同じ対称な環境において,囚人のジレンマと同様のゲームでは
ナッシュ均衡
から逸脱する行動を,それ以外のゲームでは
ナッシュ均衡
を構成する行動を学習することを目的とした.まず,
ナッシュ均衡
とパレート最適の概念から対称なマルチエージェント環境を非干渉・泥沼・選択・競合の四つの状況に分類した.囚人のジレンマは泥沼状況である.さらに,泥沼状況とそれ以外の状況に適する自己評価生成法である「近隣報酬」と「報酬差分」を導入した.それから,強化学習手法としてQ学習を用いる各エージェントについて,Q関数と報酬の関係から状況を判定する条件を二つ導入し,少なくとも一つが満たされる場合に「近隣報酬」を用い,満たされない場合に「報酬差分」を用いて自己評価を生成し学習する「自動選択」を提案した.上記各状況に対応するゲームと途中で状況間を遷移するゲームにより実験を行い,提案手法の有効性を確認した.

抄録全体を表示

PDF形式でダウンロード (103K)
非協力ゲーム(発展編)

横尾真, 岩崎敦, 櫻井祐子, 岡本吉央

コンピュータソフトウェア
2012年 29 巻 3 号 3_39-3_53
発行日: 2012/07/25
公開日: 2012/09/25

DOI https://doi.org/10.11309/jssst.29.3_39

ジャーナルフリー

抄録を表示する抄録を非表示にする

本編では非協力ゲーム(発展編)として，非協力ゲームの均衡概念で最も重要なものである
ナッシュ均衡
について詳しく述べる．2人ゼロサム標準形ゲームでは，プレイヤが選択可能な純粋戦略の個数に関する多項式時間で
ナッシュ均衡
を計算できる．しかしながら，プレイヤが交互に行動を繰り返し選択するような複雑なゲームでは純粋戦略の個数が膨大となる．本編では，このような複雑な2人ゼロサムゲームの均衡を計算する例として，ポーカー等のカードゲームにおいて
ナッシュ均衡
を計算するアルゴリズムを紹介する．一方，一般の有限2人標準形ゲームでは，
ナッシュ均衡
が多項式時間で計算可能かどうかが分かっていない．しかしながら，
ナッシュ均衡
の存在自体は証明されているので，PやNPのような判定問題に関する概念は，
ナッシュ均衡
計算問題の難しさを議論するためには適切ではない．本編では，
ナッシュ均衡
計算問題の難しさを議論する際に有用な問題のクラスであるPPAD，およびPPAD完全性について解説する．
抄録全体を表示

PDF形式でダウンロード (349K)
ZCSを用いた社会ネットワーク形成における被験者の行動ルール抽出

*林田智弘, 西崎一郎, 石平大祐

日本知能情報ファジィ学会ファジィシステムシンポジウム講演論文集
2013年 29 巻 MF1-5
発行日: 2013年
公開日: 2015/01/24

DOI https://doi.org/10.14864/fss.29.0_66

会議録・要旨集フリー

抄録を表示する抄録を非表示にする

ネットワーク形成に関する数理モデルに基づく解析により，二方向フローモデルにおいて中心支援スターネットワークは狭義
ナッシュ均衡
であることが示されている．しかし，被験者実験の結果，
ナッシュ均衡
は形成されたが，狭義
ナッシュ均衡
は形成されず，
ナッシュ均衡
のネットワークも安定しかった．この理由として，人間の意思決定は必ずしも合理的ではなく，状況に応じた行動規則に基づく意思決定をしていることなどが考えられる．このため，本論文では，このような人間の意思決定および学習機構を模倣することのできるZeroth Level Classifier System (ZCS)を用いてシミュレーションを行い，行動ルールを抽出することで，被験者の行動分析を行う．
抄録全体を表示

PDF形式でダウンロード (844K)
強化学習を戦略とする繰り返し囚人のジレンマの
ナッシュ均衡
の数値的分析

*鳥居拓馬, 日高昇平

人工知能学会全国大会論文集
2020年 JSAI2020 巻 1P5-GS-7-03
発行日: 2020年
公開日: 2020/06/19

DOI https://doi.org/10.11517/pjsai.JSAI2020.0_1P5GS703

会議録・要旨集フリー

抄録を表示する抄録を非表示にする

繰り返し囚人のジレンマ（IPD）は社会的ジレンマ状況を理論的に調べる標準的なツールのひとつである．標準的なゲーム理論の分析において標準的な IPD ではエージェント集団にとって望ましくない相互裏切に陥ることが示され，過去の研究においては別のゲームクラスとして強化学習エージェント間の IPD が研究されてきた．しかし，このクラスのゲーム（学習エージェント間のゲーム）はいまだ十分に解明されていない：標準的なゲーム理論の分析方法を適用することは難しいため，さまざまな近似的な解析手法が用いられている．本研究では，強化学習エージェント間の IPD がもつ
ナッシュ均衡
を調べた．その結果，標準的な IPD では相互裏切が唯一の
ナッシュ均衡
だが，強化学習エージェント間の IPD では相互協調が唯一の
ナッシュ均衡
である可能性が示された．以上は，強化学習エージェント間の IPD では，個人最適な選択（
ナッシュ均衡
）と集団最適な選択（パレート効率解）が一致し，その意味で社会的ジレンマが解消されたことを示唆する．

抄録全体を表示

PDF形式でダウンロード (498K)
非協調・非協力関係とダイナミクス

*早川朋久

自動制御連合講演会講演論文集
2017年 60 巻 SuE1-1
発行日: 2017年
公開日: 2017/12/18

DOI https://doi.org/10.11511/jacc.60.0_1297

会議録・要旨集フリー

PDF形式でダウンロード (1287K)
ネットワーク形成に関するエージェントベースシミュレーション分析

*林田智弘, 西崎一郎, 片桐英樹

日本知能情報ファジィ学会ファジィシステムシンポジウム講演論文集
2009年 25 巻 3A2-04
発行日: 2009年
公開日: 2009/12/15

DOI https://doi.org/10.14864/fss.25.0.183.0

会議録・要旨集フリー

抄録を表示する抄録を非表示にする

Bala and Goyal (2000) はネットワーク形成に関する数理モデルを構築し，周辺支援スター型ネットワークが狭義
ナッシュ均衡
であることを示した．これに対して，Berninghaus et al. (2007) 被験者実験を行っており，周辺支援スター型ネットワークが形成されたが，均衡が形成された後，一部のプレイヤーの戦略変更によって均衡から逸脱するようなネットワーク形成過程が観測された．特に，
ナッシュ均衡
が一度形成された後，複数のプレイヤーの均衡戦略からの逸脱によりスター型ネットワークの中心プレイヤーが入れ替わるようなネットワークの形成過程が観測された．この理由の1つとして，人間の意思決定が必ずしも合理的ではなく，試行錯誤的であることが考えられる．このため，本論文ではこのような人間の意思決定構造を模倣することのできるエージェントベースシミュレーションシステムを用いた分析を行い，被験者実験において狭義
ナッシュ均衡
から逸脱した原因を探る．
抄録全体を表示

PDF形式でダウンロード (121K)
分散厚生ゲームにおけるEgalitarian Non-Separable Contributionに基づく効用関数設計

真壁あゆみ, 和田孝之, 藤崎泰正

システム制御情報学会論文誌
2022年 35 巻 3 号 48-54
発行日: 2022/03/15
公開日: 2022/06/15

DOI https://doi.org/10.5687/iscie.35.48

ジャーナルフリー

抄録を表示する抄録を非表示にする

A distributed welfare game is a game-theoretic model for a resource allocation problem which is to find an allocation to maximize the objective function of the system operator. In order to determine an allocation in a distributed way, each agent is assigned to an admissible utility function such that the resulting game possesses desirable properties, for example, scalability, the efficiency of pure Nash equilibria, and budget balance. For this end, a marginal contribution-based utility design is proposed. This utility function requires less computational effort than the previous research, while it has the same efficiency as those of the conventional utility design via Shapley value.

抄録全体を表示

PDF形式でダウンロード (834K)
Multi-agent influence diagramsにより表現された、ゲームにおけるSequential equilibriumの定式化

*柴田智喜, 木嶋恭一

経営情報学会　全国研究発表大会要旨集
2012年 2012f 巻 H2-8
発行日: 2012年
公開日: 2013/01/30

DOI https://doi.org/10.11497/jasmin.2012f.0.207.0

会議録・要旨集フリー

抄録を表示する抄録を非表示にする

ゲーム理論において、標準形や展開形などの表現法が存在する。しかし、これらはしばしば、意思決定や自然の状態の影響関係の構造を曖昧にしてしまう。
一方、Multi-agent influence diagrams(MAIDs)はゲームの影響関係の構造を明示する。MAIDsにおいて
ナッシュ均衡
は定義されているが、不完全情報ゲームでは、
ナッシュ均衡
は均衡経路外の行動戦略の評価が出来ないという問題を起こす。またSequential Equilibrium(SE)は信念を用いる事でこれらの行動戦略を評価するが、MAIDでは定義されていない。
本研究では、SEのMAIDsにおける定式化を行い新たな示唆を得ることを目的とする。
抄録全体を表示

PDF形式でダウンロード (570K)
《第4回》ゲーム理論と機械学習における後悔最小化

岩崎敦

計測と制御
2019年 58 巻 7 号 548-551
発行日: 2019/07/10
公開日: 2019/07/12

DOI https://doi.org/10.11499/sicejl.58.548

ジャーナルフリー

PDF形式でダウンロード (389K)
社会的協調ゲームにおけるネットワーク形成に関する間接的な相互作用を考慮した
ナッシュ均衡
解

*和田紘輝, 西崎一郎, 林田智弘

日本知能情報ファジィ学会ファジィシステムシンポジウム講演論文集
2010年 26 巻 WB3-1
発行日: 2010年
公開日: 2010/11/05

DOI https://doi.org/10.14864/fss.26.0.232.0

会議録・要旨集フリー

抄録を表示する抄録を非表示にする

本論文は，内部ネットワークにおける2×2協調ゲームについて研究している．プレイヤーの戦略は，協調ゲームの相手とゲームにおける行動の組み合わせである．パートナーの選択は，パートナーに対するリンクの形成を意味する．プレイヤー間にリンク，またはパスが存在するとき，ゲームは行われる．我々は，ネットワークにおける相互作用の形成について研究しており，我々のモデルでは，任意の2人のプレイヤー間にリンク，もしくは距離2のパスがある場合，協調ゲームを行うことを仮定している．本論文では，内部ネットワークにおける協調ゲームの狭義
ナッシュ均衡
を示す．
抄録全体を表示

PDF形式でダウンロード (166K)
標準型ゲームに対するユーティリティデザインの数値的考察

*飯島優司, 北側紘史, 小木曽公尚, Guo Mingyu, 畑秀明

自動制御連合講演会講演論文集
2017年 60 巻 SuE2-4
発行日: 2017年
公開日: 2017/12/18

DOI https://doi.org/10.11511/jacc.60.0_1338

会議録・要旨集フリー

PDF形式でダウンロード (342K)
社会制度移行に伴う費用の分配に関するゲーム理論を用いた分析

*伊藤竜馬, 喜多村正仁

経営情報学会　全国研究発表大会要旨集
2017年 2017s 巻 P1-6
発行日: 2017年
公開日: 2017/05/31

DOI https://doi.org/10.11497/jasmin.2017s.0_21

会議録・要旨集フリー

抄録を表示する抄録を非表示にする

　ある制度を新しいものへと移行するとき、例えどれだけ新しい制度がそれまでの制度より望ましいものであっても、移行費用の分配に関して参加者間のコンフリクトが生じ、その結果移行が行われなくなってしまうことがある。例えば、日本の年金制度において賦課方式から積立方式への移行が難しい問題となっているのは、移行費用に関する世代間のコンフリクトが起こっていることが原因の1つである可能性がある。本研究では、制度の移行に伴う費用分配によって生じるコンフリクトを標準形ゲームでモデル化し、各プレイヤーの最適応答及び均衡を求め、コンフリクト状態においても移行費用がすべて支払われ、制度移行が実現するための条件を考察する。
抄録全体を表示

PDF形式でダウンロード (515K)
展開形ゲームの新しい定義とその帰結

河野敬雄

理論と方法
2016年 31 巻 1 号 138-150
発行日: 2016年
公開日: 2016/08/06

DOI https://doi.org/10.11218/ojjams.31.138

ジャーナルオープンアクセス

抄録を表示する抄録を非表示にする

　現在の標準的ゲーム理論においては，展開形ゲームと標準形ゲームとは目的に応じて使い分けているが，原理的には区別をしていない．つまり，表現の仕方が異なるだけである，という理解の仕方をしている．しかし，日常的ゲームを考えてみると容易に観察されるように，複数のプレイヤーの手番が交互に，あるいは順を追ってプレイされる囲碁・将棋，トランプゲームの類と，複数のプレイヤーの手番を同時にプレイしなければならないジャンケンゲームの類とは原理的に異なるゲームであると認識すべきである．一度この違いを受け入れると，逐次ゲームである展開形ゲームにおいては，先手番プレイヤーがもつ優先的選択権をすべてのプレイヤーが受け入れざるを得ない結果，採用すべき
ナッシュ均衡
は原則としてプレイヤー全員の一致した選好の結果として一意に決まり，かつ複数の
ナッシュ均衡の中から敢えてパレート劣位なナッシュ均衡
を選んでしまうことがあるという，従来のゲーム理論の〈非合理的〉な欠陥が解消される．
抄録全体を表示

PDF形式でダウンロード (1787K)
ネットワーク上のcontribution gameを不平等回避モデルで考察した際の
ナッシュ均衡
・absorbing setの導出

中上晨介

行動経済学
2019年 12 巻 115-158
発行日: 2019年
公開日: 2019/06/11

DOI https://doi.org/10.11167/jbef.12.115

ジャーナルフリー

抄録を表示する抄録を非表示にする

本稿では，不平等回避モデルを拡張し，ネットワーク上のcontribution gameにおけるプレイヤーの利得関数に不満と罪悪感のパラメータを用いて新たなモデルを構築し，
ナッシュ均衡
とabsorbing setを導出した．ネットワーク上でcontribution gameを行った研究では，プレイヤーは隣り合う2人のプレイヤーとつながりを持つサークルの形をした社会的ネットワーク上で公共財への拠出にContributionするかDefectするかの戦略の決定を行う．また，プレイヤーの利得関数はつながりを持つ周囲のプレイヤーの戦略に基づいて決まる．本稿では，不満と罪悪感のパラメータの範囲によっては，多くの人が貢献する状態も
ナッシュ均衡
，absorbing setとして実現することを示した．結果の解釈としては，ある条件下で，人々が持つ罪悪感が不満よりも大きいとき，多くの人がネットワーク上のcontribution gameにおいて協力的行動をとるということである．

抄録全体を表示

PDF形式でダウンロード (3022K)
国際寡占競争下における環境R&Dの微分ゲーム分析

前鶴政和

地域学研究
2007年 37 巻 1 号 103-114
発行日: 2007年
公開日: 2007/10/02

DOI https://doi.org/10.2457/srs.37.103

ジャーナルフリー

抄録を表示する抄録を非表示にする

The purpose of this paper is to investigate the dynamic properties of environmental R&D and environmental policies by analyzing the infinite horizon differential game between two governments. In this paper, we formulate the differential games that need to be solved by the two governments and derive and characterize the unique open-loop and Markov-perfect Nash equilibrium solutions. By comparing the two equilibrium solutions, we explore the free-riding behavior of governments with regard to pollution control. We derive and compare the steady-state levels of emission tax, pollution stock and social welfare. In addition, we derive the convergence speed of pollution control under the respective equilibrium solutions. In conclusion, compared to the Markov-perfect Nash equilibrium solution, we obtain a higher emission tax, a lower pollution stock, a higher social welfare and a slower pace of pollution control under the open-loop Nash equilibrium solution.

JEL classification: F18, L13, Q58
抄録全体を表示

PDF形式でダウンロード (302K)
政策コンフリクトにおけるコミュニケーション促進の効果に関する研究

榊原弘之, 木寺和司, 桐島健朗, 高瀧大介

土木計画学研究・論文集
2006年 23 巻 79-89
発行日: 2006/09/30
公開日: 2010/06/04

DOI https://doi.org/10.2208/journalip.23.79

ジャーナルフリー

抄録を表示する抄録を非表示にする

本論文では, 政策コンフリクトにおいて, 仲介者などを通じた当事者間のコミュニケーション促進が, 合意の形成にもたらす効果について, 実験ゲーム的手法により分析を行った. 仮想的なコンフリクト・シナリオに基づいて実験参加者に当事者の役割を演じることを求め, 行動の選択を観察した. その結果, コミュニケーションによって, 全く譲歩しない行動が抑制され, 当事者間に譲歩の機運が生じたほか, 協調的な帰結に至る参加者の比率が増加した. これは, 現実の斡旋・調停において, 仲介者が当事者たちが置かれている立場を整理・構造化して示すことが, 当事者の自発的な合意を促進していることを示すと考えられる.
抄録全体を表示

PDF形式でダウンロード (1692K)
ゲーム理論の
ナッシュ均衡
解による分散型制御システムの構成

平澤宏太郎, 山本祐督, 胡敬炉, 村田純一, 金春植

電気学会論文誌Ｃ（電子・情報・システム部門誌）
1999年 119 巻 4 号 467-473
発行日: 1999/04/01
公開日: 2008/12/19

DOI https://doi.org/10.1541/ieejeiss1987.119.4_467

ジャーナルフリー

抄録を表示する抄録を非表示にする

In this paper, a new control method for decentralized systems is proposed by using the concept of Nash equilibrium points of game theory. It is supposed that the system stated in this article is composed of many subsystems including their controllers, so each subsystem can be recognized as each player in game. From the above assumption it is pointed out that the Nash equilibrium points can be calculated by the commonly-used back propagation algorithm if the criterion function of each subsystem is given.
From tank-network simulations, it is shown that the controller obtained by the Nash equilibrium points can be used when the criterion function of each subsystem is independently given.
抄録全体を表示

PDF形式でダウンロード (1248K)
公共財の自発的貢献と集団の構成^*

岡崎哲郎

公共選択の研究
2005年 2005 巻 44 号 24-33
発行日: 2005/07/10
公開日: 2010/10/14

DOI https://doi.org/10.11228/pcs1981.2005.24

ジャーナルフリー

抄録を表示する抄録を非表示にする

Since the analysis by Olson (1965), several articles have been devoted to the study of voluntary contribution to public goods, using various models. Especially, Palfrey and Rothenthal (1984) and Gradstein and Nitzan (1990) analyze binary contribution models assuming that communities are homogeneous. In their model, each player chooses whether to contribute to the public good or not. Gradstein and Nitzan (1990) show that the player with low cost is more likely to contribute if the community is homogeneous.
They consider only homogeneous communities. So we cannot understand what type of agent more willingly contribute. In this paper, we study this problem, considering heterogeneous communities. That is, we analyze the relation between each player's willingness to contribute and his or her cost of contribution.
In this paper, we assume that there are two types of agents in a community. One type is an agent with low cost and the other type is agent with high cost. We focus on the Nash equilibrium with symmetric mixed strategy. There are possibly some Nash equilibria with symmetric mixed strategy. In this paper, we prove that there is the Nash equilibrium with symmetric mixed strategy such that the agent with high cost more willingly contributes.
抄録全体を表示

PDF形式でダウンロード (2113K)
単峰型環境における制度設計

山邑紘史

公共選択の研究
2011年 2011 巻 56 号 53-57
発行日: 2011/07/15
公開日: 2014/07/13

DOI https://doi.org/10.11228/pcs.2011.56_53

ジャーナルフリー

PDF形式でダウンロード (313K)

J-STAGEへの登録はこちら（無料）