ベイズの統計学を学び始めたんだけど
■ このスレッドは過去ログ倉庫に格納されています
信用に値するのか疑問です。 人工知能とかではなく日々の動機付けに利用する予定です 《囚人Aの恩赦の超確率特論》 直感的怪答 AかCのいずれか1/2に上昇します。 ベイズ改訂で1/3から1/2になります。 模範解答 もともと3人だし、1/3のままである。 ワシの主観的快答 Aの恩赦確率は1ぢゃ。 快説しよう 看守は、 「Bは死刑」と言ったが、 「Aは死刑」とは言ってないし、 「Cは恩赦」とも言ってない。 ぢゃから、おそらく絶対100%、 B=死刑 、A=恩赦、 C=死刑ぢゃ。 証明オワリぢゃ >>429 死刑と恩赦が隣り合っているシュレティンガーな状態が正解 ■3囚人問題(英: Three Prisoners problem) ある監獄にA、B、Cという3人の囚人がいます 3人のうちランダムに選ばれた1人に恩赦が出ます 誰が恩赦になるかは看守は答えない 囚人Aに看守が「Bは死刑になる」と教えてくれます この時、看守は嘘は言いません 囚人Aに恩赦が与えられる確率は何%でしょうか? 死刑囚A,B,CでAが看守に尋ねてBは死刑執行されると告げられたと設定。 恩赦(onsha)を受けるをo,死刑執行されると告(tsuge)げられるをtで表す。 Aが恩赦を受ける確率P(A=o)=1/3 Bが恩赦を受ける確率P(B=o)=1/3 Cが恩赦を受ける確率P(C=o)=1/3 求めたいのは、Bが死刑執行されると告げられた後のAが恩赦を受ける確率P(A=o|B=t)である。 ベイズの公式により P(A=o|B=t) = P(B=t|A=o)*P(A=o) / P(B=t) P(B=t) = P(B=t|A=o)*P(A=o) + P(B=t|B=o)*P(B=o) + P(B=t|C=o)*P(C=o) P(B=t|B=o)=0 Bが恩赦を受けるときBが死刑執行されると告げられる確率=0 P(B=t|C=o)=1 CBが恩赦を受けるときBが死刑執行されると告げられる確率=1 問題は P(B=t|A=o) 恩赦を受けるのがAであるときに看守がCではなくBが死刑執行されると告げる確率は示されていない。 この確率をpとすると P(A=o|B=t)は p/(p+1)となる。 もちろんp=0.5であれば、P(A=o|B=t)=1/3と看守に告げられる前と同じである。 ここでpが一様分布からさまざなβ分布に従うとするとどうなるか、グラフにしてみた。 http://i.imgur.com/vIzIabU.png 左の緑が看守がBとCが死刑執行予定であるときにBを選んで答える確率分布。 右の青が看守がBと告げたときのAが恩赦を受ける確率の分布。 無情報分布として一様分布を考えると Aが恩赦を受ける確率の期待値(平均値)は > 1-log(2) [1] 0.3068528 となる。 p/(p+1)を [0,1]で定積分すれば求まる。 前述のJAGSでシミュレーションしたグラフに表示したもほぼ一致。 (タイプミス修正) 死刑囚A,B,CでAが看守に尋ねてBは死刑執行されると告げられたと設定。 恩赦(onsha)を受けるをo,死刑執行されると告(tsuge)げられるをtで表す。 Aが恩赦を受ける確率P(A=o)=1/3 Bが恩赦を受ける確率P(B=o)=1/3 Cが恩赦を受ける確率P(C=o)=1/3 求めたいのは、Bが死刑執行されると告げられた後のAが恩赦を受ける確率P(A=o|B=t)である。 ベイズの公式により P(A=o|B=t) = P(B=t|A=o)*P(A=o) / P(B=t) P(B=t) = P(B=t|A=o)*P(A=o) + P(B=t|B=o)*P(B=o) + P(B=t|C=o)*P(C=o) P(B=t|B=o)=0 Bが恩赦を受けるときBが死刑執行されると告げられる確率=0 P(B=t|C=o)=1 Cが恩赦を受けるときBが死刑執行されると告げられる確率=1 問題は P(B=t|A=o) 恩赦を受けるのがAであるときに看守がCではなくBが死刑執行されると告げる確率は示されていない。 この確率をpとすると P(A=o|B=t)は p/(p+1)となる。 もちろんp=0.5であれば、P(A=o|B=t)=1/3と看守に告げられる前と同じである。 ここでpが一様分布からさまざなβ分布に従うとするとどうなるか、グラフにしてみた。 http://i.imgur.com/vIzIabU.png 左の緑が看守がBとCが死刑執行予定であるときにBを選んで答える確率分布。 右の青が看守がBと告げたときのAが恩赦を受ける確率の分布。 無情報分布として一様分布を考えると Aが恩赦を受ける確率の期待値(平均値)は > 1-log(2) [1] 0.3068528 となる。 Cが恩赦を受ける確率の期待値(平均値)は > log(2) [1] 0.6931472 当然、Bが恩赦を受ける確率は0 >>436 看守は一人。 まあ、確率分布を何人もいたときの複数の看守意見の分布と考えてもいいけどね。 >>431 俺が高校生の頃に聞いた問題だと 本人には死刑になると教えない という設定だった。 何も知らないとAは死刑になる確率が2/3。 B、Cのうち少なくともどちらかは死刑になるので本人じゃないAに死刑になる人を一人教えてくれと看守に頼んでBと教わった。 それでAは自分かCのどちらかが死刑になるが確率は1/2に減ったと喜んだ。 これは正しいか? という問題だったな。 ■2つの封筒問題(two envelopes problem) 2種類の小切手があり、1つの小切手には 他方の4倍の金額が書き込まれています 中身が分からないように、それぞれ封筒に入れます あなたは、どちらか1つの封筒を選ぶことができます 封筒を開けると10万円の小切手が入っていました もし不満なら、残りの封筒と交換できます あなたは交換しますか?しませんか? >>440 1万と100万が入っているのはそれぞれ1/2 よって、期待値は50万となるため、入れ替えが良い >>440 >>441 の有難い話が本当なら、 10万円が交換するだけで 期待値が、5倍にupぢゃ。 きっとさらに、交換すれば5倍の5倍 ぢゃから、10倍にupするハズぢゃ スナワチ、100万円ぢゃ! ワシなら2回交換するぞ。 >>441 100万/10万なのか10万/1万なのか、前者の確率をpとして pの確率分布を考えるのがベイズ流だろね。 100万円が含まれている確率をpとして pの確率分布を事前分布として B_kokan <- function(p,A=10^5,n=10)p*A*n+(1-p)*A/n がどう変わるかみればいい。 グラフにしてみた。 http://i.imgur.com/jPAinUE.png >>443 ベイズ統計だと 1/10 10/100 100/1000 1000/10000 はみなちがいますね >>435 恩赦を受けるのがAであるとき(=BとCに死刑執行されるとき)に看守が、死刑執行されるのはBであると告げる確率 P(B=t|A=o) を横軸 死刑執行されるのはBであると告げられたときに恩赦を受けるのがAである確率 P(A=o|B=t) を 縦軸に グラフにしてみる。 http://i.imgur.com/xg0Ya0V.png 看守が嘘つきであった場合 看守が嘘を答える確率はqで一定である。 但しBとCが死刑執行予定であるときどちらを答えても嘘にならないのでBと答える確率をpとする。 この看守がBが死刑執行される予定であると答えたとき、Aが恩赦を受ける確率はいくらか? 恩赦を受けれる可能性は殺人件数に逆比例するという情報が得られた。 ABCの殺人件数をa,b,c とする。 看守がBが死刑執行されると告げたときのAの恩赦の確率はどうなるか? >>448 これでいいと思う。 p*(a/(a+b+c))/ ( p*(a/(a+b+c)) + q*(b/(a+b+c)) + (1-q)*(c/(a+b+c)) ) >>449 これだと恩赦確率が殺人件数比例になってしまうな。 考え直そう。 >>450 間違えてない気もしてきた。 ご意見募集。 >>451 P(A=o|B=t) = p*((1/a)/(1/a+1/b+1/c))/ ( p*((1/a)/(1/a+1/b+1/c)) + q*((1/b)/(1/a+1/b+1/c)) + (1-q)*((1/c)/(1/a+1/b+1/c)) ) だろな、たぶん。 Onsha <- function(a,b,c,p,q) { p*((1/a)/(1/a+1/b+1/c))/ ( p*((1/a)/(1/a+1/b+1/c)) + q*((1/b)/(1/a+1/b+1/c)) + (1-q)*((1/c)/(1/a+1/b+1/c)) ) } > Onsha(10,10,10,0.5,0) [1] 0.3333333 > Onsha(10,10,10,0.5,0.3) [1] 0.3333333 > Onsha(10,20,30,0.5,0.3) [1] 0.5660377 恩赦確率が同じときは、看守の嘘つき確率の影響は受けないね。 さいころ振ったら6が出ました つぎに6が出る確率はどうなる? 1 低くなる 連続で6が出る可能性はひくい 2 変わらない 6が出る確率は前に何が出たか影響を受けない 3 高くなる さいころがいかさまの可能性があるから >>448 囚人A,B,Cの殺人件数を3,6,9人とする。 罪状の重さに逆比例して恩赦が受けられるという。 恩赦の受けられる確率分布はディリクレ分布に従うとして 最小母数が1となるようにして母数alphaは3,1.5,1とする。 BとCが死刑執行されるときに看守がBが死刑と答える確率は一様分布に従う 看守が嘘をつく確率も一様分布に従うとする。 JAGSのスクリプトだとこんな感じ alpha=c(1/3,1/6,1/9)*9 modelString=' model{ abc ~ ddirch(alpha) poa=abc[1] # probability of onsha of A pob=abc[2] # probability of onsha of B poc=abc[3] # probability of onsha of C p ~ dbeta(1,1) q ~ dbeta(1,1) onsha= p*poa/ ( p*poa + q*pob + (1-q)*poc ) } この条件のもとで Aが恩赦を受ける確率分布は http://i.imgur.com/KHbXlhe.png となる。 まあ、殺人件数が一番少ないAが恩赦を受ける確率が 1/3から上昇したのは納得できる結果である。 こういうのがベイズ推計の面白さであるね。 なにがなんでも、P(A=o|B=t)の 誰よりも完璧な模範解答を探るべく >>435 の pの分布 について 一様分布ではなく f(p) = (2/3)p + 2/3 という確率分布で p/(p+1) の期待値は1/3になるか? 自分勝手にチャレンジしかし挫折。 一応、チャレンジ内容を説明すると A=恩赦、B=C=死刑の時の 看守が「B死刑」と告げる確率を P(B=t|A=o) とか、簡単にpとおく 看守が「B死刑」と告げた時の A=恩赦、B=C=死刑の確率を P(A=o|B=t) とおく。 すると、確かに P(A=o|B=t) = p/(p+1) となると思う。 さて、 pの確率分布 f(p) = (2/3)p + 2/3 pの範囲[0,1] で積分値は1となるが p/(p+1) の平均(期待値)を求めたい でも数学得意なワシぢゃが 計算が分からん。 ここでGiveUp。 鶴亀算に生死不明の猫や杖を持つ人間を登場させる必要は無い。 ■理由不十分の原則(principle of insufficient reason) 事象の発生確率の予測が全くできない場合に、 全ての事象の発生確率が等しいと仮定する >>456 p*f(p)を[0,1]で積分すれば5/9が得られる。 横着をしてWolframにやってもらって https://www.wolframalpha.com/input/?i=integral (x*(+2%2F3*x+%2B+2%2F3),0,1) 期待値は原点周りの一次モーメント。 >>454 ベイズ流にアプローチしてみた。 (1) 6の目のでる確率の分布を一様分布とすると 6の目が一回でたから事後分布はbeta(2,1)なので次に6の目がでる期待値は2/3 (2) 6の目の出る確率p6を1/6としてp6=1/6が正しい確率分布を一様分布とすると Y=c(1) dataList=list(Y=Y) modelString=' model{ Y ~ dbern(p6) p6=1/6*q+5/6*(1-q) q ~ dbeta(1,1) } ' でJAGSを走らせて Lower95 Median Upper95 Mean SD Mode MCerr p6 0.24522133917 0.600436 0.8333064 0.5731115 0.1781004 NA 0.001329018 を得て 平均 0.5731115 (3)6の目の出る確率が1/6を最頻値とする標準偏差0.1のβ分布に従うとすれば β分布のパラメータは a b 3.260234 12.301170 となるので 平均は0.2095077 >>456 すまん、 pの平均値じゃなくて p ~ f(p)のときのp/(p+1)の平均値 だな。 >>456 integral(x/(x+1)*(2/3x+2/3),0,1)=1/3 >>462 stanで検証 functions{ real jisaku_log(real y){ real temp; temp = 2/3.0*y+2/3.0; return log(temp); } } data{ } parameters{ real<lower=0,upper=1> p; } transformed parameters{ real q; q = p/(p+1); } model{ p ~ jisaku(); } mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat p 0.5626 0.0074 0.2836 0.0366 0.3364 0.5874 0.8107 0.9839 1464 1.0006 q 0.3364 0.0035 0.1325 0.0353 0.2517 0.3701 0.4477 0.4959 1418 1.0007 lp__ -2.0063 0.0336 0.9343 -4.5941 -2.2177 -1.6547 -1.4262 -1.3608 773 1.0030 >>460 どのアプローチでも6の目がでたというデータは 事後確率分布を6の目がでる方向に歪めるね。 >>461 von Neumann法で 2/3*x+2/3を密度関数とする[0,1]の乱数を発生させる。 Rのコードはこれ http://egg.2ch.net/test/read.cgi/hosp/1493809494/352 発生させた乱数pからp/(p+1)をつくってその分布を表示すると http://i.imgur.com/PFTeZ77.png 平均値1/3が確認できる。 >>460 (2)のアプローチをstanでやってみた。 data=list(Y=1) stanString=' data{ int Y; } parameters{ real<lower=0,upper=1> q; } transformed parameters{ real<lower=0,upper=1> p6; p6=1/6.0*q+5/6.0*(1-q); } model{ Y ~ bernoulli(p6); q ~ beta(1,1); } mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat q 0.3901 0.0030 0.2661 0.0157 0.1602 0.3512 0.5910 0.9289 7827 1.0003 p6 0.5733 0.0020 0.1774 0.2141 0.4393 0.5992 0.7265 0.8229 7827 1.0003 lp__ -2.6057 0.0103 0.8248 -4.9881 -2.8346 -2.2830 -2.0537 -1.9902 6400 1.0002 6の目のでる事後確率の平均値は 0.5733 でJAGSと同じ結果。 暇つぶしネタを与えてくれた>454に感謝 さいころ振ったら6が出ました つぎに6が出る確率はどうなる? 1 低くなる 連続で6が出る可能性はひくい 2 変わらない 6が出る確率は前に何が出たか影響を受けない 3 高くなる さいころがいかさまの可能性があるから #当然さいころがいかさまの可能性をかんがえるならば 6の出る可能性が1/6より小さいいかさまさいころで たまたま6がでた場合も含めるとする >>467 サイコロE1 = 6の目がでる確率は1/12 サイコロE2 = 6の目がでる確率は2/12 サイコロE3 = 6の目がでる確率は3/12 事前分布 P(E1) = P(E2) = P(E3) = 1/3 とまずは、勝手に設定し計算してみた 直感的怪答 1/6 単なる条件付確率ぢゃし、 事前分布はE1,E2,E3同じぢゃろ。 ぢゃから、 1/12、2/12、3/12 の単純平均で 2/12 約分すれば、1/6ぢゃ 模範解答 7/36 である。 1/12 , 2/12 , 3/12 の 1:2:3 の重み付き平均は7/36です。 ワタシの超怪答 1/6で良い 事前分布、P(E1) > P(E3) にすべきぢゃ ∵ 1/6ぢゃないのは、奇妙ぢゃ ちなみに、 P(E1) = P(E3) = 0、P(E2) = 1 ぢゃダメ イカサマぢゃなくても 1/6より微かにずれるものぢゃ >>467 6の目の出る確率がどの範囲ならイカサマでないとすんの? 6の出る可能性が1/6より小さいいかさまさいころ とすると (1) 6の目のでる確率の分布を一様分布とすると 6の目が一回でたから事後分布はbeta(2,1)なので次に6の目がでる期待値は2/3 p<1/6の確率は > pbeta(1/6,2,1) [1] 0.02777778 (2) 6の目の出る確率p6を1/6としてp6=1/6が正しい確率分布を一様分布とすると平均 0.5731115 p<1/16の確率は0 (3)6の目の出る確率が1/6を最頻値とする標準偏差0.1のβ分布に従うとすれば > pbeta(1/6,3.260234,12.301170) [1] 0.3785766 >>468 離散量で一様分布の真似なら サイコロE4 = 6の目がでる確率は4/12 ... サイコロE4 = 6の目がでる確率は12/12 も考えなくちゃだめだろ? >>469 直感的かつナナメな怪答 ちょっとでも1/6からずれてたら 数学的にイカサマぢゃ∴ サイコロの100%はイカサマぢゃ でも、しかし、試験なら、 6の目確率は、常に1/6で計算ぢゃ。 ナナメな模範解答 そっか、鋭い質問 ちょっとなら1/6からずれても 良いことにしないと、 サイコロの100%はイカサマになるか >>471 直感的かつナナメな怪答 そんなことより、6の確率が 事前分布の平均 ≧ 1/6 事後分布の平均 ≦ 1/6 となる事前分布どっかにないかな!? 誰かそんな事前分布で計算しないかな 模範解答擬き P(E4) = P(E5) = … = P(E12) = 0 にしないと計算が大変 (^_^;) >>466 自分で気付いたけどこのスクリプトは間違いだね。 >>472 死刑囚の話に戻るけど f(p) = (2/3)p + 2/3 という確率分布 って何の意味があるの? >>474 確率分布を事前分布とした理由は 今考え直したら支離滅裂な直感でした。 意味は、概ね何でもない。ので 気にしないで下さい。 あえて意味を言えば、 P(A=o|B=t) の平均が1/3となるような P(B=t|A=o) の確率分布というだけ 支離滅裂な内容ですが説明すると、 pが定数1/2とするなら、 P(A=o|B=t) = p/(p+1)より、 P(A=o|B=t) = 1/3 となる。 だから、 pの平均が1/2の確率変数なら、 P(A=o|B=t)の平均も1/3だろうと確信。 しかし、計算すると、 pの平均が1/2の連続一様分布なら、 P(A=o|B=t)の平均はln(2)=0.30685のようだ では、P(A=o|B=t)の平均が1/3となる pの分布はどんな分布なのか知りたくなる そう、 f(p=0) : f(p=1) = 1 : 2 な確率分布かな だから、 f(p) = (2/3)p + 2/3 という確率分布 を 事前分布とする。 まっ、今見直と、支離滅裂です。(^_^;) >>475 確率密度関数がa*x+bの形なら integral(x/(x+1)*(a*x+b),0,1)= a *(log(2) - 1/2) + b*(1- log(2)) = 1/3 を満たすときでしょうね。 >>467 あらゆる可能性考えて 具体的な数字をださなくてもいいなら @古今東西振られたサイコロのうちそれがいかさまであるという確率は相当ひくいとおもう Aいかさまである場合に 6の出る確率が6分の1超である場合と 6分の1以下である場合が打ち消しあうことになるが 6分の1以下である可能性はそんなにたかくないしだろうし、ふれ幅も小さいから 若干の打消しが生じるくらいだろう Bいかさまである場合に 6の出る確率が6分の1超であるときにおいては あからさまないかさまをしてる可能性はひくいので 1/6と1の間くらいの0.6前後くらいが期待値になるのではないかな 総合的に考えれば 6が出た後に6が出る確率は6分の1よりおおきくなるだろうが @の影響がかなりおおきくて ほとんど無視できるれレベルだとおもう P(B=t|A=o)がベータ分布(α、β)に従うときのP(A=o|B=t)をグラフにしてみた。 http://i.imgur.com/UUwhw8K.png ベイズのアプローチでは6の目がでたというデータは 事後確率分布を6の目がでる方向に歪めるね。 サンプル数が増えると極端な値が減って回帰するというのが頻度主義かな? >>463 最新の書式だとこう書くみたい target+=ってC言語ぽいね functions{ real jisaku_lpdf(real y, real a, real b){ real temp; temp = a*y + b; return log(temp); } } data{ real a; real b; } parameters{ real<lower=0,upper=1> p; } transformed parameters{ real q; q = p/(p+1); } model{ target += jisaku_lpdf( p | a, b); } 1/6と1の間くらいの0.6となるベータ分布の母数の関係をグラフにしてみる。 pbeta(1/6,x,y,lower.tail = FALSE)=0.6の陰関数のグラフ化となる。 http://i.imgur.com/cWVHUgZ.png >>472 >そんなことより、6の確率が > 事前分布の平均 ≧ 1/6 > 事後分布の平均 ≦ 1/6 > となる事前分布どっかにないかな!? ベータ分布では存在しない。 ベータ分布の形状母数をa,bとするとa,bとも正の数なので 事前分布の平均=a/(a+b) > 1/6 から 6a>a+b 5a>b b<5a (1) 事後分布の平均=(a+1)/(a+b+1) < 1/6 から 6a+6<a+b+1 5a<b-5 (2) (1)(2)からb<b-5と矛盾する。 >>453 BとCの恩赦確率が同じときは看守が嘘つきであっても Aの恩赦確率はp/(p+1)のまま。 pはP(B=t|A=o)、Aが恩赦のとき死刑になるのはBと看守が答える確率。 >>485 よくみたらこれは間違い。 嘘つき確率の影響はないが Aを含む事前恩赦確率の影響は受ける。 無限個の部屋があるホテルに無限の人数客が泊まって 満室の状態だと思って下さい そこに1人の客が泊まりにきました そこで、既に泊まっている全員に隣の部屋に 移動してもらうことで、その人を泊めることができました >>447 p:P(B=t|A=o)Aが恩赦(BとCが死刑執行される)とき看守がBと答える確率 q:看守が嘘をつく確率 P(B=t|B=o) Bが恩赦を受けるときBが死刑執行されると告げられる確率 = q P(B=t|C=o) Cが恩赦を受けるときBが死刑執行されると告げられる確率 = 1-q P(A=o|B=t) = P(B=t|A=o)*P(A=o) / P(B=t) P(B=t) = P(B=t|A=o)*P(A=o) + P(B=t|B=o)*P(B=o) + P(B=t|C=o)*P(C=o) = p * P(A=o) + q * P(B=o) + (1-q) * P(C=o) P(A=o|B=t) = p*P(A=o) / ( p*P(A=o) + q * P(B=o) + (1-q) * P(C=o) ) P(A=o)= P(B=o)= P(C=o) = 1/3ならば P(A=o|B=t) = p /(p+1) アキレスが亀に追いつくまでの時間をtとすると t=(1/∞)x∞=∞/∞=1 カスかどうかの件 1の代わりに勝手に ワシが非ベイズアプローチで怪説しよう。 新情報>>492 の「確か」を96%とし、 帰無仮説☆ : 1はカスなんかではない。 帰無仮説☆が正しい確率は、4% 2シグマのP値はモピロン2.5%な訳ぢゃから 帰無仮説☆の廃棄は、ダメ。スナワチ、 帰無仮説☆は採択ぢゃ。 結論 非ベイズアプローチにより、 特段、カスでない! 以上ぢゃ ■駒は全部で10個 歩兵2 騎兵2 象2 将軍1 王1 (王が一番強く歩兵が一番弱い) 妃1 (王にだけ勝つ) インドラ1 (すべての駒に勝つが使えるのは一度だけ) 二人のプレーヤはそれぞれこの10個の駒を持つ 二人のプレーヤは互いに駒をひとつだけ選び、 ゲーム版の中央に置く この時、相手から駒が見えないようにドアがある 互いの駒が決まったらドアオープン 勝った駒は自陣に戻り何度でも使える 負けた駒はゲームから除外される 王を失うと負け 引き分けの時は残った駒の多いほうが勝ち >>495 >>496 1手目インドラぢゃ 相手が王を出せば、いきなり勝ちぢゃ✌ このゲームに負けると虎に食われます 真剣にやりましょう >>497 インドラに歩兵をぶつけられたら目も当てられない そうか、 インドラって奴 ・すべての駒に勝つ★ ・使えるのは一度だけ☆ すべてのに勝つ と謳ってるが☆より ・王にだけ勝つ ・王以外、妃とか歩兵でも相打ち と同値ぢゃないか。 かなりヨワッチー奴ぢゃった。 よし、作戦を練り直しぢゃー ■駒は全部で10個 王1 将軍1 象2 騎兵2 歩兵2 (王が一番強く歩兵が一番弱い) 妃1 (王にだけ勝つ) インドラ1 (すべての駒に勝つが使えるのは一度だけ) 二人のプレーヤはそれぞれこの10個の駒を持つ 二人のプレーヤは互いに駒をひとつだけ選び、 ゲーム版の中央に置く この時、相手から駒が見えないようにドアがある 互いの駒が決まったらドアオープン 勝った駒は自陣に戻り何度でも使える 負けた駒はゲームから除外される 相打ちの時はともにゲームから除外 王を失うと負け 引き分けの時は残った駒の多いほうが勝ち ただし、インドラと妃は含めない ■Obituary - John Forbes Nash, Jr. (1928 - 2015) Swarajya-2015/05/25 Nash is mostly known for his equilibrium concept called as “Nash Equilibrium”. For many years before his seminal paper, legends like von Neumann were working on the theory of games with a special focus on Zero-sum games. >>493 >>1 はユーチューバーって判明してるwww 黒木玄(数学家) https://twitter.com/genkuroki/status/783660733066125312 > モンティホール問題とベイズ統計は関係ないよね。 「ベイズ更新」≒「サンプルサイズ増えた」 で選び直すじゃないの? これ意味わからん 「関係ない」がなにを意味するのかしらんが ベイズの定理でも解けるってだけやろ 何が言いたいのかよく分からん >>507 ざっと見ただけだが 「ベイズ=主観確率って思ってる人多いよね」ってかいてるから そのながれで「モンティホールと主観確率は関係ないよね」って言いたいんじゃないの? その本もってるけど不十分理由の原則にはふれてるけど 主観確率なんてことばは説明の中でつかってないけどな。 この本は殆どがベイズ定理の説明で 中身すっからかんでベイズ統計についてはほとんど説明してない印象だけどな。 プレーヤーが選んだ箱をA、司会者モンティーホールが開けたハズレの箱をB、残った箱をCとする。 Aがアタリ(atari)の確率をP(A=a)、Aがハズレの確率をP(A≠a) 司会者がBを開ける(open)確率をP(B=o)と表すことにする。 残った箱Cがアタリである確率P(C=a|B=o)は ベイズの公式から P(C=a|B=o) = (P(B=o|C=a)P(c=a)) / P(B=o) P(B=o) = P(B=o|C=a)P(C=a) + P(B=o|C≠a)P(C≠a) = 1*1/3 + 1/2*2/3 = 2/3 ゆえに P(C=a|B=o) = (P(B=o|C=a)P(c=a)) / P(B=o) = (1/3) / (2/3) = 1/2 BがハズレとわかったあとでAがアタリである確率 P(A=a|B=o) = P(B=o|A=a)P(A=a)/P(B=o) P(B=o) = P(B=o|A=a)P(A=a) + P(B=o|A≠a)P(A≠a) P(B=o|A=a)はAがアタリであるときにBがハズレとして開けられる確率pは問題で示されていない。 不十分理由の原則に準じてpを0.5とするか一様分布に従うとするのが一般的だと思う。 P(B=o|A=a)=pとおくと P(B=o) = P(B=o|A=a)P(A=a) + P(B=o|A≠a)P(A≠a) = p*1/3 + 1/2*2/3 = p*1/3 + 1/3 ゆえに P(A=a|B=o) = p*1/3 / ( p*1/3 + 1/3 ) = p/(p+1)となる。 p=0.5ならBがハズレというデータはAがあたりの確率に影響を与えず1/3である。 >>512 これは間違いだな。 P(B=o|A=a)=pとおくと P(C=a|B=o)= 1/(p+1) になると思う。 >>512 こちらが正しい。 プレーヤーが選んだ箱をA、司会者モンティーホールが開けたハズレの箱をB、残った箱をCとする。 Aがアタリ(atari)の確率をP(A=a) 司会者がBを開ける(open)確率をP(B=o)と表すことにする。 残った箱Cがアタリである確率P(C=a|B=o)は ベイズの公式から P(C=a|B=o) = (P(B=o|C=a)P(c=a)) / P(B=o) P(B=o) = P(B=o|A=a)P(A=a) + P(B=o|B=a)P(B=a) + P(B=o|C=a)P(C=a) = P(B=o|A=a)*1/3 + 0*1/3 + 1*1/3 ここで P(B=o|A=a)=pとおくと = p*1/3 + 1/3 ゆえに P(C=a|B=o) = (P(B=o|C=a)P(c=a)) / P(B=o) = (1*1/3) / (p*1/3 + 1/3) = 1/(p+1) p: Aがアタリの時に司会者がBを開ける確率 P(A=a|B=o) = p/(p+1) Bが開けられた後、Aがアタリの確率 (1) P(C=a|B=o) = 1/(p+1) Bが開けられた後、Cがアタリの確率 (2) (1)/(2) = p なので (2)は(1)以上である。(∵0<= p <=1) ゆえに 残った箱Cの方がアタリの確率は高い。 回答者が当たりの扉を選んでいる場合は、 残りの扉からランダムに1つを選んで開けるとするという条件は、 頻度確率では何の意味も持たないことに留意すべきである もっとも、ベイズ確率の計算においても、 理由不十分の原理を適用すれば、 「Aが当たりである場合に司会者が Bを開ける確率P(B | A) 」を 1/2とすることに合理性がある 頻度主義とは、 『ある事象が起きる頻度の観測結果に基づいて、 無限回繰り返した際の極限値』として定義される 『一回』は繰り返すことができない したがって、一度きりの出来事に頻度主義の極限値を 当てはめることはできない アタリ確率を恩赦の確率と読みかえて 一様分布を前提にすれば 無情報分布として一様分布を考えると Aが恩赦を受ける確率の期待値(平均値)は > 1-log(2) [1] 0.3068528 となる。 Cが恩赦を受ける確率の期待値(平均値)は > log(2) [1] 0.6931472 当然、Bが恩赦を受ける確率は0 >>521 恩赦が複数回与えられる条件でないと成立しない >>522 ベイズでの確率はcredibilityなので問題なし。 そもそも、 囚人Aの目線では、 看守が、「Xが死刑」と告げても Xは、Aでないというだけで、 Xが、BかCなのか囚人Aは判断できない。 囚人Aの主観的確率は、 P(B=o | 看守からの情報ゲット前) = 1/3 P(B=o | 看守からの情報ゲット後) = 1/2 ∴ P(A=o | 看守からの情報ゲット前) = 1/3 P(A=o | 看守からの情報ゲット後) = 1/3 となり、確変しないかと。 >>524 Aが難聴でない限り Xが、BかCなのか囚人Aは余裕で判断できる >>521 さんの計算が、 完璧か本気で検証してみた。 なお、看守は10人で、検証ぢゃ。 まずは、主観的な事前確率分布ぢゃ P(B=t | A=o)をpとおき、 E1 ≡ 看守1 は、p = 19/20 E2 ≡ 看守2 は、p = 17/20 E3 ≡ 看守3 は、p = 15/20 E4 ≡ 看守4 は、p = 13/20 E5 ≡ 看守5 は、p = 11/20 E6 ≡ 看守6 は、p = 9/20 E7 ≡ 看守7 は、p = 7/20 E8 ≡ 看守8 は、p = 5/20 E9 ≡ 看守9 は、p = 3/20 E10 ≡ 看守10 は、p = 1/20 P(E1) = P(E2) = … = P(E9) = P(E10) = 0.1 P(A=o│B=t ) = p / (1+p) より、 P(A=o│B=t∧看守1 ) = 19/39 …(1) P(A=o│B=t∧看守2 ) = 17/37 …(2) P(A=o│B=t∧看守3 ) = 15/35 …(3) P(A=o│B=t∧看守4 ) = 13/33 …(4) … P(A=o│B=t∧看守9 ) = 3/13 …(9) P(A=o│B=t∧看守10 ) = 1/11 …(10) (1)〜(10) の平均を計算すると、0.3072ぢゃ ちなみに、1 - log(2) = 0.3069 ぢゃ 差は微かぢゃ、ぢゃからOKぢゃ 疲れた。 タイプミス改訂 改訂後、 P(A=o│B=t∧看守9 ) = 3/23 …(9) P(A=o│B=t∧看守10 ) = 1/21 …(10) ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.4.7 2024/03/31 Walang Kapalit ★ | Donguri System Team 5ちゃんねる