ベイズの統計学を学び始めたんだけど

**１３２人目の素数さん** · 2017/12/03(日) 00:52:27.23

信用に値するのか疑問です。
人工知能とかではなく日々の動機付けに利用する予定です

**１３２人目の素数さん** · 2017/12/31(日) 19:24:01.77

>>376
理論値は

[1] 0.00001262228 0.00306721363 0.03944461975 0.21214263175 0.74533291259

まあ、よく一致しているな。

**１３２人目の素数さん** · 2017/12/31(日) 20:15:10.88

イカサマコインの定義をｐ＝０．５以外とすると

表確率0.01のコインである確率　1/100
表確率0.02のコインである確率　1/100
....
表確率0.99のコインである確率　1/100
表確率1.000のコインである確率 1/100

1-0.5^5/(0.01^5+0.02^5+...+0.99^5+1.00^5) = 0.9981801

0.001単位で区切ると 0.9998131になってしまうね。

**１３２人目の素数さん** · 2017/12/31(日) 20:21:32.08

ベイズ統計学で
トランプのシャッフルについての見識は得られる？
十分シャッフルされた状態にするのに
どういう切り方で何度やればいいかとか

**１３２人目の素数さん** · 2017/12/31(日) 22:29:56.85

あけおめ！
おまえらの似非統計今年もたのしむわｗｗｗｗｗｗｗｗｗｗｗｗ

**１３２人目の素数さん** · 2017/12/31(日) 23:55:46.53

>>373

>>ベイズだとp=1/6の確率分布を一様分布とすると
>>10回サイコロを振って7回でて

10回サイコロを振って7回1の目が出たのなら、0.6～0.7の当たりにピークを持つような
分布になることが予想されるけど、示されている図は、0に近いところにピークが来るよ
うなグラフになってます。この図は、1以外の目のグラフじゃないですか？

「１の目が出すぎで歪んでいる」≠「(1以外の例えば)６の目が出なさすぎで歪んでいる」
だと思います。

**１３２人目の素数さん** · 2018/01/01(月) 00:08:06.35

　　　　　 ∧＿∧
　　　　　（ ´Д｀）　新年あけまして
　　　　 /　　　　ヽ
　　　　し、__X__,ノJ

　　　 /´⌒⌒ヽ
　　　　ｌ⌒ 　　⌒ｌ　おめでとうございます
　　　⊂ （　　　） ⊃
　　　　　 V￣V

**１３２人目の素数さん** · 2018/01/01(月) 00:08:36.83

>>381
目の出る確率ではなくてp=1/6が正しい確率の分布。
サイコロを投げる前はp=1/6である可能性は0.01でも0.99でも同じ一様分布だったが
10回中７回、一の目がでたことから
p=1/6が正しい確率の分布が0に近い方にピークを持つようになった。

**１３２人目の素数さん** · 2018/01/01(月) 00:38:54.91

なるほど、そうだったんですか。
>>297に描かれている図の方は、「各目の出る確率の分布」だったので、
てっきり、そのような分布だと思っていました。
>>373は、「1の目の出る確率が1/6で正しいかどうか」の確率のようなものとのことですが、
逆に、「1の目の出る確率」のようなものも、同時に求めることも出来るんですか？

**１３２人目の素数さん** · 2018/01/01(月) 01:16:39.05

サイコロを投げる前（事前確率分布）と１０回投げて０～７回１の目がでた時のp=1/6が正しい確率の分布をグラフにすると

http://i.imgur.com/P1sng4W.png

確率の平均の最大値は１０×1/6回あたりにあるのがみてとれる。

**１３２人目の素数さん** · 2018/01/01(月) 01:49:47.01

別種のグラフだと言うことがよく分かりました。
わざわざありがとうございました。

**１３２人目の素数さん** · 2018/01/01(月) 08:18:33.42

>>384
>逆に、「1の目の出る確率」のようなものも、同時に求めることも出来るんですか？

同時には求まらない。
１の目の出る確率を一様分布とするすれば10回中7回1の目がでた後の事後分布はbeta(1+7,1+10-7)なので平均8/12,最頻値7/10になる。

サイコロの目なので最頻値1/6、分散0.1^2と主観的に事前確率分布を決めてしまえば
これに相当するβ分布のパラメータは3.26,12.3となるので（この計算はやや面倒）
平均値0.4015354 中央値0.3989152 最頻値0.3858124　で　95％信用区間は 0.2189457～ 0.5873959

この様子をRのパッケージBESTのplotPost関数を改造してグラフにすると

http://i.imgur.com/YcfKDO9.png

**１３２人目の素数さん** · 2018/01/01(月) 10:56:56.09

>>387(補足)

>サイコロの目なので最頻値1/6、分散0.1^2と主観的に事前確率分布を決めてしまえば

と書いたが

サイコロの目は６面あるから事前分布の最頻値を1/6にするのはまあいいとして分散の値の根拠がないじゃないか、との批判は当然。

そこで標準偏差が0～100の間で一様分布するとして

JAGSでMCMCしたのが以下のグラフ。

http://i.imgur.com/72xn58M.png

分散0.1^2のときより歪なのが明らかになったといえる。

**１３２人目の素数さん** · 2018/01/01(月) 12:30:52.15

>>388（補足の補足）

＞サイコロの目は６面あるから事前分布の最頻値を1/6にする

これだって主観的過ぎるという異論も当然ある。

１の目のでる確率の平均（正規分布を仮定するので最頻値と一致）も平均1/6で標準偏差が一様分布に従うとしてMCMCでサンプリングしてみた。

（標準偏差は０～１００の範囲の一様分布に設定）

http://i.imgur.com/i2OFAo1.png

一の目がでる値の平均値は2/3程度で平均の平均を1/6と固定したときとあまり変わらない。

**１３２人目の素数さん** · 2018/01/01(月) 12:38:18.73

Gelmanの主張に従って標準偏差の事前分布をhalf-cauchy分布にしてみた。

尺度母数=5での結果をグラフにすると

http://i.imgur.com/5Qm4wfP.png

コーシー分布なだけあって1000を超える値がサンプリングされている。

それでも、１の目の出る確率の平均は2/3程度で他の結果と同じ。

**１３２人目の素数さん** · 2018/01/01(月) 12:42:40.06

コインを10回なげて7回表なら
表確率7/10 つまり0.7のはずぢゃ！

しかし、これは神の御告げによると、
子供騙しな計算とのことぢゃ。

表確率は、神の御告げでは、
(7+1)/(10+2) つまり8/12　だから2/3
0.7とは違うよ！とのこと

なので、ベイズの確率で手計算で検証ぢゃ

まっ、
事前確率の分布は、連続一様分布ぽく
　表確率0.1のコイン確率　20%
　表確率0.3のコイン確率　20%
　表確率0.5のコイン確率　20%
　表確率0.7のコイン確率　20%
　表確率0.9のコイン確率　20%
　‎としてみる。

で、
7回連続で表、その後3回連続で裏の確率
それを100万倍すると、
　　0.1^7 * 0.9^3 * 1000000 = 0
　　0.3^7 * 0.7^3 * 1000000 = 75
　　0.5^7 * 0.5^3 * 1000000 = 977
　　0.7^7 * 0.3^3 * 1000000 = 2223
　+) 0.9^7 * 0.1^3 * 1000000 = 478
　───────────────
　‎　　　　　　　　　total = 3753

ぢゃから、
事後確率は、
　表確率0.1のコイン確率 0%
　表確率0.3のコイン確率 2% ∵75/3753　
　表確率0.5のコイン確率 26% ∵977/3753
　表確率0.7のコイン確率 59% ∵2223/3753
　表確率0.9のコイン確率 13% ∵478/3753
　‎ぢゃ

ぢゃから、
10回中7回表で、表確率0.7コインの確率は、
改訂前 20%　
改訂後 59%　に改訂ぢゃ

ちなみに、表確率の平均ぢゃが、
改訂前 0.5
改訂後 0.67　に改訂ぢゃ
　　∵(0.3*2 + 0.5*26 + 0.7*59 + 0.9*13)/100

神の御告げは、出鱈目なのに冴えている。

**１３２人目の素数さん** · 2018/01/01(月) 14:56:56.97

beta(1+7,1+10-7)のβ分布になるので期待値は8/12、最頻値が10/7
パラメータを
a=8
b=4
とおいて
最頻値　(a-1)/(a+b-2)
平均値　a/(a+b)
分散　a*b/((a+b)^2*(a+b+1))

というだけの話。

事前分布の期待値や分散に様々な仮定をおいてもこの結論はほぼ同じ。
分散の事前分布に半コーシー分布(尺度母数５）を使うと事後分布がβ分布でよく当てはまるのだが、
http://i.imgur.com/RB9Q3GH.png
逆ガンマ関数（母数＝0.001）を使うとずれが大きい。
http://i.imgur.com/9YCgXof.png

**１３２人目の素数さん** · 2018/01/01(月) 21:11:56.66

正月休みの暇つぶしクイズ

薬剤ｙを1人ずつ投与して効果判定したら、3人めで効果が確認できた。
薬剤ｇを9人同時に投与したら3人に効果があった。
どちらの有効性が高いか？

別バージョン（こっちがオリジナルｗ）

ゆるゆる女子大生に1人ずつメールで誘ったら3人めが開脚。、
がばがば女子大生9人に一斉にメールを送ったら3人が開脚。
どっちが開脚が容易か？

頻度主義からするとどちらも１/3だから優劣なしになるのだが、
ベイズ統計における確率はcredibility（確信の度合い、信憑性や説得力の度合いと言ってもいい）なので
議論の余地がある。

**１３２人目の素数さん** · 2018/01/01(月) 21:40:26.36

■モンティホール問題（チャーハンと餃子）

このゲームができるのは1回だけです

チャーハン99皿と餃子1皿を個別に
外からは中が見えない100個の箱に入れます

その中から1個の箱を選びます

チャーハンが入った98個の箱を取り除きます

最後に残った2個の箱の中から1個の箱を選びます

あなたが餃子を当てる確率は何％でしょう？

**１３２人目の素数さん** · 2018/01/02(火) 02:08:33.95

>>393
頻度論ってそんなんだっけ？
頻度論は無限に思考を行ったときの頻度が確率といっちするっていう
確率とはなにかの解釈であって
３回やったうち１回あることがおきたなら
三分の一の確率だというもんじゃなかったような
明確な定義なんてないんだろうけど
頻度と頻度論的確率解釈をごっちゃにしてるような

一応ぐぐったけど明確な定義らしきものはみつからからなかったので
英語版ウィキみたらやっぱりそうかいてる

**１３２人目の素数さん** · 2018/01/02(火) 02:27:16.20

あと検定とが信頼区間求めるとかしないといみないんじゃない？
あと何回目で成功するは幾何分布やから
３分の1の確率で成功するとするなら
三回目に成功する確率は
(1/3)*(2/3)^2＝ 0.1481481
じゃないのかなあ

**１３２人目の素数さん** · 2018/01/02(火) 04:46:33.00

検者の意図で変わるp値。

（修正再掲）
ある大学の入学者男女の比率は１であるという帰無仮説を検定する課題が花子と太郎に課された。

花子は５０人を調査できたら終了として入学者を５０人をみつけて１８人が女子であるという結果を得た。
帰無仮説のもとで
５０人中１８人が女子である確率は 0.01603475
これ以下になるのは５０人中０～１８人と３２～５０人が女子の場合なので
両側検定して
> sum(dbinom(c(0:18,32:50),50,0.5))
[1] 0.06490865
> binom.test(18,50,0.5)$p.value
[1] 0.06490865
で帰無仮説は棄却できないと結論した。

一方、本番と十八番が好きな太郎は一人ずつ調べて１８人めの女子がみつかったところで調査を終えることにした。
１８人めがみつかったのは花子と同じく５０人めであった。
帰無仮説のもとで
１８人がみつかるのが５０人めである確率は0.005772512
これ以下になるのは２３人以下５０人以上番めで女子１８人めがみつかった場合なので
両側検定して
pnb=dnbinom(0:999,18,0.5)
> 1 - sum(pnb[-which(pnb<=dnbinom(50-18,18,0.5))]) # < 0.05
[1] 0.02750309
で帰無仮説は棄却される。

どちらの検定が正しいか、どちらも正しくないか？
検定する意図によってｐ値が変わるのは頻度主義統計の欠陥といえるか？

**１３２人目の素数さん** · 2018/01/02(火) 04:51:42.20

>>396
レスありがとう。
幾何分布と二項分布の比較になる。
グラフにするとこんな感じ。
http://i.imgur.com/9tPLoW9.png
最頻値や期待値を比べてどう解釈するかの議論ではないかと思う。

**１３２人目の素数さん** · 2018/01/02(火) 05:33:08.57

確率質量関数と確率密度関数をグラフにしてみた。

http://i.imgur.com/Ep2EHFJ.png

**１３２人目の素数さん** · 2018/01/02(火) 07:43:25.38

サイコロを2回投げて1の目が2回続いた。
この確率は(1/6)^2=0.02777778
この確率以下の事象の起こる確率の総和がｐ値であるから
1,1の目のでる確率1/36
1,2の目のでる確率1/36
1,3の目のでる確率1/36
...
6,5の目のでる確率1/36
6,6の目のでる確率1/36
全部たすと１になる。
ゆえに、頻度主義統計のもとではイカサマサイコロは存在しない。

**１３２人目の素数さん** · 2018/01/02(火) 10:53:13.85

検定はまったくのごまかしだが
区間推定もたいがいなまやかしだな

**１３２人目の素数さん** · 2018/01/02(火) 11:10:15.05

>>398
なにの主張なのかよくわからんけど
分布の形がにてるたら別にどの確率分布をつかってもいいってこと？

頻度論てき確率の問題かどうかの話にはなってないし
頻度論とかの問題じゃなく
実験の結果によって実験をかえる
つまり、成功したらそこでやめる
実験計画にもんだいがあるんだけど
事前に何回やって得られたデータから分析をおこなうってのと
事前に何回やるかきめずに成功したらそこで実験をやめるってのは
根本的に違うし後者は安易にやるべきじゃない。

**１３２人目の素数さん** · 2018/01/02(火) 11:15:09.96

>>402
>事前に何回やるかきめずに成功したらそこで実験をやめるってのは
>根本的に違うし後者は安易にやるべきじゃない。

それはまさに正論。

p<0.05になったらサンプリングをやめるというイカサマに騙される椰子大杉。

**１３２人目の素数さん** · 2018/01/02(火) 11:16:32.46

>>402

細くて長い　のと　太くて短いのが　どちらが有用かという価値判断だな。

チン〇の話ではないぞｗｗｗ

**１３２人目の素数さん** · 2018/01/02(火) 11:51:00.03

>>393

開脚率の期待値を計算してみた。

ゆるゆる女子大生の開脚率期待値：ｒ人目で初めて開脚
r=3
Ex.yuru <- function(r){
integrate(function(x)x*(1-x)^(r-1)*x,0,1)$value/integrate(function(x)(1-x)^(r-1)*x,0,1)$value
}
Ex.yuru(r)
2/(r+2)

がばがば女子大生の開脚率期待値：N人中ｚ人開脚
N=9
z=3
Ex.gaba <- function(N,z){
integrate(function(x) x*choose(N,z)*x^z*(1-x)^(N-z),0,1)$value/integrate(function(x)choose(N,z)*x^z*(1-x)^(N-z),0,1)$value
}
Ex.gaba(9,3)
(z+1)/(N+2)

**１３２人目の素数さん** · 2018/01/02(火) 12:17:16.24

>>404
ごめん
なにがいいたいのかわからん

**１３２人目の素数さん** · 2018/01/02(火) 12:49:46.01

本人が分かってないし

**１３２人目の素数さん** · 2018/01/02(火) 13:01:02.65

両女子大生の開脚率の事前確率を一様分布として事後分布をグラフにしてみた。

http://i.imgur.com/WLg1Cw1.png

**１３２人目の素数さん** · 2018/01/02(火) 13:03:46.13

>>405
ちがうよそれ
その式ならｒ（最初の成功がでるまでの試行回数。ふつうはこっちをｘとく）について積分しないといけない
ｘ（確率。ふつうはｐとおく）がパラメータ

幾何分布の期待値は１/ｐだからｐを推定しないともとまらない
二項分布の期待値はｎｐ
393の例の設定でやるなら幾何分布の期待値は３で二項分布も３
np=1/pが成り立つときに二項分布と幾何分布の期待値はひとしくなる

二項分布やら幾何分布の確率分布図のｘ軸や確率分布関数ｆ（ｘ）のｘは確率じゃないよ

**１３２人目の素数さん** · 2018/01/02(火) 13:07:31.56

>>406

最頻値での確率を重視するなら、がばがば女子大生

平均値（期待値）を重視するなら、ゆるゆる女子大生

ということ。

**１３２人目の素数さん** · 2018/01/02(火) 13:13:55.97

Ｒつかいたいだけで何やってるか全然わかってなさそうな人だな

**１３２人目の素数さん** · 2018/01/02(火) 13:26:19.92

>>409

確率の期待値を計算したいのであって、回数の期待値を計算したいわけではないから問題なし。

β分布の横軸は０～１までの確率だよ。

事前確率分布一様分布が9回試行して3回成功することでβ（1+3,1+6)のβ分布にベイズ更新されるというお話。

**１３２人目の素数さん** · 2018/01/02(火) 14:01:36.23

>>409
階層ベイズモデルのスクリプト書いたことない？
>393のだと
ゆるゆる開脚率p1
がばがば開脚率p2
とその差diff
の分布を求めるMCMCを実行。
横軸は当然、確率。
縦軸は確率密度。
JAGSで書けばこんな感じ。
model{
for(i in 1:r){
y[i] ~ dbern(p1)
}
z ~ dbin(p2,N)
diff = p1 -p2
p1 ~ dbeta(1,1)
p2 ~ dbeta(1,1)
}

**１３２人目の素数さん** · 2018/01/02(火) 14:32:32.36

>>393
薬剤y = 効果があったのが1人いた。そこで
　　　　実験止めたら、3人に実験してた。
薬剤y' = 3人同時で、1人効果あり

薬剤g' = 効果があったのが3人になったとき
　　　　実験止めたら、9人に実験してた。
薬剤g = 9人同時で、3人効果あり

としたとき、安易には
P(y) = P(y') = P(g) = P(y') = 1/3　なのぢゃが

多分、
P(y) = P(y') = 2/5 > P(g') = P(g) = 4/11
ぢゃろう。何となく

なお、
薬剤g'' = 効果があったのが1人いた。
　　　　その時点で7人に実験してた。
　　　　‎で、実験は続行したら、
　　　　‎ラッキーなことに、
　　　　‎8人目、9人目　効果があり
　　　　‎そこで実験を止める。
としたとき、

心理的に、P(g'') > P(g) = 4/11 ぢゃが。

**１３２人目の素数さん** · 2018/01/02(火) 14:32:58.81

>>412
なるほどね
>>400
統計的検定においても
きむ仮説を何にするか有意水準をなににするかは一意にきめられることではない
主観確率でつまりさいころが明らかに不正であるという印象があるなら
きむ仮説や有意水準はかえることができる
たとえば１でそうにない１が出る確率について検定することになる
それは主観確率じゃないかというはなしになるが
結局はそういうことになる
確率とは
主観確率と古典確率と頻度確率を折衷したものなんだから
主観確率だって頻度確率やら古典確率を考慮に入れて決定されるのだから。

**１３２人目の素数さん** · 2018/01/02(火) 14:37:49.78

>>412
つまり頻度論的確率の問題じゃないってことでいいよね？

**１３２人目の素数さん** · 2018/01/02(火) 15:50:49.08

東洋大の往路優勝はヴェイパーフライ4％の効果である。
だれか、これをベイズ統計で検証してください。
どのようにアプローチするのか勉強したいです。

**１３２人目の素数さん** · 2018/01/02(火) 23:57:07.77

>>394
モンティホール問題を１回だけ行う時の当たる確率は
最後に二者択一を１回行うだけですので
必ず５０％です
箱が１００万個あっても変わりません
これは否定できません

**１３２人目の素数さん** · 2018/01/03(水) 00:45:15.58

>>418
7億円当たる確率も
当たりくじあ当たらないかの2者択一だから50%だな

**１３２人目の素数さん** · 2018/01/03(水) 00:53:44.65

>>418
そう思うだろ？リアルでやってみ？
200回実行したけど、理論通りだったわ。

**１３２人目の素数さん** · 2018/01/03(水) 00:54:11.32

てか誰かこれおなしゃす>>417

**１３２人目の素数さん** · 2018/01/03(水) 08:05:48.04

サイコロを2回投げて1の目が2回続いた。
この確率は(1/6)^2=0.02777778
この確率以下の事象の起こる確率の総和がｐ値であるから
1,1の目のでる確率1/36
1,2の目のでる確率1/36
1,3の目のでる確率1/36
...
6,5の目のでる確率1/36
6,6の目のでる確率1/36
全部たすと１になる。
ゆえに、頻度主義統計のもとではイカサマサイコロは存在しない。

×頻度主義統計のもとではイカサマサイコロは存在しない。
○サイコロの目のでる確率はどの目でも1/6であるという帰無仮説は棄却されない。

**１３２人目の素数さん** · 2018/01/03(水) 08:20:21.27

>>368
５試合連続で勝敗予想的中なら頻度主義では予知能力あるとされる。p=0.03125 < 0.05
https://to-kei.net/hypothesis-testing/about-2/

これは片側検定だから有意水準0. 05なら
0. 025と比較すべき。0.03125 > 0. 025

５試合連続で勝敗予想外れの確率も0.03125だから
両側検定なら0.03125 + 0.03125 = 0.0625 > 0. 05

なので
５試合連続で勝敗予想的中では予知能力があるとは言えない。

**１３２人目の素数さん** · 2018/01/03(水) 08:38:06.74

>>415
無限に存在する素数を確率論的に扱いたいんだがどうすればいいか？。
恐怖の全数調査の真分布が使えない。

**１３２人目の素数さん** · 2018/01/03(水) 08:40:41.51

>>394
モンティホールの問題ってこういうの問題じゃなかった？

最初にn個から選んだ箱Aと
A を除いたn-1個からn-2個の外れを除いて残った箱B

Aがあたりの確率 1/n
Bがあたりの確率 (n-1)/n

**１３２人目の素数さん** · 2018/01/03(水) 09:06:30.85

>>399
平均値、最頻値、中央値を計算させてみた。

> # mean
>
> integrate(function(x)x*pdf_y(x),0,1)$value ; 2/(r+2)
[1] 0.4
[1] 0.4
>
> integrate(function(x)x*pdf_g(x),0,1)$value ; (z+1)/(N+2)
[1] 0.3636364
[1] 0.3636364
>
> # mode
>
> optimise(yuru,c(0,1),maximum = TRUE)$maximum ; 1/r
[1] 0.3333205
[1] 0.3333333
>
> optimise(gaba,c(0,1),maximum = TRUE)$maximum ; z/N
[1] 0.3333226
[1] 0.3333333
>
> # median
>
> uniroot(function(x){integrate(function(t)pdf_y(t),0,x)$value-0.5},c(0,1))$root
[1] 0.3857168
>
> uniroot(function(x){integrate(function(t)pdf_g(t),0,x)$value-0.5},c(0,1))$root
[1] 0.3550879
>

**１３２人目の素数さん** · 2018/01/03(水) 12:30:45.00

詳しい計算　有難い。

そっか。なるほど、
効き目は、まずは、平均の大きい
薬剤yuruyuru というか薬剤yを選択、
開脚というか効果がだめなら、
薬剤gabagaba というか薬剤gを選択

これで、成功率がいい感じだろう。

**１３２人目の素数さん** · 2018/01/03(水) 12:39:02.43

Three prisoners problem.

**１３２人目の素数さん** · 2018/01/03(水) 18:18:14.06

《囚人Aの恩赦の超確率特論》

直感的怪答
　　AかCのいずれか1/2に上昇します。
　　ベイズ改訂で1/3から1/2になります。

模範解答
　　もともと3人だし、1/3のままである。

ワシの主観的快答

　　Aの恩赦確率は1ぢゃ。

　　快説しよう

　　看守は、
　　「Bは死刑」と言ったが、
　　「Aは死刑」とは言ってないし、
　　「Cは恩赦」とも言ってない。

　　ぢゃから、おそらく絶対100%、
　　 B=死刑、A=恩赦、 C=死刑ぢゃ。

　証明オワリぢゃ

**１３２人目の素数さん** · 2018/01/03(水) 19:33:44.56

>>429
死刑と恩赦が隣り合っているシュレティンガーな状態が正解

**１３２人目の素数さん** · 2018/01/03(水) 19:50:42.87

■3囚人問題（英: Three Prisoners problem）

ある監獄にA、B、Cという3人の囚人がいます

3人のうちランダムに選ばれた1人に恩赦が出ます

誰が恩赦になるかは看守は答えない

囚人Aに看守が「Bは死刑になる」と教えてくれます

この時、看守は嘘は言いません

囚人Aに恩赦が与えられる確率は何％でしょうか？

**１３２人目の素数さん** · 2018/01/03(水) 20:34:00.63

>>429
「Cは恩赦」と言わない≠Cが死刑

**１３２人目の素数さん** · 2018/01/03(水) 20:46:43.09

死刑囚A,B,CでAが看守に尋ねてBは死刑執行されると告げられたと設定。

恩赦(onsha)を受けるをo,死刑執行されると告(tsuge)げられるをtで表す。

Aが恩赦を受ける確率P(A=o)=1/3
Bが恩赦を受ける確率P(B=o)=1/3
Cが恩赦を受ける確率P(C=o)=1/3

求めたいのは、Bが死刑執行されると告げられた後のAが恩赦を受ける確率P(A=o|B=t)である。

ベイズの公式により
P(A=o|B=t) = P(B=t|A=o)*P(A=o) / P(B=t)

P(B=t) = P(B=t|A=o)*P(A=o) + P(B=t|B=o)*P(B=o) + P(B=t|C=o)*P(C=o)

P(B=t|B=o)=0 Bが恩赦を受けるときBが死刑執行されると告げられる確率=0
P(B=t|C=o)=1 CBが恩赦を受けるときBが死刑執行されると告げられる確率=1

問題は P(B=t|A=o)
恩赦を受けるのがAであるときに看守がCではなくBが死刑執行されると告げる確率は示されていない。
この確率をｐとすると
P(A=o|B=t)は p/(p+1)となる。
もちろんp=0.5であれば、P(A=o|B=t)=1/3と看守に告げられる前と同じである。

ここでｐが一様分布からさまざなβ分布に従うとするとどうなるか、グラフにしてみた。
http://i.imgur.com/vIzIabU.png
左の緑が看守がBとCが死刑執行予定であるときにBを選んで答える確率分布。
右の青が看守がBと告げたときのAが恩赦を受ける確率の分布。

**１３２人目の素数さん** · 2018/01/03(水) 21:01:24.21

無情報分布として一様分布を考えると

Aが恩赦を受ける確率の期待値（平均値）は

> 1-log(2)
[1] 0.3068528

となる。

p/(p+1)を　[0,1]で定積分すれば求まる。

前述のJAGSでシミュレーションしたグラフに表示したもほぼ一致。

**１３２人目の素数さん** · 2018/01/03(水) 21:17:04.59

（タイプミス修正）

死刑囚A,B,CでAが看守に尋ねてBは死刑執行されると告げられたと設定。

恩赦(onsha)を受けるをo,死刑執行されると告(tsuge)げられるをtで表す。

Aが恩赦を受ける確率P(A=o)=1/3
Bが恩赦を受ける確率P(B=o)=1/3
Cが恩赦を受ける確率P(C=o)=1/3

求めたいのは、Bが死刑執行されると告げられた後のAが恩赦を受ける確率P(A=o|B=t)である。

ベイズの公式により
P(A=o|B=t) = P(B=t|A=o)*P(A=o) / P(B=t)

P(B=t) = P(B=t|A=o)*P(A=o) + P(B=t|B=o)*P(B=o) + P(B=t|C=o)*P(C=o)

P(B=t|B=o)=0 Bが恩赦を受けるときBが死刑執行されると告げられる確率=0
P(B=t|C=o)=1 Cが恩赦を受けるときBが死刑執行されると告げられる確率=1

問題は P(B=t|A=o)
恩赦を受けるのがAであるときに看守がCではなくBが死刑執行されると告げる確率は示されていない。
この確率をｐとすると
P(A=o|B=t)は p/(p+1)となる。
もちろんp=0.5であれば、P(A=o|B=t)=1/3と看守に告げられる前と同じである。

ここでｐが一様分布からさまざなβ分布に従うとするとどうなるか、グラフにしてみた。
http://i.imgur.com/vIzIabU.png
左の緑が看守がBとCが死刑執行予定であるときにBを選んで答える確率分布。
右の青が看守がBと告げたときのAが恩赦を受ける確率の分布。

**１３２人目の素数さん** · 2018/01/03(水) 21:18:40.64

看守は何人いるんだ？

**１３２人目の素数さん** · 2018/01/03(水) 21:19:44.92

無情報分布として一様分布を考えると

Aが恩赦を受ける確率の期待値（平均値）は

> 1-log(2)
[1] 0.3068528

となる。

Cが恩赦を受ける確率の期待値（平均値）は　
> log(2)
[1] 0.6931472

当然、Bが恩赦を受ける確率は０

**１３２人目の素数さん** · 2018/01/03(水) 21:23:08.80

>>436
看守は一人。
まあ、確率分布を何人もいたときの複数の看守意見の分布と考えてもいいけどね。

**１３２人目の素数さん** · 2018/01/03(水) 21:58:15.94

>>431
俺が高校生の頃に聞いた問題だと
　本人には死刑になると教えない
という設定だった。
何も知らないとAは死刑になる確率が2/3。
B、Cのうち少なくともどちらかは死刑になるので本人じゃないAに死刑になる人を一人教えてくれと看守に頼んでBと教わった。
それでAは自分かCのどちらかが死刑になるが確率は1/2に減ったと喜んだ。
これは正しいか？
という問題だったな。

**１３２人目の素数さん** · 2018/01/04(木) 00:26:43.93

■２つの封筒問題(two envelopes problem)

２種類の小切手があり、１つの小切手には
他方の４倍の金額が書き込まれています

中身が分からないように、それぞれ封筒に入れます

あなたは、どちらか１つの封筒を選ぶことができます

封筒を開けると１０万円の小切手が入っていました

もし不満なら、残りの封筒と交換できます

あなたは交換しますか？しませんか？

**１３２人目の素数さん** · 2018/01/04(木) 01:19:46.48

>>440
1万と100万が入っているのはそれぞれ1/2
よって、期待値は50万となるため、入れ替えが良い

**１３２人目の素数さん** · 2018/01/04(木) 08:48:41.71

>>440

>>441の有難い話が本当なら、
10万円が交換するだけで
期待値が、5倍にupぢゃ。

きっとさらに、交換すれば5倍の5倍
ぢゃから、10倍にupするハズぢゃ
スナワチ、100万円ぢゃ！

ワシなら2回交換するぞ。

**１３２人目の素数さん** · 2018/01/04(木) 09:06:51.37

>>441
100万/10万なのか10万/1万なのか、前者の確率をpとして
pの確率分布を考えるのがベイズ流だろね。

**１３２人目の素数さん** · 2018/01/04(木) 12:00:36.09

100万円が含まれている確率をｐとして

ｐの確率分布を事前分布として

B_kokan <- function(p,A=10^5,n=10)p*A*n+(1-p)*A/n

がどう変わるかみればいい。

グラフにしてみた。

http://i.imgur.com/jPAinUE.png

**１３２人目の素数さん** · 2018/01/04(木) 12:22:41.37

>>443
ベイズ統計だと
1/10
10/100
100/1000
1000/10000
はみなちがいますね

**１３２人目の素数さん** · 2018/01/04(木) 14:55:23.69

>>435

恩赦を受けるのがAであるとき（＝BとCに死刑執行されるとき）に看守が、死刑執行されるのはBであると告げる確率　 P(B=t|A=o)　を横軸

死刑執行されるのはBであると告げられたときに恩赦を受けるのがAである確率 P(A=o|B=t) を　縦軸に　グラフにしてみる。

http://i.imgur.com/xg0Ya0V.png

**１３２人目の素数さん** · 2018/01/04(木) 16:17:35.72

看守が嘘つきであった場合

看守が嘘を答える確率はｑで一定である。
但しBとCが死刑執行予定であるときどちらを答えても嘘にならないのでBと答える確率をｐとする。

この看守がBが死刑執行される予定であると答えたとき、Aが恩赦を受ける確率はいくらか？

**１３２人目の素数さん** · 2018/01/04(木) 16:25:43.20

恩赦を受けれる可能性は殺人件数に逆比例するという情報が得られた。

ABCの殺人件数をa,b,c とする。

看守がBが死刑執行されると告げたときのAの恩赦の確率はどうなるか？

**１３２人目の素数さん** · 2018/01/04(木) 16:33:28.02

>>448
これでいいと思う。

p*(a/(a+b+c))/ ( p*(a/(a+b+c)) + q*(b/(a+b+c)) + (1-q)*(c/(a+b+c)) )

**１３２人目の素数さん** · 2018/01/04(木) 16:35:12.70

>>449
これだと恩赦確率が殺人件数比例になってしまうな。

考え直そう。

**１３２人目の素数さん** · 2018/01/04(木) 16:37:28.69

>>450
間違えてない気もしてきた。

ご意見募集。

**１３２人目の素数さん** · 2018/01/04(木) 16:43:18.29

>>451

P(A=o|B=t) 　=　 p*((1/a)/(1/a+1/b+1/c))/ ( p*((1/a)/(1/a+1/b+1/c)) + q*((1/b)/(1/a+1/b+1/c)) + (1-q)*((1/c)/(1/a+1/b+1/c)) )

だろな、たぶん。

**１３２人目の素数さん** · 2018/01/04(木) 16:49:38.93

Onsha <- function(a,b,c,p,q) {
p*((1/a)/(1/a+1/b+1/c))/ ( p*((1/a)/(1/a+1/b+1/c)) + q*((1/b)/(1/a+1/b+1/c)) + (1-q)*((1/c)/(1/a+1/b+1/c)) )
}
> Onsha(10,10,10,0.5,0)
[1] 0.3333333
> Onsha(10,10,10,0.5,0.3)
[1] 0.3333333
> Onsha(10,20,30,0.5,0.3)
[1] 0.5660377

恩赦確率が同じときは、看守の嘘つき確率の影響は受けないね。

**１３２人目の素数さん** · 2018/01/04(木) 17:07:57.72

さいころ振ったら６が出ました
つぎに６が出る確率はどうなる？

１　低くなる
連続で６が出る可能性はひくい
２　変わらない
６が出る確率は前に何が出たか影響を受けない
３　高くなる
さいころがいかさまの可能性があるから

**１３２人目の素数さん** · 2018/01/04(木) 19:22:37.86

>>448

囚人A,B,Cの殺人件数を３，６，９人とする。
罪状の重さに逆比例して恩赦が受けられるという。
恩赦の受けられる確率分布はディリクレ分布に従うとして
最小母数が１となるようにして母数alphaは3,1.5,1とする。
BとCが死刑執行されるときに看守がBが死刑と答える確率は一様分布に従う
看守が嘘をつく確率も一様分布に従うとする。

JAGSのスクリプトだとこんな感じ
alpha=c(1/3,1/6,1/9)*9
modelString='
model{
abc ~ ddirch(alpha)
poa=abc[1] # probability of onsha of A
pob=abc[2] # probability of onsha of B
poc=abc[3] # probability of onsha of C
p ~ dbeta(1,1)
q ~ dbeta(1,1)
onsha= p*poa/ ( p*poa + q*pob + (1-q)*poc )
}

この条件のもとで
Aが恩赦を受ける確率分布は
http://i.imgur.com/KHbXlhe.png
となる。

まあ、殺人件数が一番少ないAが恩赦を受ける確率が
1/3から上昇したのは納得できる結果である。

こういうのがベイズ推計の面白さであるね。

**１３２人目の素数さん** · 2018/01/04(木) 20:57:07.68

なにがなんでも、P(A=o|B=t)の
誰よりも完璧な模範解答を探るべく

>>435 の pの分布について
一様分布ではなく

f(p) = (2/3)p + 2/3 という確率分布で
p/(p+1) の期待値は1/3になるか?

自分勝手にチャレンジしかし挫折。
一応、チャレンジ内容を説明すると

A=恩赦、B=C=死刑の時の
看守が「B死刑」と告げる確率を
P(B=t|A=o) とか、簡単にpとおく

看守が「B死刑」と告げた時の
A=恩赦、B=C=死刑の確率を
P(A=o|B=t) とおく。

すると、確かに
P(A=o|B=t) = p/(p+1) となると思う。

さて、
pの確率分布　f(p) = (2/3)p + 2/3
pの範囲[0,1] で積分値は1となるが

p/(p+1) の平均(期待値)を求めたい
でも数学得意なワシぢゃが
計算が分からん。
ここでGiveUp。

**１３２人目の素数さん** · 2018/01/04(木) 22:22:53.23

鶴亀算に生死不明の猫や杖を持つ人間を登場させる必要は無い。

**１３２人目の素数さん** · 2018/01/04(木) 22:25:22.15

■理由不十分の原則(principle of insufficient reason)

事象の発生確率の予測が全くできない場合に、
全ての事象の発生確率が等しいと仮定する

**１３２人目の素数さん** · 2018/01/05(金) 02:08:41.29

>>456

p*f(p)を[0,1]で積分すれば5/9が得られる。

横着をしてWolframにやってもらって

https://www.wolframalpha.com/input/?i=integral(x*(+2%2F3*x+%2B+2%2F3),0,1)

期待値は原点周りの一次モーメント。

**１３２人目の素数さん** · 2018/01/05(金) 02:55:41.44

>>454
ベイズ流にアプローチしてみた。

(1)
６の目のでる確率の分布を一様分布とすると
６の目が一回でたから事後分布はbeta(2,1)なので次に６の目がでる期待値は2/3

(2)
６の目の出る確率p6を1/6としてp6=1/6が正しい確率分布を一様分布とすると
Y=c(1)
dataList=list(Y=Y)
modelString='
model{
Y ~ dbern(p6)
p6=1/6*q+5/6*(1-q)
q ~ dbeta(1,1)
}
'
でJAGSを走らせて
Lower95 Median Upper95 Mean SD Mode MCerr
p6 0.24522133917 0.600436 0.8333064 0.5731115 0.1781004 NA 0.001329018

を得て　平均 0.5731115

(3)６の目の出る確率が1/6を最頻値とする標準偏差0.1のβ分布に従うとすれば
β分布のパラメータは
a b
3.260234 12.301170
となるので
平均は0.2095077

**１３２人目の素数さん** · 2018/01/05(金) 03:12:06.07

>>456
すまん、
pの平均値じゃなくて
p ~ f(p)のときのp/(p+1)の平均値
だな。

**１３２人目の素数さん** · 2018/01/05(金) 03:14:48.47

>>456
integral(x/(x+1)*(2/3x+2/3),0,1)=1/3

**１３２人目の素数さん** · 2018/01/05(金) 07:33:31.02

>>462
stanで検証

functions{
real jisaku_log(real y){
real temp;
temp = 2/3.0*y+2/3.0;
return log(temp);
}
}
data{
}
parameters{
real<lower=0,upper=1> p;
}
transformed parameters{
real q;
q = p/(p+1);
}
model{
p ~ jisaku();
}

mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat
p 0.5626 0.0074 0.2836 0.0366 0.3364 0.5874 0.8107 0.9839 1464 1.0006
q 0.3364 0.0035 0.1325 0.0353 0.2517 0.3701 0.4477 0.4959 1418 1.0007
lp__ -2.0063 0.0336 0.9343 -4.5941 -2.2177 -1.6547 -1.4262 -1.3608 773 1.0030

**１３２人目の素数さん** · 2018/01/05(金) 08:11:21.51

>>460
どのアプローチでも６の目がでたというデータは
事後確率分布を６の目がでる方向に歪めるね。

**１３２人目の素数さん** · 2018/01/05(金) 09:19:44.32

>>461
von Neumann法で 2/3*x+2/3を密度関数とする[0,1]の乱数を発生させる。
Rのコードはこれ
http://egg.2ch.net/test/read.cgi/hosp/1493809494/352

発生させた乱数ｐからp/(p+1)をつくってその分布を表示すると

http://i.imgur.com/PFTeZ77.png

平均値1/3が確認できる。

**１３２人目の素数さん** · 2018/01/05(金) 11:16:26.93

>>460
(2)のアプローチをstanでやってみた。

data=list(Y=1)
stanString='
data{
int Y;
}
parameters{
real<lower=0,upper=1> q;
}
transformed parameters{
real<lower=0,upper=1> p6;
p6=1/6.0*q+5/6.0*(1-q);
}
model{
Y ~ bernoulli(p6);
q ~ beta(1,1);
}

mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat
q 0.3901 0.0030 0.2661 0.0157 0.1602 0.3512 0.5910 0.9289 7827 1.0003
p6 0.5733 0.0020 0.1774 0.2141 0.4393 0.5992 0.7265 0.8229 7827 1.0003
lp__ -2.6057 0.0103 0.8248 -4.9881 -2.8346 -2.2830 -2.0537 -1.9902 6400 1.0002

６の目のでる事後確率の平均値は 0.5733　でJAGSと同じ結果。

暇つぶしネタを与えてくれた>454に感謝

**１３２人目の素数さん** · 2018/01/05(金) 12:22:27.36

さいころ振ったら６が出ました
つぎに６が出る確率はどうなる？

１　低くなる
連続で６が出る可能性はひくい
２　変わらない
６が出る確率は前に何が出たか影響を受けない
３　高くなる
さいころがいかさまの可能性があるから

＃当然さいころがいかさまの可能性をかんがえるならば
６の出る可能性が１/６より小さいいかさまさいころで
たまたま６がでた場合も含めるとする

**１３２人目の素数さん** · 2018/01/05(金) 13:38:24.73

>>467
サイコロE1 = 6の目がでる確率は1/12
サイコロE2 = 6の目がでる確率は2/12
サイコロE3 = 6の目がでる確率は3/12

事前分布
　　P(E1) = P(E2) = P(E3) = 1/3
とまずは、勝手に設定し計算してみた

直感的怪答
　　1/6
　　単なる条件付確率ぢゃし、
　　‎事前分布はE1,E2,E3同じぢゃろ。
　　‎ぢゃから、
　　‎1/12、2/12、3/12 の単純平均で
　　‎2/12 約分すれば、1/6ぢゃ

模範解答
　　7/36 である。
　　‎1/12 , 2/12 , 3/12 の
　　‎1:2:3 の重み付き平均は7/36です。

ワタシの超怪答
　　1/6で良い
　　
　　事前分布、‎P(E1) > P(E3) にすべきぢゃ
　　‎∵　1/6ぢゃないのは、奇妙ぢゃ
　　‎
　　ちなみに、
　　‎P(E1) = P(E3) = 0、‎P(E2) = 1 ぢゃダメ
　　イカサマぢゃなくても‎
　　‎1‎/6より微かにずれるものぢゃ

**１３２人目の素数さん** · 2018/01/05(金) 14:01:15.06

>>467
６の目の出る確率がどの範囲ならイカサマでないとすんの？

**１３２人目の素数さん** · 2018/01/05(金) 14:19:20.95

６の出る可能性が１/６より小さいいかさまさいころ　とすると

(1)
６の目のでる確率の分布を一様分布とすると
６の目が一回でたから事後分布はbeta(2,1)なので次に６の目がでる期待値は2/3
p<1/6の確率は
> pbeta(1/6,2,1)
[1] 0.02777778

(2)
６の目の出る確率p6を1/6としてp6=1/6が正しい確率分布を一様分布とすると平均 0.5731115
p<1/16の確率は0

(3)６の目の出る確率が1/6を最頻値とする標準偏差0.1のβ分布に従うとすれば
> pbeta(1/6,3.260234,12.301170)
[1] 0.3785766

**１３２人目の素数さん** · 2018/01/05(金) 14:27:12.34

>>468
離散量で一様分布の真似なら

サイコロE4 = 6の目がでる確率は4/12
...
サイコロE4 = 6の目がでる確率は12/12

も考えなくちゃだめだろ？

**１３２人目の素数さん** · 2018/01/05(金) 15:34:37.93

>>469
直感的かつナナメな怪答
　　ちょっとでも1/6からずれてたら
　　数学的に‎イカサマぢゃ∴
　　サイコロの100%は‎イカサマぢゃ
　　でも、しかし、試験なら、
　　‎6の目確率は、常に1/6で計算ぢゃ。

ナナメな模範解答
　　そっか、鋭い質問
　　‎ちょっとなら1/6からずれても
　　‎良いことにしないと、
　　‎サイコロの100%は‎イカサマになるか

>>471
直感的かつナナメな怪答
　　そんなことより、6の確率が
　　事前分布の平均　≧　1/6
　　事後分布の平均　≦　1/6
　　‎となる事前分布どっかにないかな！?
　　‎誰かそんな‎事前分布で計算しないかな

模範解答擬き
　　P(E4) = P(E5) = … = P(E12) = 0
　　‎にしないと計算が大変　(^_^;)

**１３２人目の素数さん** · 2018/01/05(金) 18:30:38.09

>>466
自分で気付いたけどこのスクリプトは間違いだね。

**１３２人目の素数さん** · 2018/01/05(金) 18:56:45.29

>>472
死刑囚の話に戻るけど

f(p) = (2/3)p + 2/3 という確率分布

って何の意味があるの？

**>>456 >>472** · 2018/01/06(土) 00:50:19.33

>>474
確率分布を事前分布とした理由は
今考え直したら支離滅裂な直感でした。

意味は、概ね何でもない。ので
気にしないで下さい。

あえて意味を言えば、
P(A=o|B=t) の平均が1/3となるような
P(B=t|A=o) の確率分布というだけ

支離滅裂な内容ですが説明すると、

pが定数1/2とするなら、
P(A=o|B=t) = p/(p+1)より、
P(A=o|B=t) = 1/3 となる。

だから、
pの平均が1/2の確率変数なら、
P(A=o|B=t)の平均も1/3だろうと確信。

しかし、計算すると、
pの平均が1/2の連続一様分布なら、
P(A=o|B=t)の平均は‎ln(2)=0.30685のようだ

では、P(A=o|B=t)の平均が1/3となる
pの分布はどんな分布なのか知りたくなる
そう、
f(p=0) : f(p=1) = 1 : 2 な確率分布かな
だから、
f(p) = (2/3)p + 2/3 という確率分布を
事前分布とする。

まっ、今見直と、支離滅裂です。(^_^;)

**１３２人目の素数さん** · 2018/01/06(土) 01:47:46.30

>>475
確率密度関数がa*x+bの形なら

integral(x/(x+1)*(a*x+b),0,1)=
a *(log(2) - 1/2) + b*(1- log(2)) = 1/3

を満たすときでしょうね。

**１３２人目の素数さん** · 2018/01/06(土) 17:44:49.43

>>467
あらゆる可能性考えて
具体的な数字をださなくてもいいなら

①古今東西振られたサイコロのうちそれがいかさまであるという確率は相当ひくいとおもう

②いかさまである場合に
６の出る確率が６分の１超である場合と
６分の１以下である場合が打ち消しあうことになるが
６分の１以下である可能性はそんなにたかくないしだろうし、ふれ幅も小さいから
若干の打消しが生じるくらいだろう

③いかさまである場合に
６の出る確率が６分の１超であるときにおいては
あからさまないかさまをしてる可能性はひくいので
１/６と１の間くらいの0.6前後くらいが期待値になるのではないかな

総合的に考えれば
６が出た後に６が出る確率は6分の１よりおおきくなるだろうが
①の影響がかなりおおきくて
ほとんど無視できるれレベルだとおもう