X



トップページ数学
1002コメント451KB

ベイズの統計学を学び始めたんだけど

■ このスレッドは過去ログ倉庫に格納されています
0001132人目の素数さん
垢版 |
2017/12/03(日) 00:52:27.23ID:v3VGsge3
信用に値するのか疑問です。
人工知能とかではなく日々の動機付けに利用する予定です
0377132人目の素数さん
垢版 |
2017/12/31(日) 19:24:01.77ID:14tdpK/Y
>>376
理論値は

[1] 0.00001262228 0.00306721363 0.03944461975 0.21214263175 0.74533291259

まあ、よく一致しているな。
0378132人目の素数さん
垢版 |
2017/12/31(日) 20:15:10.88ID:14tdpK/Y
イカサマコインの定義をp=0.5以外とすると


表確率0.01のコインである確率 1/100
表確率0.02のコインである確率 1/100
....
表確率0.99のコインである確率 1/100
表確率1.000のコインである確率 1/100

1-0.5^5/(0.01^5+0.02^5+...+0.99^5+1.00^5) = 0.9981801


0.001単位で区切ると 0.9998131になってしまうね。
0379132人目の素数さん
垢版 |
2017/12/31(日) 20:21:32.08ID:vRYXSQrZ
ベイズ統計学で
トランプのシャッフルについての見識は得られる?
十分シャッフルされた状態にするのに
どういう切り方で何度やればいいかとか
0380132人目の素数さん
垢版 |
2017/12/31(日) 22:29:56.85ID:D0SDvzGU
あけおめ!
おまえらの似非統計今年もたのしむわwwwwwwwwwwww
0381132人目の素数さん
垢版 |
2017/12/31(日) 23:55:46.53ID:+bjpI6TD
>>373

>>ベイズだとp=1/6の確率分布を一様分布とすると
>>10回サイコロを振って7回でて

10回サイコロを振って7回1の目が出たのなら、0.6〜0.7の当たりにピークを持つような
分布になることが予想されるけど、示されている図は、0に近いところにピークが来るよ
うなグラフになってます。この図は、1以外の目のグラフじゃないですか?

「1の目が出すぎで歪んでいる」≠「(1以外の例えば)6の目が出なさすぎで歪んでいる」
だと思います。
0382132人目の素数さん
垢版 |
2018/01/01(月) 00:08:06.35ID:3B1sF6u0
      ∧_∧
     ( ´Д` )  新年あけまして
     /     ヽ
     し、__X__,ノJ

      /´⌒⌒ヽ
    l⌒    ⌒l  おめでとうございます
   ⊂ (   ) ⊃
      V ̄V
0383132人目の素数さん
垢版 |
2018/01/01(月) 00:08:36.83ID:sla5GeSe
>>381
目の出る確率ではなくてp=1/6が正しい確率の分布。
サイコロを投げる前はp=1/6である可能性は0.01でも0.99でも同じ一様分布だったが
10回中7回、一の目がでたことから
p=1/6が正しい確率の分布が0に近い方にピークを持つようになった。
0384132人目の素数さん
垢版 |
2018/01/01(月) 00:38:54.91ID:mbIYUD21
なるほど、そうだったんですか。
>>297に描かれている図の方は、「各目の出る確率の分布」だったので、
てっきり、そのような分布だと思っていました。
>>373は、「1の目の出る確率が1/6で正しいかどうか」の確率のようなものとのことですが、
逆に、「1の目の出る確率」のようなものも、同時に求めることも出来るんですか?
0385132人目の素数さん
垢版 |
2018/01/01(月) 01:16:39.05ID:ZAhqpjh2
サイコロを投げる前(事前確率分布)と10回投げて0〜7回1の目がでた時のp=1/6が正しい確率の分布をグラフにすると

http://i.imgur.com/P1sng4W.png

確率の平均の最大値は10×1/6回あたりにあるのがみてとれる。
0386132人目の素数さん
垢版 |
2018/01/01(月) 01:49:47.01ID:mbIYUD21
別種のグラフだと言うことがよく分かりました。
わざわざありがとうございました。
0387132人目の素数さん
垢版 |
2018/01/01(月) 08:18:33.42ID:ZAhqpjh2
>>384
>逆に、「1の目の出る確率」のようなものも、同時に求めることも出来るんですか?

同時には求まらない。
1の目の出る確率を一様分布とするすれば10回中7回1の目がでた後の事後分布はbeta(1+7,1+10-7)なので平均8/12,最頻値7/10になる。

サイコロの目なので最頻値1/6、分散0.1^2と主観的に事前確率分布を決めてしまえば
これに相当するβ分布のパラメータは3.26,12.3となるので(この計算はやや面倒)
平均値0.4015354 中央値0.3989152 最頻値0.3858124 で 95%信用区間は 0.2189457〜 0.5873959

この様子をRのパッケージBESTのplotPost関数を改造してグラフにすると

http://i.imgur.com/YcfKDO9.png
0388132人目の素数さん
垢版 |
2018/01/01(月) 10:56:56.09ID:ZAhqpjh2
>>387(補足)

>サイコロの目なので最頻値1/6、分散0.1^2と主観的に事前確率分布を決めてしまえば

と書いたが

サイコロの目は6面あるから事前分布の最頻値を1/6にするのはまあいいとして分散の値の根拠がないじゃないか、との批判は当然。

そこで標準偏差が0〜100の間で一様分布するとして

JAGSでMCMCしたのが以下のグラフ。

http://i.imgur.com/72xn58M.png


分散0.1^2のときより歪なのが明らかになったといえる。
0389132人目の素数さん
垢版 |
2018/01/01(月) 12:30:52.15ID:ZAhqpjh2
>>388(補足の補足)

>サイコロの目は6面あるから事前分布の最頻値を1/6にする

これだって主観的過ぎるという異論も当然ある。

1の目のでる確率の平均(正規分布を仮定するので最頻値と一致)も平均1/6で標準偏差が一様分布に従うとしてMCMCでサンプリングしてみた。

(標準偏差は0〜100の範囲の一様分布に設定)

http://i.imgur.com/i2OFAo1.png

一の目がでる値の平均値は2/3程度で平均の平均を1/6と固定したときとあまり変わらない。
0390132人目の素数さん
垢版 |
2018/01/01(月) 12:38:18.73ID:ZAhqpjh2
Gelmanの主張に従って標準偏差の事前分布をhalf-cauchy分布にしてみた。

尺度母数=5での結果をグラフにすると

http://i.imgur.com/5Qm4wfP.png

コーシー分布なだけあって1000を超える値がサンプリングされている。

それでも、1の目の出る確率の平均は2/3程度で他の結果と同じ。
0391132人目の素数さん
垢版 |
2018/01/01(月) 12:42:40.06ID:yJ9akvJN
コインを10回なげて7回表なら
表確率7/10 つまり0.7のはずぢゃ!

しかし、これは神の御告げによると、
子供騙しな計算とのことぢゃ。

表確率は、神の御告げでは、
(7+1)/(10+2) つまり8/12 だから2/3
0.7とは違うよ!とのこと

なので、ベイズの確率で手計算で検証ぢゃ

まっ、
事前確率の分布は、連続一様分布ぽく
 表確率0.1のコイン確率 20%
 表確率0.3のコイン確率 20%
 表確率0.5のコイン確率 20%
 表確率0.7のコイン確率 20%
 表確率0.9のコイン確率 20%
 ‎としてみる。

で、
7回連続で表、その後3回連続で裏の確率
それを100万倍すると、
  0.1^7 * 0.9^3 * 1000000 = 0
  0.3^7 * 0.7^3 * 1000000 = 75
  0.5^7 * 0.5^3 * 1000000 = 977
  0.7^7 * 0.3^3 * 1000000 = 2223
 +) 0.9^7 * 0.1^3 * 1000000 = 478
 ───────────────
 ‎         total = 3753

ぢゃから、
事後確率は、
 表確率0.1のコイン確率 0%
 表確率0.3のコイン確率 2% ∵75/3753 
 表確率0.5のコイン確率 26% ∵977/3753
 表確率0.7のコイン確率 59% ∵2223/3753
 表確率0.9のコイン確率 13% ∵478/3753
 ‎ぢゃ

ぢゃから、
10回中7回表で、表確率0.7コインの確率は、
改訂前 20% 
改訂後 59% に改訂ぢゃ

ちなみに、表確率の平均ぢゃが、
改訂前 0.5
改訂後 0.67 に改訂ぢゃ
  ∵(0.3*2 + 0.5*26 + 0.7*59 + 0.9*13)/100

神の御告げは、出鱈目なのに冴えている。
0392132人目の素数さん
垢版 |
2018/01/01(月) 14:56:56.97ID:ZAhqpjh2
beta(1+7,1+10-7)のβ分布になるので期待値は8/12、最頻値が10/7
パラメータを
a=8
b=4
と おいて
最頻値 (a-1)/(a+b-2)
平均値 a/(a+b)
分散 a*b/((a+b)^2*(a+b+1))

というだけの話。

事前分布の期待値や分散に様々な仮定をおいてもこの結論はほぼ同じ。
分散の事前分布に半コーシー分布(尺度母数5)を使うと事後分布がβ分布でよく当てはまるのだが、
http://i.imgur.com/RB9Q3GH.png
逆ガンマ関数(母数=0.001)を使うとずれが大きい。
http://i.imgur.com/9YCgXof.png
0393132人目の素数さん
垢版 |
2018/01/01(月) 21:11:56.66ID:ZAhqpjh2
正月休みの暇つぶしクイズ

薬剤yを1人ずつ投与して効果判定したら、3人めで効果が確認できた。
薬剤gを9人同時に投与したら3人に効果があった。
どちらの有効性が高いか?

別バージョン(こっちがオリジナルw)

ゆるゆる女子大生に1人ずつメールで誘ったら3人めが開脚。、
がばがば女子大生9人に一斉にメールを送ったら3人が開脚。
どっちが開脚が容易か?

頻度主義からするとどちらも1/3だから優劣なしになるのだが、
ベイズ統計における確率はcredibility(確信の度合い、信憑性や説得力の度合いと言ってもいい)なので
議論の余地がある。
0394132人目の素数さん
垢版 |
2018/01/01(月) 21:40:26.36ID:3B1sF6u0
■モンティホール問題(チャーハンと餃子)

このゲームができるのは1回だけです

チャーハン99皿と餃子1皿を個別に
外からは中が見えない100個の箱に入れます

その中から1個の箱を選びます

チャーハンが入った98個の箱を取り除きます

最後に残った2個の箱の中から1個の箱を選びます

あなたが餃子を当てる確率は何%でしょう?
0395132人目の素数さん
垢版 |
2018/01/02(火) 02:08:33.95ID:VleVG2NU
>>393
頻度論ってそんなんだっけ?
頻度論は無限に思考を行ったときの頻度が確率といっちするっていう
確率とはなにかの解釈であって
3回やったうち1回あることがおきたなら
三分の一の確率だというもんじゃなかったような
明確な定義なんてないんだろうけど
頻度と頻度論的確率解釈をごっちゃにしてるような

一応ぐぐったけど明確な定義らしきものはみつからからなかったので
英語版ウィキみたらやっぱりそうかいてる
0396132人目の素数さん
垢版 |
2018/01/02(火) 02:27:16.20ID:VleVG2NU
あと検定とが信頼区間求めるとかしないといみないんじゃない?
あと何回目で成功するは幾何分布やから
3分の1の確率で成功するとするなら
三回目に成功する確率は
(1/3)*(2/3)^2= 0.1481481
じゃないのかなあ
0397132人目の素数さん
垢版 |
2018/01/02(火) 04:46:33.00ID:qdmBZ37O
検者の意図で変わるp値。

(修正再掲)
ある大学の入学者男女の比率は1であるという帰無仮説を検定する課題が花子と太郎に課された。

花子は50人を調査できたら終了として入学者を50人をみつけて18人が女子であるという結果を得た。
帰無仮説のもとで
50人中18人が女子である確率は 0.01603475
これ以下になるのは50人中0〜18人と32〜50人が女子の場合なので
両側検定して
> sum(dbinom(c(0:18,32:50),50,0.5))
[1] 0.06490865
> binom.test(18,50,0.5)$p.value
[1] 0.06490865
で帰無仮説は棄却できないと結論した。

一方、本 番と十八番が好きな太郎は一人ずつ調べて18人めの女子がみつかったところで調査を終えることにした。
18人めがみつかったのは花子と同じく50人めであった。
帰無仮説のもとで
18人がみつかるのが50人めである確率は0.005772512
これ以下になるのは23人以下50人以上番めで女子18人めがみつかった場合なので
両側検定して
pnb=dnbinom(0:999,18,0.5)
> 1 - sum(pnb[-which(pnb<=dnbinom(50-18,18,0.5))]) # < 0.05
[1] 0.02750309
で帰無仮説は棄却される。

どちらの検定が正しいか、どちらも正しくないか?
検定する意図によってp値が変わるのは頻度主義統計の欠陥といえるか?
0400132人目の素数さん
垢版 |
2018/01/02(火) 07:43:25.38ID:+hyeNOE4
サイコロを2回投げて1の目が2回続いた。
この確率は(1/6)^2=0.02777778
この確率以下の事象の起こる確率の総和がp値であるから
1,1の目のでる確率1/36
1,2の目のでる確率1/36
1,3の目のでる確率1/36
...
6,5の目のでる確率1/36
6,6の目のでる確率1/36
全部たすと1になる。
ゆえに、頻度主義統計のもとではイカサマサイコロは存在しない。
0401132人目の素数さん
垢版 |
2018/01/02(火) 10:53:13.85ID:okX91MtS
検定はまったくのごまかしだが
区間推定もたいがいなまやかしだな
0402132人目の素数さん
垢版 |
2018/01/02(火) 11:10:15.05ID:VleVG2NU
>>398
なにの主張なのかよくわからんけど
分布の形がにてるたら別にどの確率分布をつかってもいいってこと?


頻度論てき確率の問題かどうかの話にはなってないし
頻度論とかの問題じゃなく
実験の結果によって実験をかえる
つまり、成功したらそこでやめる
実験計画にもんだいがあるんだけど
事前に何回やって得られたデータから分析をおこなうってのと
事前に何回やるかきめずに成功したらそこで実験をやめるってのは
根本的に違うし後者は安易にやるべきじゃない。
0403132人目の素数さん
垢版 |
2018/01/02(火) 11:15:09.96ID:wUdm8Yrk
>>402
>事前に何回やるかきめずに成功したらそこで実験をやめるってのは
>根本的に違うし後者は安易にやるべきじゃない。

それはまさに正論。

p<0.05になったらサンプリングをやめるというイカサマに騙される椰子大杉。
0404132人目の素数さん
垢版 |
2018/01/02(火) 11:16:32.46ID:wUdm8Yrk
>>402

細くて長い のと 太くて短いのが どちらが有用かという価値判断だな。

チン〇の話ではないぞwww
0405132人目の素数さん
垢版 |
2018/01/02(火) 11:51:00.03ID:wUdm8Yrk
>>393

開脚率の期待値を計算してみた。

ゆるゆる女子大生の開脚率期待値:r人目で初めて開脚
r=3
Ex.yuru <- function(r){
integrate(function(x)x*(1-x)^(r-1)*x,0,1)$value/integrate(function(x)(1-x)^(r-1)*x,0,1)$value
}
Ex.yuru(r)
2/(r+2)

がばがば女子大生の開脚率期待値:N人中z人開脚
N=9
z=3
Ex.gaba <- function(N,z){
integrate(function(x) x*choose(N,z)*x^z*(1-x)^(N-z),0,1)$value/integrate(function(x)choose(N,z)*x^z*(1-x)^(N-z),0,1)$value
}
Ex.gaba(9,3)
(z+1)/(N+2)
0406132人目の素数さん
垢版 |
2018/01/02(火) 12:17:16.24ID:VleVG2NU
>>404
ごめん
なにがいいたいのかわからん
0409132人目の素数さん
垢版 |
2018/01/02(火) 13:03:46.13ID:VleVG2NU
>>405
ちがうよそれ
その式ならr(最初の成功がでるまでの試行回数。ふつうはこっちをxとく)について積分しないといけない
x(確率。ふつうはpとおく)がパラメータ


幾何分布の期待値は1/pだからpを推定しないともとまらない
二項分布の期待値はnp
393の例の設定でやるなら幾何分布の期待値は3で二項分布も3
np=1/pが成り立つときに二項分布と幾何分布の期待値はひとしくなる

二項分布やら幾何分布の確率分布図のx軸や確率分布関数f(x)のxは確率じゃないよ
0410132人目の素数さん
垢版 |
2018/01/02(火) 13:07:31.56ID:wUdm8Yrk
>>406

最頻値での確率を重視するなら、がばがば女子大生

平均値(期待値)を重視するなら、ゆるゆる女子大生

ということ。
0411132人目の素数さん
垢版 |
2018/01/02(火) 13:13:55.97ID:VleVG2NU
Rつかいたいだけで何やってるか全然わかってなさそうな人だな
0412132人目の素数さん
垢版 |
2018/01/02(火) 13:26:19.92ID:wUdm8Yrk
>>409

確率の期待値を計算したいのであって、回数の期待値を計算したいわけではないから問題なし。

β分布の横軸は0〜1までの確率だよ。


事前確率分布一様分布が9回試行して3回成功することでβ(1+3,1+6)のβ分布にベイズ更新されるというお話。
0413132人目の素数さん
垢版 |
2018/01/02(火) 14:01:36.23ID:wUdm8Yrk
>>409
階層ベイズモデルのスクリプト書いたことない?
>393のだと
ゆるゆる開脚率p1
がばがば開脚率p2
とその差diff
の分布を求めるMCMCを実行。
横軸は当然、確率。
縦軸は確率密度。
JAGSで書けばこんな感じ。
model{
for(i in 1:r){
y[i] ~ dbern(p1)
}
z ~ dbin(p2,N)
diff = p1 -p2
p1 ~ dbeta(1,1)
p2 ~ dbeta(1,1)
}
0414132人目の素数さん
垢版 |
2018/01/02(火) 14:32:32.36ID:ZrKCLBbv
>>393
薬剤y = 効果があったのが1人いた。そこで
    実験止めたら、3人に実験してた。
薬剤y' = 3人同時で、1人効果あり

薬剤g' = 効果があったのが3人になったとき
    実験止めたら、9人に実験してた。
薬剤g = 9人同時で、3人効果あり

としたとき、安易には
P(y) = P(y') = P(g) = P(y') = 1/3 なのぢゃが

多分、
P(y) = P(y') = 2/5 > P(g') = P(g) = 4/11
ぢゃろう。何となく

なお、
薬剤g'' = 効果があったのが1人いた。
    その時点で7人に実験してた。
    ‎で、実験は続行したら、
    ‎ラッキーなことに、
    ‎8人目、9人目 効果があり
    ‎そこで実験を止める。
としたとき、

心理的に、P(g'') > P(g) = 4/11 ぢゃが。
0415132人目の素数さん
垢版 |
2018/01/02(火) 14:32:58.81ID:VleVG2NU
>>412
なるほどね
>>400
統計的検定においても
きむ仮説を何にするか有意水準をなににするかは一意にきめられることではない
主観確率でつまりさいころが明らかに不正であるという印象があるなら
きむ仮説や有意水準はかえることができる
たとえば1でそうにない1が出る確率について検定することになる
それは主観確率じゃないかというはなしになるが
結局はそういうことになる
確率とは
主観確率と古典確率と頻度確率を折衷したものなんだから
主観確率だって頻度確率やら古典確率を考慮に入れて決定されるのだから。
0416132人目の素数さん
垢版 |
2018/01/02(火) 14:37:49.78ID:VleVG2NU
>>412
つまり頻度論的確率の問題じゃないってことでいいよね?
0417132人目の素数さん
垢版 |
2018/01/02(火) 15:50:49.08ID:wG0bXeaR
東洋大の往路優勝はヴェイパーフライ4%の効果である。
だれか、これをベイズ統計で検証してください。
どのようにアプローチするのか勉強したいです。
0418132人目の素数さん
垢版 |
2018/01/02(火) 23:57:07.77ID:RTOZbcrb
>>394
モンティホール問題を1回だけ行う時の当たる確率は
最後に二者択一を1回行うだけですので
必ず50%です
箱が100万個あっても変わりません
これは否定できません
0419132人目の素数さん
垢版 |
2018/01/03(水) 00:45:15.58ID:fOPEnBcc
>>418
7億円当たる確率も
当たりくじあ当たらないかの2者択一だから50%だな
0422132人目の素数さん
垢版 |
2018/01/03(水) 08:05:48.04ID:YJfyxrv+
サイコロを2回投げて1の目が2回続いた。
この確率は(1/6)^2=0.02777778
この確率以下の事象の起こる確率の総和がp値であるから
1,1の目のでる確率1/36
1,2の目のでる確率1/36
1,3の目のでる確率1/36
...
6,5の目のでる確率1/36
6,6の目のでる確率1/36
全部たすと1になる。
ゆえに、頻度主義統計のもとではイカサマサイコロは存在しない。

×頻度主義統計のもとではイカサマサイコロは存在しない。
○サイコロの目のでる確率はどの目でも1/6であるという帰無仮説は棄却されない。
0423132人目の素数さん
垢版 |
2018/01/03(水) 08:20:21.27ID:YJfyxrv+
>>368
5試合連続で勝敗予想的中なら頻度主義では予知能力あるとされる。p=0.03125 < 0.05
https://to-kei.net/hypothesis-testing/about-2/

これは片側検定だから有意水準0. 05なら
0. 025と比較すべき。0.03125 > 0. 025

5試合連続で勝敗予想外れの確率も0.03125だから
両側検定なら0.03125 + 0.03125 = 0.0625 > 0. 05

なので
5試合連続で勝敗予想的中では予知能力があるとは言えない。
0424132人目の素数さん
垢版 |
2018/01/03(水) 08:38:06.74ID:WX3O++x6
>>415
無限に存在する素数を確率論的に扱いたいんだがどうすればいいか?。
恐怖の全数調査の真分布が使えない。
0425132人目の素数さん
垢版 |
2018/01/03(水) 08:40:41.51ID:YJfyxrv+
>>394
モンティホールの問題ってこういうの問題じゃなかった?

最初にn個から選んだ箱Aと
A を除いたn-1個からn-2個の外れを除いて残った箱B

Aがあたりの確率 1/n
Bがあたりの確率 (n-1)/n
0426132人目の素数さん
垢版 |
2018/01/03(水) 09:06:30.85ID:YJfyxrv+
>>399
平均値、最頻値、中央値を計算させてみた。

> # mean
>
> integrate(function(x)x*pdf_y(x),0,1)$value ; 2/(r+2)
[1] 0.4
[1] 0.4
>
> integrate(function(x)x*pdf_g(x),0,1)$value ; (z+1)/(N+2)
[1] 0.3636364
[1] 0.3636364
>
> # mode
>
> optimise(yuru,c(0,1),maximum = TRUE)$maximum ; 1/r
[1] 0.3333205
[1] 0.3333333
>
> optimise(gaba,c(0,1),maximum = TRUE)$maximum ; z/N
[1] 0.3333226
[1] 0.3333333
>
> # median
>
> uniroot(function(x){integrate(function(t)pdf_y(t),0,x)$value-0.5},c(0,1))$root
[1] 0.3857168
>
> uniroot(function(x){integrate(function(t)pdf_g(t),0,x)$value-0.5},c(0,1))$root
[1] 0.3550879
>
0427132人目の素数さん
垢版 |
2018/01/03(水) 12:30:45.00ID:UYxHQku1
詳しい計算 有難い。

そっか。なるほど、
効き目は、まずは、平均の大きい
薬剤yuruyuru というか薬剤yを選択、
開脚というか効果がだめなら、
薬剤gabagaba というか薬剤gを選択

これで、成功率がいい感じだろう。
0428132人目の素数さん
垢版 |
2018/01/03(水) 12:39:02.43ID:TJ1i0Y5b
Three prisoners problem.
0429132人目の素数さん
垢版 |
2018/01/03(水) 18:18:14.06ID:UYxHQku1
《囚人Aの恩赦の超確率特論》

直感的怪答
  AかCのいずれか1/2に上昇します。
  ベイズ改訂で1/3から1/2になります。

模範解答
  もともと3人だし、1/3のままである。


ワシの主観的快答

  Aの恩赦確率は1ぢゃ。

  快説しよう

  看守は、
  「Bは死刑」と言ったが、
  「Aは死刑」とは言ってないし、
  「Cは恩赦」とも言ってない。

  ぢゃから、おそらく絶対100%、
   B=死刑 、A=恩赦、 C=死刑ぢゃ。

 証明オワリぢゃ
0431132人目の素数さん
垢版 |
2018/01/03(水) 19:50:42.87ID:ve03RCFR
■3囚人問題(英: Three Prisoners problem)

ある監獄にA、B、Cという3人の囚人がいます

3人のうちランダムに選ばれた1人に恩赦が出ます

誰が恩赦になるかは看守は答えない

囚人Aに看守が「Bは死刑になる」と教えてくれます

この時、看守は嘘は言いません

囚人Aに恩赦が与えられる確率は何%でしょうか?
0433132人目の素数さん
垢版 |
2018/01/03(水) 20:46:43.09ID:YJfyxrv+
死刑囚A,B,CでAが看守に尋ねてBは死刑執行されると告げられたと設定。

恩赦(onsha)を受けるをo,死刑執行されると告(tsuge)げられるをtで表す。

Aが恩赦を受ける確率P(A=o)=1/3
Bが恩赦を受ける確率P(B=o)=1/3
Cが恩赦を受ける確率P(C=o)=1/3

求めたいのは、Bが死刑執行されると告げられた後のAが恩赦を受ける確率P(A=o|B=t)である。

ベイズの公式により
P(A=o|B=t) = P(B=t|A=o)*P(A=o) / P(B=t)

P(B=t) = P(B=t|A=o)*P(A=o) + P(B=t|B=o)*P(B=o) + P(B=t|C=o)*P(C=o)

P(B=t|B=o)=0 Bが恩赦を受けるときBが死刑執行されると告げられる確率=0
P(B=t|C=o)=1 CBが恩赦を受けるときBが死刑執行されると告げられる確率=1

問題は P(B=t|A=o)
恩赦を受けるのがAであるときに看守がCではなくBが死刑執行されると告げる確率は示されていない。
この確率をpとすると
P(A=o|B=t)は p/(p+1)となる。
もちろんp=0.5であれば、P(A=o|B=t)=1/3と看守に告げられる前と同じである。

ここでpが一様分布からさまざなβ分布に従うとするとどうなるか、グラフにしてみた。
http://i.imgur.com/vIzIabU.png
左の緑が看守がBとCが死刑執行予定であるときにBを選んで答える確率分布。
右の青が看守がBと告げたときのAが恩赦を受ける確率の分布。
0434132人目の素数さん
垢版 |
2018/01/03(水) 21:01:24.21ID:YJfyxrv+
無情報分布として一様分布を考えると

Aが恩赦を受ける確率の期待値(平均値)は

> 1-log(2)
[1] 0.3068528

となる。

p/(p+1)を [0,1]で定積分すれば求まる。

前述のJAGSでシミュレーションしたグラフに表示したもほぼ一致。
0435132人目の素数さん
垢版 |
2018/01/03(水) 21:17:04.59ID:YJfyxrv+
(タイプミス修正)

死刑囚A,B,CでAが看守に尋ねてBは死刑執行されると告げられたと設定。

恩赦(onsha)を受けるをo,死刑執行されると告(tsuge)げられるをtで表す。

Aが恩赦を受ける確率P(A=o)=1/3
Bが恩赦を受ける確率P(B=o)=1/3
Cが恩赦を受ける確率P(C=o)=1/3

求めたいのは、Bが死刑執行されると告げられた後のAが恩赦を受ける確率P(A=o|B=t)である。

ベイズの公式により
P(A=o|B=t) = P(B=t|A=o)*P(A=o) / P(B=t)

P(B=t) = P(B=t|A=o)*P(A=o) + P(B=t|B=o)*P(B=o) + P(B=t|C=o)*P(C=o)

P(B=t|B=o)=0 Bが恩赦を受けるときBが死刑執行されると告げられる確率=0
P(B=t|C=o)=1 Cが恩赦を受けるときBが死刑執行されると告げられる確率=1

問題は P(B=t|A=o)
恩赦を受けるのがAであるときに看守がCではなくBが死刑執行されると告げる確率は示されていない。
この確率をpとすると
P(A=o|B=t)は p/(p+1)となる。
もちろんp=0.5であれば、P(A=o|B=t)=1/3と看守に告げられる前と同じである。

ここでpが一様分布からさまざなβ分布に従うとするとどうなるか、グラフにしてみた。
http://i.imgur.com/vIzIabU.png
左の緑が看守がBとCが死刑執行予定であるときにBを選んで答える確率分布。
右の青が看守がBと告げたときのAが恩赦を受ける確率の分布。
0437132人目の素数さん
垢版 |
2018/01/03(水) 21:19:44.92ID:YJfyxrv+
無情報分布として一様分布を考えると

Aが恩赦を受ける確率の期待値(平均値)は

> 1-log(2)
[1] 0.3068528

となる。

Cが恩赦を受ける確率の期待値(平均値)は 
> log(2)
[1] 0.6931472

当然、Bが恩赦を受ける確率は0
0438132人目の素数さん
垢版 |
2018/01/03(水) 21:23:08.80ID:YJfyxrv+
>>436
看守は一人。
まあ、確率分布を何人もいたときの複数の看守意見の分布と考えてもいいけどね。
0439132人目の素数さん
垢版 |
2018/01/03(水) 21:58:15.94ID:YJfyxrv+
>>431
俺が高校生の頃に聞いた問題だと
 本人には死刑になると教えない
という設定だった。
何も知らないとAは死刑になる確率が2/3。
B、Cのうち少なくともどちらかは死刑になるので本人じゃないAに死刑になる人を一人教えてくれと看守に頼んでBと教わった。
それでAは自分かCのどちらかが死刑になるが確率は1/2に減ったと喜んだ。
これは正しいか?
という問題だったな。
0440132人目の素数さん
垢版 |
2018/01/04(木) 00:26:43.93ID:dMZFg8dN
■2つの封筒問題(two envelopes problem)

2種類の小切手があり、1つの小切手には
他方の4倍の金額が書き込まれています

中身が分からないように、それぞれ封筒に入れます

あなたは、どちらか1つの封筒を選ぶことができます

封筒を開けると10万円の小切手が入っていました

もし不満なら、残りの封筒と交換できます

あなたは交換しますか?しませんか?
0441132人目の素数さん
垢版 |
2018/01/04(木) 01:19:46.48ID:7TmRrDht
>>440
1万と100万が入っているのはそれぞれ1/2
よって、期待値は50万となるため、入れ替えが良い
0442132人目の素数さん
垢版 |
2018/01/04(木) 08:48:41.71ID:UEiSPdrw
>>440

>>441の有難い話が本当なら、
10万円が交換するだけで
期待値が、5倍にupぢゃ。

きっとさらに、交換すれば5倍の5倍
ぢゃから、10倍にupするハズぢゃ
スナワチ、100万円ぢゃ!

ワシなら2回交換するぞ。
0443132人目の素数さん
垢版 |
2018/01/04(木) 09:06:51.37ID:WqG62CGY
>>441
100万/10万なのか10万/1万なのか、前者の確率をpとして
pの確率分布を考えるのがベイズ流だろね。
0444132人目の素数さん
垢版 |
2018/01/04(木) 12:00:36.09ID:rTIHbEtO
100万円が含まれている確率をpとして

pの確率分布を事前分布として

B_kokan <- function(p,A=10^5,n=10)p*A*n+(1-p)*A/n

がどう変わるかみればいい。

グラフにしてみた。

http://i.imgur.com/jPAinUE.png
0445132人目の素数さん
垢版 |
2018/01/04(木) 12:22:41.37ID:7VxnZUcj
>>443
ベイズ統計だと
1/10
10/100
100/1000
1000/10000
はみなちがいますね
0446132人目の素数さん
垢版 |
2018/01/04(木) 14:55:23.69ID:rTIHbEtO
>>435

恩赦を受けるのがAであるとき(=BとCに死刑執行されるとき)に看守が、死刑執行されるのはBであると告げる確率  P(B=t|A=o) を横軸

死刑執行されるのはBであると告げられたときに恩赦を受けるのがAである確率 P(A=o|B=t) を 縦軸に グラフにしてみる。

http://i.imgur.com/xg0Ya0V.png
0447132人目の素数さん
垢版 |
2018/01/04(木) 16:17:35.72ID:rTIHbEtO
看守が嘘つきであった場合


看守が嘘を答える確率はqで一定である。
但しBとCが死刑執行予定であるときどちらを答えても嘘にならないのでBと答える確率をpとする。

この看守がBが死刑執行される予定であると答えたとき、Aが恩赦を受ける確率はいくらか?
0448132人目の素数さん
垢版 |
2018/01/04(木) 16:25:43.20ID:rTIHbEtO
恩赦を受けれる可能性は殺人件数に逆比例するという情報が得られた。

ABCの殺人件数をa,b,c とする。

看守がBが死刑執行されると告げたときのAの恩赦の確率はどうなるか?
0452132人目の素数さん
垢版 |
2018/01/04(木) 16:43:18.29ID:rTIHbEtO
>>451

P(A=o|B=t)  =  p*((1/a)/(1/a+1/b+1/c))/ ( p*((1/a)/(1/a+1/b+1/c)) + q*((1/b)/(1/a+1/b+1/c)) + (1-q)*((1/c)/(1/a+1/b+1/c)) )

だろな、たぶん。
0453132人目の素数さん
垢版 |
2018/01/04(木) 16:49:38.93ID:rTIHbEtO
Onsha <- function(a,b,c,p,q) {
p*((1/a)/(1/a+1/b+1/c))/ ( p*((1/a)/(1/a+1/b+1/c)) + q*((1/b)/(1/a+1/b+1/c)) + (1-q)*((1/c)/(1/a+1/b+1/c)) )
}
> Onsha(10,10,10,0.5,0)
[1] 0.3333333
> Onsha(10,10,10,0.5,0.3)
[1] 0.3333333
> Onsha(10,20,30,0.5,0.3)
[1] 0.5660377

恩赦確率が同じときは、看守の嘘つき確率の影響は受けないね。
0454132人目の素数さん
垢版 |
2018/01/04(木) 17:07:57.72ID:i/K9ABI7
さいころ振ったら6が出ました
つぎに6が出る確率はどうなる?

1 低くなる
連続で6が出る可能性はひくい
2 変わらない
6が出る確率は前に何が出たか影響を受けない
3 高くなる
さいころがいかさまの可能性があるから
0455132人目の素数さん
垢版 |
2018/01/04(木) 19:22:37.86ID:a4WHGiLz
>>448

囚人A,B,Cの殺人件数を3,6,9人とする。
罪状の重さに逆比例して恩赦が受けられるという。
恩赦の受けられる確率分布はディリクレ分布に従うとして
最小母数が1となるようにして母数alphaは3,1.5,1とする。
BとCが死刑執行されるときに看守がBが死刑と答える確率は一様分布に従う
看守が嘘をつく確率も一様分布に従うとする。

JAGSのスクリプトだとこんな感じ
alpha=c(1/3,1/6,1/9)*9
modelString='
model{
abc ~ ddirch(alpha)
poa=abc[1] # probability of onsha of A
pob=abc[2] # probability of onsha of B
poc=abc[3] # probability of onsha of C
p ~ dbeta(1,1)
q ~ dbeta(1,1)
onsha= p*poa/ ( p*poa + q*pob + (1-q)*poc )
}

この条件のもとで
Aが恩赦を受ける確率分布は
http://i.imgur.com/KHbXlhe.png
となる。

まあ、殺人件数が一番少ないAが恩赦を受ける確率が
1/3から上昇したのは納得できる結果である。

こういうのがベイズ推計の面白さであるね。
0456132人目の素数さん
垢版 |
2018/01/04(木) 20:57:07.68ID:OPGTqw0h
なにがなんでも、P(A=o|B=t)の
誰よりも完璧な模範解答を探るべく

>>435 の pの分布 について
一様分布ではなく

f(p) = (2/3)p + 2/3 という確率分布で
p/(p+1) の期待値は1/3になるか?

自分勝手にチャレンジしかし挫折。
一応、チャレンジ内容を説明すると

A=恩赦、B=C=死刑の時の
看守が「B死刑」と告げる確率を
P(B=t|A=o) とか、簡単にpとおく

看守が「B死刑」と告げた時の
A=恩赦、B=C=死刑の確率を
P(A=o|B=t) とおく。

すると、確かに
P(A=o|B=t) = p/(p+1) となると思う。

さて、
pの確率分布 f(p) = (2/3)p + 2/3
pの範囲[0,1] で積分値は1となるが

p/(p+1) の平均(期待値)を求めたい
でも数学得意なワシぢゃが
計算が分からん。
ここでGiveUp。
0458132人目の素数さん
垢版 |
2018/01/04(木) 22:25:22.15ID:dMZFg8dN
■理由不十分の原則(principle of insufficient reason)

事象の発生確率の予測が全くできない場合に、
全ての事象の発生確率が等しいと仮定する
0460132人目の素数さん
垢版 |
2018/01/05(金) 02:55:41.44ID:T38pjmQB
>>454
ベイズ流にアプローチしてみた。

(1)
6の目のでる確率の分布を一様分布とすると
6の目が一回でたから事後分布はbeta(2,1)なので次に6の目がでる期待値は2/3


(2)
6の目の出る確率p6を1/6としてp6=1/6が正しい確率分布を一様分布とすると
Y=c(1)
dataList=list(Y=Y)
modelString='
model{
Y ~ dbern(p6)
p6=1/6*q+5/6*(1-q)
q ~ dbeta(1,1)
}
'
でJAGSを走らせて
Lower95 Median Upper95 Mean SD Mode MCerr
p6 0.24522133917 0.600436 0.8333064 0.5731115 0.1781004 NA 0.001329018

を得て 平均 0.5731115

(3)6の目の出る確率が1/6を最頻値とする標準偏差0.1のβ分布に従うとすれば
β分布のパラメータは
a b
3.260234 12.301170
となるので
平均は0.2095077
0463132人目の素数さん
垢版 |
2018/01/05(金) 07:33:31.02ID:T38pjmQB
>>462
stanで検証

functions{
real jisaku_log(real y){
real temp;
temp = 2/3.0*y+2/3.0;
return log(temp);
}
}
data{
}
parameters{
real<lower=0,upper=1> p;
}
transformed parameters{
real q;
q = p/(p+1);
}
model{
p ~ jisaku();
}


mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat
p 0.5626 0.0074 0.2836 0.0366 0.3364 0.5874 0.8107 0.9839 1464 1.0006
q 0.3364 0.0035 0.1325 0.0353 0.2517 0.3701 0.4477 0.4959 1418 1.0007
lp__ -2.0063 0.0336 0.9343 -4.5941 -2.2177 -1.6547 -1.4262 -1.3608 773 1.0030
0464132人目の素数さん
垢版 |
2018/01/05(金) 08:11:21.51ID:erBCDs0Q
>>460
どのアプローチでも6の目がでたというデータは
事後確率分布を6の目がでる方向に歪めるね。
0466132人目の素数さん
垢版 |
2018/01/05(金) 11:16:26.93ID:erBCDs0Q
>>460
(2)のアプローチをstanでやってみた。

data=list(Y=1)
stanString='
data{
int Y;
}
parameters{
real<lower=0,upper=1> q;
}
transformed parameters{
real<lower=0,upper=1> p6;
p6=1/6.0*q+5/6.0*(1-q);
}
model{
Y ~ bernoulli(p6);
q ~ beta(1,1);
}

mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat
q 0.3901 0.0030 0.2661 0.0157 0.1602 0.3512 0.5910 0.9289 7827 1.0003
p6 0.5733 0.0020 0.1774 0.2141 0.4393 0.5992 0.7265 0.8229 7827 1.0003
lp__ -2.6057 0.0103 0.8248 -4.9881 -2.8346 -2.2830 -2.0537 -1.9902 6400 1.0002

6の目のでる事後確率の平均値は 0.5733 でJAGSと同じ結果。

暇つぶしネタを与えてくれた>454に感謝
0467132人目の素数さん
垢版 |
2018/01/05(金) 12:22:27.36ID:dx8+jX7a
さいころ振ったら6が出ました
つぎに6が出る確率はどうなる?

1 低くなる
連続で6が出る可能性はひくい
2 変わらない
6が出る確率は前に何が出たか影響を受けない
3 高くなる
さいころがいかさまの可能性があるから

#当然さいころがいかさまの可能性をかんがえるならば
6の出る可能性が1/6より小さいいかさまさいころで
たまたま6がでた場合も含めるとする
0468132人目の素数さん
垢版 |
2018/01/05(金) 13:38:24.73ID:dwyd0VL3
>>467
サイコロE1 = 6の目がでる確率は1/12
サイコロE2 = 6の目がでる確率は2/12
サイコロE3 = 6の目がでる確率は3/12

事前分布
  P(E1) = P(E2) = P(E3) = 1/3
とまずは、勝手に設定し計算してみた

直感的怪答
  1/6
  単なる条件付確率ぢゃし、
  ‎事前分布はE1,E2,E3同じぢゃろ。
  ‎ぢゃから、
  ‎1/12、2/12、3/12 の単純平均で
  ‎2/12 約分すれば、1/6ぢゃ

模範解答
  7/36 である。
  ‎1/12 , 2/12 , 3/12 の
  ‎1:2:3 の重み付き平均は7/36です。

ワタシの超怪答
  1/6で良い
  
  事前分布、‎P(E1) > P(E3) にすべきぢゃ
  ‎∵ 1/6ぢゃないのは、奇妙ぢゃ
  ‎
  ちなみに、
  ‎P(E1) = P(E3) = 0、‎P(E2) = 1 ぢゃダメ
  イカサマぢゃなくても‎
  ‎1‎/6より微かにずれるものぢゃ
0470132人目の素数さん
垢版 |
2018/01/05(金) 14:19:20.95ID:e/1AehnQ
6の出る可能性が1/6より小さいいかさまさいころ とすると

(1)
6の目のでる確率の分布を一様分布とすると
6の目が一回でたから事後分布はbeta(2,1)なので次に6の目がでる期待値は2/3
p<1/6の確率は
> pbeta(1/6,2,1)
[1] 0.02777778

(2)
6の目の出る確率p6を1/6としてp6=1/6が正しい確率分布を一様分布とすると平均 0.5731115
p<1/16の確率は0

(3)6の目の出る確率が1/6を最頻値とする標準偏差0.1のβ分布に従うとすれば
> pbeta(1/6,3.260234,12.301170)
[1] 0.3785766
0471132人目の素数さん
垢版 |
2018/01/05(金) 14:27:12.34ID:e/1AehnQ
>>468
離散量で一様分布の真似なら

サイコロE4 = 6の目がでる確率は4/12
...
サイコロE4 = 6の目がでる確率は12/12

も考えなくちゃだめだろ?
0472132人目の素数さん
垢版 |
2018/01/05(金) 15:34:37.93ID:dwyd0VL3
>>469
直感的かつナナメな怪答
  ちょっとでも1/6からずれてたら
  数学的に‎イカサマぢゃ∴
  サイコロの100%は‎イカサマぢゃ
  でも、しかし、試験なら、
  ‎6の目確率は、常に1/6で計算ぢゃ。

ナナメな模範解答
  そっか、鋭い質問
  ‎ちょっとなら1/6からずれても
  ‎良いことにしないと、
  ‎サイコロの100%は‎イカサマになるか

>>471
直感的かつナナメな怪答
  そんなことより、6の確率が
  事前分布の平均 ≧ 1/6
  事後分布の平均 ≦ 1/6
  ‎となる事前分布どっかにないかな!?
  ‎誰かそんな‎事前分布で計算しないかな

模範解答擬き
  P(E4) = P(E5) = … = P(E12) = 0
  ‎にしないと計算が大変 (^_^;)
0474132人目の素数さん
垢版 |
2018/01/05(金) 18:56:45.29ID:T38pjmQB
>>472
死刑囚の話に戻るけど

f(p) = (2/3)p + 2/3 という確率分布

って何の意味があるの?
0475>>456 >>472
垢版 |
2018/01/06(土) 00:50:19.33ID:Q/MujK2a
>>474
確率分布を事前分布とした理由は
今考え直したら支離滅裂な直感でした。

意味は、概ね何でもない。ので
気にしないで下さい。

あえて意味を言えば、
P(A=o|B=t) の平均が1/3となるような
P(B=t|A=o) の確率分布というだけ

支離滅裂な内容ですが説明すると、

pが定数1/2とするなら、
P(A=o|B=t) = p/(p+1)より、
P(A=o|B=t) = 1/3 となる。

だから、
pの平均が1/2の確率変数なら、
P(A=o|B=t)の平均も1/3だろうと確信。

しかし、計算すると、
pの平均が1/2の連続一様分布なら、
P(A=o|B=t)の平均は‎ln(2)=0.30685のようだ

では、P(A=o|B=t)の平均が1/3となる
pの分布はどんな分布なのか知りたくなる
そう、
f(p=0) : f(p=1) = 1 : 2 な確率分布かな
だから、
f(p) = (2/3)p + 2/3 という確率分布 を
事前分布とする。

まっ、今見直と、支離滅裂です。(^_^;)
0476132人目の素数さん
垢版 |
2018/01/06(土) 01:47:46.30ID:iMxWsf/t
>>475
確率密度関数がa*x+bの形なら

integral(x/(x+1)*(a*x+b),0,1)=
a *(log(2) - 1/2) + b*(1- log(2)) = 1/3

を満たすときでしょうね。
0477132人目の素数さん
垢版 |
2018/01/06(土) 17:44:49.43ID:/dGmbUCU
>>467
あらゆる可能性考えて
具体的な数字をださなくてもいいなら

@古今東西振られたサイコロのうちそれがいかさまであるという確率は相当ひくいとおもう

Aいかさまである場合に
6の出る確率が6分の1超である場合と
6分の1以下である場合が打ち消しあうことになるが
6分の1以下である可能性はそんなにたかくないしだろうし、ふれ幅も小さいから
若干の打消しが生じるくらいだろう

Bいかさまである場合に
6の出る確率が6分の1超であるときにおいては
あからさまないかさまをしてる可能性はひくいので
1/6と1の間くらいの0.6前後くらいが期待値になるのではないかな

総合的に考えれば
6が出た後に6が出る確率は6分の1よりおおきくなるだろうが
@の影響がかなりおおきくて
ほとんど無視できるれレベルだとおもう
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況