ベイズの統計学を学び始めたんだけど
■ このスレッドは過去ログ倉庫に格納されています
信用に値するのか疑問です。 人工知能とかではなく日々の動機付けに利用する予定です >>376 理論値は [1] 0.00001262228 0.00306721363 0.03944461975 0.21214263175 0.74533291259 まあ、よく一致しているな。 イカサマコインの定義をp=0.5以外とすると 表確率0.01のコインである確率 1/100 表確率0.02のコインである確率 1/100 .... 表確率0.99のコインである確率 1/100 表確率1.000のコインである確率 1/100 1-0.5^5/(0.01^5+0.02^5+...+0.99^5+1.00^5) = 0.9981801 0.001単位で区切ると 0.9998131になってしまうね。 ベイズ統計学で トランプのシャッフルについての見識は得られる? 十分シャッフルされた状態にするのに どういう切り方で何度やればいいかとか あけおめ! おまえらの似非統計今年もたのしむわwwwwwwwwwwww >>373 >>ベイズだとp=1/6の確率分布を一様分布とすると >>10 回サイコロを振って7回でて 10回サイコロを振って7回1の目が出たのなら、0.6〜0.7の当たりにピークを持つような 分布になることが予想されるけど、示されている図は、0に近いところにピークが来るよ うなグラフになってます。この図は、1以外の目のグラフじゃないですか? 「1の目が出すぎで歪んでいる」≠「(1以外の例えば)6の目が出なさすぎで歪んでいる」 だと思います。 ∧_∧ ( ´Д` ) 新年あけまして / ヽ し、__X__,ノJ /´⌒⌒ヽ l⌒ ⌒l おめでとうございます ⊂ ( ) ⊃ V ̄V >>381 目の出る確率ではなくてp=1/6が正しい確率の分布。 サイコロを投げる前はp=1/6である可能性は0.01でも0.99でも同じ一様分布だったが 10回中7回、一の目がでたことから p=1/6が正しい確率の分布が0に近い方にピークを持つようになった。 なるほど、そうだったんですか。 >>297 に描かれている図の方は、「各目の出る確率の分布」だったので、 てっきり、そのような分布だと思っていました。 >>373 は、「1の目の出る確率が1/6で正しいかどうか」の確率のようなものとのことですが、 逆に、「1の目の出る確率」のようなものも、同時に求めることも出来るんですか? サイコロを投げる前(事前確率分布)と10回投げて0〜7回1の目がでた時のp=1/6が正しい確率の分布をグラフにすると http://i.imgur.com/P1sng4W.png 確率の平均の最大値は10×1/6回あたりにあるのがみてとれる。 別種のグラフだと言うことがよく分かりました。 わざわざありがとうございました。 >>384 >逆に、「1の目の出る確率」のようなものも、同時に求めることも出来るんですか? 同時には求まらない。 1の目の出る確率を一様分布とするすれば10回中7回1の目がでた後の事後分布はbeta(1+7,1+10-7)なので平均8/12,最頻値7/10になる。 サイコロの目なので最頻値1/6、分散0.1^2と主観的に事前確率分布を決めてしまえば これに相当するβ分布のパラメータは3.26,12.3となるので(この計算はやや面倒) 平均値0.4015354 中央値0.3989152 最頻値0.3858124 で 95%信用区間は 0.2189457〜 0.5873959 この様子をRのパッケージBESTのplotPost関数を改造してグラフにすると http://i.imgur.com/YcfKDO9.png >>387 (補足) >サイコロの目なので最頻値1/6、分散0.1^2と主観的に事前確率分布を決めてしまえば と書いたが サイコロの目は6面あるから事前分布の最頻値を1/6にするのはまあいいとして分散の値の根拠がないじゃないか、との批判は当然。 そこで標準偏差が0〜100の間で一様分布するとして JAGSでMCMCしたのが以下のグラフ。 http://i.imgur.com/72xn58M.png 分散0.1^2のときより歪なのが明らかになったといえる。 >>388 (補足の補足) >サイコロの目は6面あるから事前分布の最頻値を1/6にする これだって主観的過ぎるという異論も当然ある。 1の目のでる確率の平均(正規分布を仮定するので最頻値と一致)も平均1/6で標準偏差が一様分布に従うとしてMCMCでサンプリングしてみた。 (標準偏差は0〜100の範囲の一様分布に設定) http://i.imgur.com/i2OFAo1.png 一の目がでる値の平均値は2/3程度で平均の平均を1/6と固定したときとあまり変わらない。 Gelmanの主張に従って標準偏差の事前分布をhalf-cauchy分布にしてみた。 尺度母数=5での結果をグラフにすると http://i.imgur.com/5Qm4wfP.png コーシー分布なだけあって1000を超える値がサンプリングされている。 それでも、1の目の出る確率の平均は2/3程度で他の結果と同じ。 コインを10回なげて7回表なら 表確率7/10 つまり0.7のはずぢゃ! しかし、これは神の御告げによると、 子供騙しな計算とのことぢゃ。 表確率は、神の御告げでは、 (7+1)/(10+2) つまり8/12 だから2/3 0.7とは違うよ!とのこと なので、ベイズの確率で手計算で検証ぢゃ まっ、 事前確率の分布は、連続一様分布ぽく 表確率0.1のコイン確率 20% 表確率0.3のコイン確率 20% 表確率0.5のコイン確率 20% 表確率0.7のコイン確率 20% 表確率0.9のコイン確率 20% としてみる。 で、 7回連続で表、その後3回連続で裏の確率 それを100万倍すると、 0.1^7 * 0.9^3 * 1000000 = 0 0.3^7 * 0.7^3 * 1000000 = 75 0.5^7 * 0.5^3 * 1000000 = 977 0.7^7 * 0.3^3 * 1000000 = 2223 +) 0.9^7 * 0.1^3 * 1000000 = 478 ─────────────── total = 3753 ぢゃから、 事後確率は、 表確率0.1のコイン確率 0% 表確率0.3のコイン確率 2% ∵75/3753 表確率0.5のコイン確率 26% ∵977/3753 表確率0.7のコイン確率 59% ∵2223/3753 表確率0.9のコイン確率 13% ∵478/3753 ぢゃ ぢゃから、 10回中7回表で、表確率0.7コインの確率は、 改訂前 20% 改訂後 59% に改訂ぢゃ ちなみに、表確率の平均ぢゃが、 改訂前 0.5 改訂後 0.67 に改訂ぢゃ ∵(0.3*2 + 0.5*26 + 0.7*59 + 0.9*13)/100 神の御告げは、出鱈目なのに冴えている。 beta(1+7,1+10-7)のβ分布になるので期待値は8/12、最頻値が10/7 パラメータを a=8 b=4 と おいて 最頻値 (a-1)/(a+b-2) 平均値 a/(a+b) 分散 a*b/((a+b)^2*(a+b+1)) というだけの話。 事前分布の期待値や分散に様々な仮定をおいてもこの結論はほぼ同じ。 分散の事前分布に半コーシー分布(尺度母数5)を使うと事後分布がβ分布でよく当てはまるのだが、 http://i.imgur.com/RB9Q3GH.png 逆ガンマ関数(母数=0.001)を使うとずれが大きい。 http://i.imgur.com/9YCgXof.png 正月休みの暇つぶしクイズ 薬剤yを1人ずつ投与して効果判定したら、3人めで効果が確認できた。 薬剤gを9人同時に投与したら3人に効果があった。 どちらの有効性が高いか? 別バージョン(こっちがオリジナルw) ゆるゆる女子大生に1人ずつメールで誘ったら3人めが開脚。、 がばがば女子大生9人に一斉にメールを送ったら3人が開脚。 どっちが開脚が容易か? 頻度主義からするとどちらも1/3だから優劣なしになるのだが、 ベイズ統計における確率はcredibility(確信の度合い、信憑性や説得力の度合いと言ってもいい)なので 議論の余地がある。 ■モンティホール問題(チャーハンと餃子) このゲームができるのは1回だけです チャーハン99皿と餃子1皿を個別に 外からは中が見えない100個の箱に入れます その中から1個の箱を選びます チャーハンが入った98個の箱を取り除きます 最後に残った2個の箱の中から1個の箱を選びます あなたが餃子を当てる確率は何%でしょう? >>393 頻度論ってそんなんだっけ? 頻度論は無限に思考を行ったときの頻度が確率といっちするっていう 確率とはなにかの解釈であって 3回やったうち1回あることがおきたなら 三分の一の確率だというもんじゃなかったような 明確な定義なんてないんだろうけど 頻度と頻度論的確率解釈をごっちゃにしてるような 一応ぐぐったけど明確な定義らしきものはみつからからなかったので 英語版ウィキみたらやっぱりそうかいてる あと検定とが信頼区間求めるとかしないといみないんじゃない? あと何回目で成功するは幾何分布やから 3分の1の確率で成功するとするなら 三回目に成功する確率は (1/3)*(2/3)^2= 0.1481481 じゃないのかなあ 検者の意図で変わるp値。 (修正再掲) ある大学の入学者男女の比率は1であるという帰無仮説を検定する課題が花子と太郎に課された。 花子は50人を調査できたら終了として入学者を50人をみつけて18人が女子であるという結果を得た。 帰無仮説のもとで 50人中18人が女子である確率は 0.01603475 これ以下になるのは50人中0〜18人と32〜50人が女子の場合なので 両側検定して > sum(dbinom(c(0:18,32:50),50,0.5)) [1] 0.06490865 > binom.test(18,50,0.5)$p.value [1] 0.06490865 で帰無仮説は棄却できないと結論した。 一方、本 番と十八番が好きな太郎は一人ずつ調べて18人めの女子がみつかったところで調査を終えることにした。 18人めがみつかったのは花子と同じく50人めであった。 帰無仮説のもとで 18人がみつかるのが50人めである確率は0.005772512 これ以下になるのは23人以下50人以上番めで女子18人めがみつかった場合なので 両側検定して pnb=dnbinom(0:999,18,0.5) > 1 - sum(pnb[-which(pnb<=dnbinom(50-18,18,0.5))]) # < 0.05 [1] 0.02750309 で帰無仮説は棄却される。 どちらの検定が正しいか、どちらも正しくないか? 検定する意図によってp値が変わるのは頻度主義統計の欠陥といえるか? >>396 レスありがとう。 幾何分布と二項分布の比較になる。 グラフにするとこんな感じ。 http://i.imgur.com/9tPLoW9.png 最頻値や期待値を比べてどう解釈するかの議論ではないかと思う。 サイコロを2回投げて1の目が2回続いた。 この確率は(1/6)^2=0.02777778 この確率以下の事象の起こる確率の総和がp値であるから 1,1の目のでる確率1/36 1,2の目のでる確率1/36 1,3の目のでる確率1/36 ... 6,5の目のでる確率1/36 6,6の目のでる確率1/36 全部たすと1になる。 ゆえに、頻度主義統計のもとではイカサマサイコロは存在しない。 検定はまったくのごまかしだが 区間推定もたいがいなまやかしだな >>398 なにの主張なのかよくわからんけど 分布の形がにてるたら別にどの確率分布をつかってもいいってこと? 頻度論てき確率の問題かどうかの話にはなってないし 頻度論とかの問題じゃなく 実験の結果によって実験をかえる つまり、成功したらそこでやめる 実験計画にもんだいがあるんだけど 事前に何回やって得られたデータから分析をおこなうってのと 事前に何回やるかきめずに成功したらそこで実験をやめるってのは 根本的に違うし後者は安易にやるべきじゃない。 >>402 >事前に何回やるかきめずに成功したらそこで実験をやめるってのは >根本的に違うし後者は安易にやるべきじゃない。 それはまさに正論。 p<0.05になったらサンプリングをやめるというイカサマに騙される椰子大杉。 >>402 細くて長い のと 太くて短いのが どちらが有用かという価値判断だな。 チン〇の話ではないぞwww >>393 開脚率の期待値を計算してみた。 ゆるゆる女子大生の開脚率期待値:r人目で初めて開脚 r=3 Ex.yuru <- function(r){ integrate(function(x)x*(1-x)^(r-1)*x,0,1)$value/integrate(function(x)(1-x)^(r-1)*x,0,1)$value } Ex.yuru(r) 2/(r+2) がばがば女子大生の開脚率期待値:N人中z人開脚 N=9 z=3 Ex.gaba <- function(N,z){ integrate(function(x) x*choose(N,z)*x^z*(1-x)^(N-z),0,1)$value/integrate(function(x)choose(N,z)*x^z*(1-x)^(N-z),0,1)$value } Ex.gaba(9,3) (z+1)/(N+2) 両女子大生の開脚率の事前確率を一様分布として事後分布をグラフにしてみた。 http://i.imgur.com/WLg1Cw1.png >>405 ちがうよそれ その式ならr(最初の成功がでるまでの試行回数。ふつうはこっちをxとく)について積分しないといけない x(確率。ふつうはpとおく)がパラメータ 幾何分布の期待値は1/pだからpを推定しないともとまらない 二項分布の期待値はnp 393の例の設定でやるなら幾何分布の期待値は3で二項分布も3 np=1/pが成り立つときに二項分布と幾何分布の期待値はひとしくなる 二項分布やら幾何分布の確率分布図のx軸や確率分布関数f(x)のxは確率じゃないよ >>406 最頻値での確率を重視するなら、がばがば女子大生 平均値(期待値)を重視するなら、ゆるゆる女子大生 ということ。 Rつかいたいだけで何やってるか全然わかってなさそうな人だな >>409 確率の期待値を計算したいのであって、回数の期待値を計算したいわけではないから問題なし。 β分布の横軸は0〜1までの確率だよ。 事前確率分布一様分布が9回試行して3回成功することでβ(1+3,1+6)のβ分布にベイズ更新されるというお話。 >>409 階層ベイズモデルのスクリプト書いたことない? >393のだと ゆるゆる開脚率p1 がばがば開脚率p2 とその差diff の分布を求めるMCMCを実行。 横軸は当然、確率。 縦軸は確率密度。 JAGSで書けばこんな感じ。 model{ for(i in 1:r){ y[i] ~ dbern(p1) } z ~ dbin(p2,N) diff = p1 -p2 p1 ~ dbeta(1,1) p2 ~ dbeta(1,1) } >>393 薬剤y = 効果があったのが1人いた。そこで 実験止めたら、3人に実験してた。 薬剤y' = 3人同時で、1人効果あり 薬剤g' = 効果があったのが3人になったとき 実験止めたら、9人に実験してた。 薬剤g = 9人同時で、3人効果あり としたとき、安易には P(y) = P(y') = P(g) = P(y') = 1/3 なのぢゃが 多分、 P(y) = P(y') = 2/5 > P(g') = P(g) = 4/11 ぢゃろう。何となく なお、 薬剤g'' = 効果があったのが1人いた。 その時点で7人に実験してた。 で、実験は続行したら、 ラッキーなことに、 8人目、9人目 効果があり そこで実験を止める。 としたとき、 心理的に、P(g'') > P(g) = 4/11 ぢゃが。 >>412 なるほどね >>400 統計的検定においても きむ仮説を何にするか有意水準をなににするかは一意にきめられることではない 主観確率でつまりさいころが明らかに不正であるという印象があるなら きむ仮説や有意水準はかえることができる たとえば1でそうにない1が出る確率について検定することになる それは主観確率じゃないかというはなしになるが 結局はそういうことになる 確率とは 主観確率と古典確率と頻度確率を折衷したものなんだから 主観確率だって頻度確率やら古典確率を考慮に入れて決定されるのだから。 >>412 つまり頻度論的確率の問題じゃないってことでいいよね? 東洋大の往路優勝はヴェイパーフライ4%の効果である。 だれか、これをベイズ統計で検証してください。 どのようにアプローチするのか勉強したいです。 >>394 モンティホール問題を1回だけ行う時の当たる確率は 最後に二者択一を1回行うだけですので 必ず50%です 箱が100万個あっても変わりません これは否定できません >>418 7億円当たる確率も 当たりくじあ当たらないかの2者択一だから50%だな >>418 そう思うだろ?リアルでやってみ? 200回実行したけど、理論通りだったわ。 サイコロを2回投げて1の目が2回続いた。 この確率は(1/6)^2=0.02777778 この確率以下の事象の起こる確率の総和がp値であるから 1,1の目のでる確率1/36 1,2の目のでる確率1/36 1,3の目のでる確率1/36 ... 6,5の目のでる確率1/36 6,6の目のでる確率1/36 全部たすと1になる。 ゆえに、頻度主義統計のもとではイカサマサイコロは存在しない。 ×頻度主義統計のもとではイカサマサイコロは存在しない。 ○サイコロの目のでる確率はどの目でも1/6であるという帰無仮説は棄却されない。 >>368 5試合連続で勝敗予想的中なら頻度主義では予知能力あるとされる。p=0.03125 < 0.05 https://to-kei.net/hypothesis-testing/about-2/ これは片側検定だから有意水準0. 05なら 0. 025と比較すべき。0.03125 > 0. 025 5試合連続で勝敗予想外れの確率も0.03125だから 両側検定なら0.03125 + 0.03125 = 0.0625 > 0. 05 なので 5試合連続で勝敗予想的中では予知能力があるとは言えない。 >>415 無限に存在する素数を確率論的に扱いたいんだがどうすればいいか?。 恐怖の全数調査の真分布が使えない。 >>394 モンティホールの問題ってこういうの問題じゃなかった? 最初にn個から選んだ箱Aと A を除いたn-1個からn-2個の外れを除いて残った箱B Aがあたりの確率 1/n Bがあたりの確率 (n-1)/n >>399 平均値、最頻値、中央値を計算させてみた。 > # mean > > integrate(function(x)x*pdf_y(x),0,1)$value ; 2/(r+2) [1] 0.4 [1] 0.4 > > integrate(function(x)x*pdf_g(x),0,1)$value ; (z+1)/(N+2) [1] 0.3636364 [1] 0.3636364 > > # mode > > optimise(yuru,c(0,1),maximum = TRUE)$maximum ; 1/r [1] 0.3333205 [1] 0.3333333 > > optimise(gaba,c(0,1),maximum = TRUE)$maximum ; z/N [1] 0.3333226 [1] 0.3333333 > > # median > > uniroot(function(x){integrate(function(t)pdf_y(t),0,x)$value-0.5},c(0,1))$root [1] 0.3857168 > > uniroot(function(x){integrate(function(t)pdf_g(t),0,x)$value-0.5},c(0,1))$root [1] 0.3550879 > 詳しい計算 有難い。 そっか。なるほど、 効き目は、まずは、平均の大きい 薬剤yuruyuru というか薬剤yを選択、 開脚というか効果がだめなら、 薬剤gabagaba というか薬剤gを選択 これで、成功率がいい感じだろう。 《囚人Aの恩赦の超確率特論》 直感的怪答 AかCのいずれか1/2に上昇します。 ベイズ改訂で1/3から1/2になります。 模範解答 もともと3人だし、1/3のままである。 ワシの主観的快答 Aの恩赦確率は1ぢゃ。 快説しよう 看守は、 「Bは死刑」と言ったが、 「Aは死刑」とは言ってないし、 「Cは恩赦」とも言ってない。 ぢゃから、おそらく絶対100%、 B=死刑 、A=恩赦、 C=死刑ぢゃ。 証明オワリぢゃ >>429 死刑と恩赦が隣り合っているシュレティンガーな状態が正解 ■3囚人問題(英: Three Prisoners problem) ある監獄にA、B、Cという3人の囚人がいます 3人のうちランダムに選ばれた1人に恩赦が出ます 誰が恩赦になるかは看守は答えない 囚人Aに看守が「Bは死刑になる」と教えてくれます この時、看守は嘘は言いません 囚人Aに恩赦が与えられる確率は何%でしょうか? 死刑囚A,B,CでAが看守に尋ねてBは死刑執行されると告げられたと設定。 恩赦(onsha)を受けるをo,死刑執行されると告(tsuge)げられるをtで表す。 Aが恩赦を受ける確率P(A=o)=1/3 Bが恩赦を受ける確率P(B=o)=1/3 Cが恩赦を受ける確率P(C=o)=1/3 求めたいのは、Bが死刑執行されると告げられた後のAが恩赦を受ける確率P(A=o|B=t)である。 ベイズの公式により P(A=o|B=t) = P(B=t|A=o)*P(A=o) / P(B=t) P(B=t) = P(B=t|A=o)*P(A=o) + P(B=t|B=o)*P(B=o) + P(B=t|C=o)*P(C=o) P(B=t|B=o)=0 Bが恩赦を受けるときBが死刑執行されると告げられる確率=0 P(B=t|C=o)=1 CBが恩赦を受けるときBが死刑執行されると告げられる確率=1 問題は P(B=t|A=o) 恩赦を受けるのがAであるときに看守がCではなくBが死刑執行されると告げる確率は示されていない。 この確率をpとすると P(A=o|B=t)は p/(p+1)となる。 もちろんp=0.5であれば、P(A=o|B=t)=1/3と看守に告げられる前と同じである。 ここでpが一様分布からさまざなβ分布に従うとするとどうなるか、グラフにしてみた。 http://i.imgur.com/vIzIabU.png 左の緑が看守がBとCが死刑執行予定であるときにBを選んで答える確率分布。 右の青が看守がBと告げたときのAが恩赦を受ける確率の分布。 無情報分布として一様分布を考えると Aが恩赦を受ける確率の期待値(平均値)は > 1-log(2) [1] 0.3068528 となる。 p/(p+1)を [0,1]で定積分すれば求まる。 前述のJAGSでシミュレーションしたグラフに表示したもほぼ一致。 (タイプミス修正) 死刑囚A,B,CでAが看守に尋ねてBは死刑執行されると告げられたと設定。 恩赦(onsha)を受けるをo,死刑執行されると告(tsuge)げられるをtで表す。 Aが恩赦を受ける確率P(A=o)=1/3 Bが恩赦を受ける確率P(B=o)=1/3 Cが恩赦を受ける確率P(C=o)=1/3 求めたいのは、Bが死刑執行されると告げられた後のAが恩赦を受ける確率P(A=o|B=t)である。 ベイズの公式により P(A=o|B=t) = P(B=t|A=o)*P(A=o) / P(B=t) P(B=t) = P(B=t|A=o)*P(A=o) + P(B=t|B=o)*P(B=o) + P(B=t|C=o)*P(C=o) P(B=t|B=o)=0 Bが恩赦を受けるときBが死刑執行されると告げられる確率=0 P(B=t|C=o)=1 Cが恩赦を受けるときBが死刑執行されると告げられる確率=1 問題は P(B=t|A=o) 恩赦を受けるのがAであるときに看守がCではなくBが死刑執行されると告げる確率は示されていない。 この確率をpとすると P(A=o|B=t)は p/(p+1)となる。 もちろんp=0.5であれば、P(A=o|B=t)=1/3と看守に告げられる前と同じである。 ここでpが一様分布からさまざなβ分布に従うとするとどうなるか、グラフにしてみた。 http://i.imgur.com/vIzIabU.png 左の緑が看守がBとCが死刑執行予定であるときにBを選んで答える確率分布。 右の青が看守がBと告げたときのAが恩赦を受ける確率の分布。 無情報分布として一様分布を考えると Aが恩赦を受ける確率の期待値(平均値)は > 1-log(2) [1] 0.3068528 となる。 Cが恩赦を受ける確率の期待値(平均値)は > log(2) [1] 0.6931472 当然、Bが恩赦を受ける確率は0 >>436 看守は一人。 まあ、確率分布を何人もいたときの複数の看守意見の分布と考えてもいいけどね。 >>431 俺が高校生の頃に聞いた問題だと 本人には死刑になると教えない という設定だった。 何も知らないとAは死刑になる確率が2/3。 B、Cのうち少なくともどちらかは死刑になるので本人じゃないAに死刑になる人を一人教えてくれと看守に頼んでBと教わった。 それでAは自分かCのどちらかが死刑になるが確率は1/2に減ったと喜んだ。 これは正しいか? という問題だったな。 ■2つの封筒問題(two envelopes problem) 2種類の小切手があり、1つの小切手には 他方の4倍の金額が書き込まれています 中身が分からないように、それぞれ封筒に入れます あなたは、どちらか1つの封筒を選ぶことができます 封筒を開けると10万円の小切手が入っていました もし不満なら、残りの封筒と交換できます あなたは交換しますか?しませんか? >>440 1万と100万が入っているのはそれぞれ1/2 よって、期待値は50万となるため、入れ替えが良い >>440 >>441 の有難い話が本当なら、 10万円が交換するだけで 期待値が、5倍にupぢゃ。 きっとさらに、交換すれば5倍の5倍 ぢゃから、10倍にupするハズぢゃ スナワチ、100万円ぢゃ! ワシなら2回交換するぞ。 >>441 100万/10万なのか10万/1万なのか、前者の確率をpとして pの確率分布を考えるのがベイズ流だろね。 100万円が含まれている確率をpとして pの確率分布を事前分布として B_kokan <- function(p,A=10^5,n=10)p*A*n+(1-p)*A/n がどう変わるかみればいい。 グラフにしてみた。 http://i.imgur.com/jPAinUE.png >>443 ベイズ統計だと 1/10 10/100 100/1000 1000/10000 はみなちがいますね >>435 恩赦を受けるのがAであるとき(=BとCに死刑執行されるとき)に看守が、死刑執行されるのはBであると告げる確率 P(B=t|A=o) を横軸 死刑執行されるのはBであると告げられたときに恩赦を受けるのがAである確率 P(A=o|B=t) を 縦軸に グラフにしてみる。 http://i.imgur.com/xg0Ya0V.png 看守が嘘つきであった場合 看守が嘘を答える確率はqで一定である。 但しBとCが死刑執行予定であるときどちらを答えても嘘にならないのでBと答える確率をpとする。 この看守がBが死刑執行される予定であると答えたとき、Aが恩赦を受ける確率はいくらか? 恩赦を受けれる可能性は殺人件数に逆比例するという情報が得られた。 ABCの殺人件数をa,b,c とする。 看守がBが死刑執行されると告げたときのAの恩赦の確率はどうなるか? >>448 これでいいと思う。 p*(a/(a+b+c))/ ( p*(a/(a+b+c)) + q*(b/(a+b+c)) + (1-q)*(c/(a+b+c)) ) >>449 これだと恩赦確率が殺人件数比例になってしまうな。 考え直そう。 >>450 間違えてない気もしてきた。 ご意見募集。 >>451 P(A=o|B=t) = p*((1/a)/(1/a+1/b+1/c))/ ( p*((1/a)/(1/a+1/b+1/c)) + q*((1/b)/(1/a+1/b+1/c)) + (1-q)*((1/c)/(1/a+1/b+1/c)) ) だろな、たぶん。 Onsha <- function(a,b,c,p,q) { p*((1/a)/(1/a+1/b+1/c))/ ( p*((1/a)/(1/a+1/b+1/c)) + q*((1/b)/(1/a+1/b+1/c)) + (1-q)*((1/c)/(1/a+1/b+1/c)) ) } > Onsha(10,10,10,0.5,0) [1] 0.3333333 > Onsha(10,10,10,0.5,0.3) [1] 0.3333333 > Onsha(10,20,30,0.5,0.3) [1] 0.5660377 恩赦確率が同じときは、看守の嘘つき確率の影響は受けないね。 さいころ振ったら6が出ました つぎに6が出る確率はどうなる? 1 低くなる 連続で6が出る可能性はひくい 2 変わらない 6が出る確率は前に何が出たか影響を受けない 3 高くなる さいころがいかさまの可能性があるから >>448 囚人A,B,Cの殺人件数を3,6,9人とする。 罪状の重さに逆比例して恩赦が受けられるという。 恩赦の受けられる確率分布はディリクレ分布に従うとして 最小母数が1となるようにして母数alphaは3,1.5,1とする。 BとCが死刑執行されるときに看守がBが死刑と答える確率は一様分布に従う 看守が嘘をつく確率も一様分布に従うとする。 JAGSのスクリプトだとこんな感じ alpha=c(1/3,1/6,1/9)*9 modelString=' model{ abc ~ ddirch(alpha) poa=abc[1] # probability of onsha of A pob=abc[2] # probability of onsha of B poc=abc[3] # probability of onsha of C p ~ dbeta(1,1) q ~ dbeta(1,1) onsha= p*poa/ ( p*poa + q*pob + (1-q)*poc ) } この条件のもとで Aが恩赦を受ける確率分布は http://i.imgur.com/KHbXlhe.png となる。 まあ、殺人件数が一番少ないAが恩赦を受ける確率が 1/3から上昇したのは納得できる結果である。 こういうのがベイズ推計の面白さであるね。 なにがなんでも、P(A=o|B=t)の 誰よりも完璧な模範解答を探るべく >>435 の pの分布 について 一様分布ではなく f(p) = (2/3)p + 2/3 という確率分布で p/(p+1) の期待値は1/3になるか? 自分勝手にチャレンジしかし挫折。 一応、チャレンジ内容を説明すると A=恩赦、B=C=死刑の時の 看守が「B死刑」と告げる確率を P(B=t|A=o) とか、簡単にpとおく 看守が「B死刑」と告げた時の A=恩赦、B=C=死刑の確率を P(A=o|B=t) とおく。 すると、確かに P(A=o|B=t) = p/(p+1) となると思う。 さて、 pの確率分布 f(p) = (2/3)p + 2/3 pの範囲[0,1] で積分値は1となるが p/(p+1) の平均(期待値)を求めたい でも数学得意なワシぢゃが 計算が分からん。 ここでGiveUp。 鶴亀算に生死不明の猫や杖を持つ人間を登場させる必要は無い。 ■理由不十分の原則(principle of insufficient reason) 事象の発生確率の予測が全くできない場合に、 全ての事象の発生確率が等しいと仮定する >>456 p*f(p)を[0,1]で積分すれば5/9が得られる。 横着をしてWolframにやってもらって https://www.wolframalpha.com/input/?i=integral (x*(+2%2F3*x+%2B+2%2F3),0,1) 期待値は原点周りの一次モーメント。 >>454 ベイズ流にアプローチしてみた。 (1) 6の目のでる確率の分布を一様分布とすると 6の目が一回でたから事後分布はbeta(2,1)なので次に6の目がでる期待値は2/3 (2) 6の目の出る確率p6を1/6としてp6=1/6が正しい確率分布を一様分布とすると Y=c(1) dataList=list(Y=Y) modelString=' model{ Y ~ dbern(p6) p6=1/6*q+5/6*(1-q) q ~ dbeta(1,1) } ' でJAGSを走らせて Lower95 Median Upper95 Mean SD Mode MCerr p6 0.24522133917 0.600436 0.8333064 0.5731115 0.1781004 NA 0.001329018 を得て 平均 0.5731115 (3)6の目の出る確率が1/6を最頻値とする標準偏差0.1のβ分布に従うとすれば β分布のパラメータは a b 3.260234 12.301170 となるので 平均は0.2095077 >>456 すまん、 pの平均値じゃなくて p ~ f(p)のときのp/(p+1)の平均値 だな。 >>456 integral(x/(x+1)*(2/3x+2/3),0,1)=1/3 >>462 stanで検証 functions{ real jisaku_log(real y){ real temp; temp = 2/3.0*y+2/3.0; return log(temp); } } data{ } parameters{ real<lower=0,upper=1> p; } transformed parameters{ real q; q = p/(p+1); } model{ p ~ jisaku(); } mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat p 0.5626 0.0074 0.2836 0.0366 0.3364 0.5874 0.8107 0.9839 1464 1.0006 q 0.3364 0.0035 0.1325 0.0353 0.2517 0.3701 0.4477 0.4959 1418 1.0007 lp__ -2.0063 0.0336 0.9343 -4.5941 -2.2177 -1.6547 -1.4262 -1.3608 773 1.0030 >>460 どのアプローチでも6の目がでたというデータは 事後確率分布を6の目がでる方向に歪めるね。 >>461 von Neumann法で 2/3*x+2/3を密度関数とする[0,1]の乱数を発生させる。 Rのコードはこれ http://egg.2ch.net/test/read.cgi/hosp/1493809494/352 発生させた乱数pからp/(p+1)をつくってその分布を表示すると http://i.imgur.com/PFTeZ77.png 平均値1/3が確認できる。 >>460 (2)のアプローチをstanでやってみた。 data=list(Y=1) stanString=' data{ int Y; } parameters{ real<lower=0,upper=1> q; } transformed parameters{ real<lower=0,upper=1> p6; p6=1/6.0*q+5/6.0*(1-q); } model{ Y ~ bernoulli(p6); q ~ beta(1,1); } mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat q 0.3901 0.0030 0.2661 0.0157 0.1602 0.3512 0.5910 0.9289 7827 1.0003 p6 0.5733 0.0020 0.1774 0.2141 0.4393 0.5992 0.7265 0.8229 7827 1.0003 lp__ -2.6057 0.0103 0.8248 -4.9881 -2.8346 -2.2830 -2.0537 -1.9902 6400 1.0002 6の目のでる事後確率の平均値は 0.5733 でJAGSと同じ結果。 暇つぶしネタを与えてくれた>454に感謝 さいころ振ったら6が出ました つぎに6が出る確率はどうなる? 1 低くなる 連続で6が出る可能性はひくい 2 変わらない 6が出る確率は前に何が出たか影響を受けない 3 高くなる さいころがいかさまの可能性があるから #当然さいころがいかさまの可能性をかんがえるならば 6の出る可能性が1/6より小さいいかさまさいころで たまたま6がでた場合も含めるとする >>467 サイコロE1 = 6の目がでる確率は1/12 サイコロE2 = 6の目がでる確率は2/12 サイコロE3 = 6の目がでる確率は3/12 事前分布 P(E1) = P(E2) = P(E3) = 1/3 とまずは、勝手に設定し計算してみた 直感的怪答 1/6 単なる条件付確率ぢゃし、 事前分布はE1,E2,E3同じぢゃろ。 ぢゃから、 1/12、2/12、3/12 の単純平均で 2/12 約分すれば、1/6ぢゃ 模範解答 7/36 である。 1/12 , 2/12 , 3/12 の 1:2:3 の重み付き平均は7/36です。 ワタシの超怪答 1/6で良い 事前分布、P(E1) > P(E3) にすべきぢゃ ∵ 1/6ぢゃないのは、奇妙ぢゃ ちなみに、 P(E1) = P(E3) = 0、P(E2) = 1 ぢゃダメ イカサマぢゃなくても 1/6より微かにずれるものぢゃ >>467 6の目の出る確率がどの範囲ならイカサマでないとすんの? 6の出る可能性が1/6より小さいいかさまさいころ とすると (1) 6の目のでる確率の分布を一様分布とすると 6の目が一回でたから事後分布はbeta(2,1)なので次に6の目がでる期待値は2/3 p<1/6の確率は > pbeta(1/6,2,1) [1] 0.02777778 (2) 6の目の出る確率p6を1/6としてp6=1/6が正しい確率分布を一様分布とすると平均 0.5731115 p<1/16の確率は0 (3)6の目の出る確率が1/6を最頻値とする標準偏差0.1のβ分布に従うとすれば > pbeta(1/6,3.260234,12.301170) [1] 0.3785766 >>468 離散量で一様分布の真似なら サイコロE4 = 6の目がでる確率は4/12 ... サイコロE4 = 6の目がでる確率は12/12 も考えなくちゃだめだろ? >>469 直感的かつナナメな怪答 ちょっとでも1/6からずれてたら 数学的にイカサマぢゃ∴ サイコロの100%はイカサマぢゃ でも、しかし、試験なら、 6の目確率は、常に1/6で計算ぢゃ。 ナナメな模範解答 そっか、鋭い質問 ちょっとなら1/6からずれても 良いことにしないと、 サイコロの100%はイカサマになるか >>471 直感的かつナナメな怪答 そんなことより、6の確率が 事前分布の平均 ≧ 1/6 事後分布の平均 ≦ 1/6 となる事前分布どっかにないかな!? 誰かそんな事前分布で計算しないかな 模範解答擬き P(E4) = P(E5) = … = P(E12) = 0 にしないと計算が大変 (^_^;) >>466 自分で気付いたけどこのスクリプトは間違いだね。 >>472 死刑囚の話に戻るけど f(p) = (2/3)p + 2/3 という確率分布 って何の意味があるの? >>474 確率分布を事前分布とした理由は 今考え直したら支離滅裂な直感でした。 意味は、概ね何でもない。ので 気にしないで下さい。 あえて意味を言えば、 P(A=o|B=t) の平均が1/3となるような P(B=t|A=o) の確率分布というだけ 支離滅裂な内容ですが説明すると、 pが定数1/2とするなら、 P(A=o|B=t) = p/(p+1)より、 P(A=o|B=t) = 1/3 となる。 だから、 pの平均が1/2の確率変数なら、 P(A=o|B=t)の平均も1/3だろうと確信。 しかし、計算すると、 pの平均が1/2の連続一様分布なら、 P(A=o|B=t)の平均はln(2)=0.30685のようだ では、P(A=o|B=t)の平均が1/3となる pの分布はどんな分布なのか知りたくなる そう、 f(p=0) : f(p=1) = 1 : 2 な確率分布かな だから、 f(p) = (2/3)p + 2/3 という確率分布 を 事前分布とする。 まっ、今見直と、支離滅裂です。(^_^;) >>475 確率密度関数がa*x+bの形なら integral(x/(x+1)*(a*x+b),0,1)= a *(log(2) - 1/2) + b*(1- log(2)) = 1/3 を満たすときでしょうね。 >>467 あらゆる可能性考えて 具体的な数字をださなくてもいいなら @古今東西振られたサイコロのうちそれがいかさまであるという確率は相当ひくいとおもう Aいかさまである場合に 6の出る確率が6分の1超である場合と 6分の1以下である場合が打ち消しあうことになるが 6分の1以下である可能性はそんなにたかくないしだろうし、ふれ幅も小さいから 若干の打消しが生じるくらいだろう Bいかさまである場合に 6の出る確率が6分の1超であるときにおいては あからさまないかさまをしてる可能性はひくいので 1/6と1の間くらいの0.6前後くらいが期待値になるのではないかな 総合的に考えれば 6が出た後に6が出る確率は6分の1よりおおきくなるだろうが @の影響がかなりおおきくて ほとんど無視できるれレベルだとおもう ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.5 2024/06/08 Walang Kapalit ★ | Donguri System Team 5ちゃんねる