ベイズの統計学を学び始めたんだけど

**１３２人目の素数さん** · 2017/12/03(日) 00:52:27.23

信用に値するのか疑問です。
人工知能とかではなく日々の動機付けに利用する予定です

**１３２人目の素数さん** · 2017/12/25(月) 06:23:08.44

>>201
事前確率を一様分布にすると事後分布からの平均確率は6/7=0.8571429

http://i.imgur.com/pku1kPy.png

**１３２人目の素数さん** · 2017/12/25(月) 06:37:38.74

>>202
事後分布で1/3以下,2/3以上である確率は

> pbeta(1/3,1+5,1) + pbeta(2/3,1+5,1,lower=FALSE)

[1] 0.9135802

でイカサマコインといえる。

**１３２人目の素数さん** · 2017/12/25(月) 07:28:57.92

0.5lをモード値として1/3～2/3の間に95%が存在する5%のイカサマは許容するをβ分布Beta( 16.55299, 16.55299)を事前分布とすると

5回続けて表がでたときの事後分布は

http://i.imgur.com/v03Jv5Q.png

イカサマ確率は0.1031となる。

**１３２人目の素数さん** · 2017/12/25(月) 07:32:36.66

>>204
0.5lをモード値
↓
0.5をモード値

**１３２人目の素数さん** · 2017/12/25(月) 08:14:46.83

>>201

# 事前確率
# 表がでる確率が1/3のコイン　1/3
# 表がでる確率が1/2のコイン　1/3
# 表がでる確率が2/3のコイン　1/3
# と適当かつ勝手に変更

require(rjags)
N=5
z=5
y=c(rep(1,z),rep(0,N-z))
ph=c(1/3,1/2,2/3)
pc=c(1/3,1/3,1/3)
dataList5=list(N=N,y=y,ph=ph,pc=pc)
# JAGS model
modelString5 ="
model {
for(i in 1:N){
y[i] ~ dbern(ph[coin])
}
coin ~ dcat(pc[])
}
"
writeLines(modelString5,'TEMPmodel.txt')
jagsModel5=jags.model('TEMPmodel.txt',data=dataList5)
codaSamples5=coda.samples(jagsModel5,var=c('coin'),n.iter=100000,na.rm=TRUE)
summary(codaSamples5)
js5=as.matrix(codaSamples5)
mean(js5!=2)

5回続けて表がでたとき、
イカサマコインであった確率は
> mean(js5!=2)
[1] 0.81361

**１３２人目の素数さん** · 2017/12/25(月) 11:38:23.64

頻度主義統計の謎。

立方体からなるサイコロの目のでる確率はすべて等しく1/6である、を帰無仮説とする。

そのサイコロをふって1の目がでた。2回目は2の目がでた。
その確率は1/6*1/6で1/36=0.02778 < 0.05だから帰無仮説は棄却される。
どの目の組合せでも同じく帰無仮説は棄却される。

頻度主義統計のもとではすべてのサイコロはいびつである。

**１３２人目の素数さん** · 2017/12/25(月) 12:39:07.20

>>207
検定についてもう一度勉強した方がいい

**１３２人目の素数さん** · 2017/12/25(月) 12:49:30.52

>>208
p値で考えると>207は正しい。

**１３２人目の素数さん** · 2017/12/25(月) 12:51:59.61

全然デタラメ

**１３２人目の素数さん** · 2017/12/25(月) 13:06:33.35

>>210
デタラメというのがデタラメじゃねえの？
数値で反論できてないし。

**１３２人目の素数さん** · 2017/12/25(月) 13:16:30.22

帰無仮説を点推定とすると>195の理論が成立する。
現実は>204だと思っている。

数値をだしての反論希望。

**１３２人目の素数さん** · 2017/12/25(月) 13:25:55.54

>>212
だからその数値が無意味ですってw

**１３２人目の素数さん** · 2017/12/25(月) 13:26:28.67

頻度主義統計の謎
1000本に1本当りがでる宝くじに当たった人がいる
p=0.001<0.05だから偶然とは言えないから不正があった筈。

**１３２人目の素数さん** · 2017/12/25(月) 13:27:32.80

>>213
反論になってないんだよ。
数値だして反論できないんだろ？

**１３２人目の素数さん** · 2017/12/25(月) 13:30:06.79

>>215
君あおりもヘタね

**１３２人目の素数さん** · 2017/12/25(月) 13:33:42.68

>>216
馬鹿なので反論できないｗｗｗｗｗ

**１３２人目の素数さん** · 2017/12/25(月) 13:35:33.47

帰無仮説を分布に設定すればいいのに
頻度主義者にはそれができない、という批判なんだよ。

**１３２人目の素数さん** · 2017/12/25(月) 13:37:16.46

ゴルゴ13は100発100中
ゴルゴ14は10発10中
ゴルゴ15は1発1中
とする。
各々10000発撃ったとき各ゴルゴの命中数の期待値はいくらか？

ベイズでは事前確率分布を一様分布として計算できるが、
頻度主義統計では全く無力と気づいてベイズ統計を学び出したよ。

**１３２人目の素数さん** · 2017/12/25(月) 13:54:39.97

>>216
数値だして反論しないとバカと認定されちゃうよ。
>204書いたのは俺。

**１３２人目の素数さん** · 2017/12/25(月) 16:14:18.07

>>216
君、ごまかすのも下手ねｗ

**１３２人目の素数さん** · 2017/12/25(月) 17:17:16.68

■モンティホール問題（空箱とダイヤ）

このゲームができるのは1回だけです

ダイヤモンド1個を外からは中が見えない空箱100個の
中のどれかひとつに入れます

その中から1個の箱を選びます

98個の空箱を取り除きます

最後に残った2個の箱の中から1個の箱を選びます

ダイヤモンドが当たる確率は何％でしょうか？

**１３２人目の素数さん** · 2017/12/25(月) 17:51:07.79

>>220
数値以前の問題だけどな

**１３２人目の素数さん** · 2017/12/25(月) 18:34:08.36

>>223
敗北宣言？？

**１３２人目の素数さん** · 2017/12/25(月) 19:24:36.60

>>224
自分が間違ってるとは考えないの？

**１３２人目の素数さん** · 2017/12/25(月) 19:30:16.93

>>223,225
相手して欲しいだけの困ったちゃんだから触らないことよ

**１３２人目の素数さん** · 2017/12/25(月) 20:08:44.89

>>225
数学板なのに反論になってないんだね。

**１３２人目の素数さん** · 2017/12/25(月) 20:18:40.97

>>227
あなたが間違った知識を持っていてもどうでもいいことだけど
私は優しいから貴方の知識が間違っていると言うことを教えておく
無知を知ることが出来て良かったね

**１３２人目の素数さん** · 2017/12/25(月) 20:23:16.15

>>222
前提として
・100個中1個ダイヤ入りの箱がある（自分で入れる訳ではない＝第三者が入れる)
・自分が最初に選ぶ箱は便宜上「Ａ」と名付ける
・98個の空箱を取り除く作業は答えを知っている第三者が「A」以外の99個から選んで行い、
最後に残された箱は便宜上「B」と名付ける

とすれば
「A」の中にダイヤがある確率は1/100、「B」の中にダイヤがある確率は99/100
2択とはいえ、五分五分の2択ではないことに気づけるかどうか

**１３２人目の素数さん** · 2017/12/25(月) 20:50:34.25

>>229
ゲームが１回だけの時、

最初にプレイヤーがあたりを引く確率は1/100

はずれを引く確率も1/100になります

ゲームから98個の箱が除外された後に

残った2個の箱の内、選択変更後のあたりの確率が99%だと

証明する方法はゲームが１回に限定されている以上

存在しないのです

**１３２人目の素数さん** · 2017/12/25(月) 20:57:46.62

「A」の中にダイヤがある確率は1/100、「B」の中にダイヤがある確率も1/100です
五分五分の2択ですのでダイヤを当てる確率は５０％です

**１３２人目の素数さん** · 2017/12/25(月) 23:42:43.79

>>228
へへ、結局、反論できないだけだね。
カッコ悪い～。

**１３２人目の素数さん** · 2017/12/25(月) 23:51:56.81

>>232
間違いを指摘してやる義理はないからね

**１３２人目の素数さん** · 2017/12/25(月) 23:55:09.97

無力だと言われて反発してるだけ
まともな反論など期待できようはずがない

**１３２人目の素数さん** · 2017/12/26(火) 00:39:07.10

>>233
ホントそれ
かまってちゃんにかまってやることはない

**１３２人目の素数さん** · 2017/12/26(火) 00:40:19.96

>>229
■ゲームを１回に限定すると

１．最初プレーヤーがあたりを引く確率は1/2である

２．箱を変更しない場合はそのまま1/2の確率である
　　（変更しないのであれば空箱が取り除かれようが残ろうが確率は変わらない）

３．98個の空箱を取り除いた後に箱を変更する場合、
　　最初に選択した箱がハズレであれば変更後の箱はあたりが確定である
　　つまり、最初に選択した箱がはずれである確率＝箱を変更した場合に
　　あたりを引く確率である

４．最初の選択であたりを引く確率は1/2、はずれを引く確率も1/2である

５．ゆえに、どちらの箱を選択してもあたりを引く確率は1/2である

**１３２人目の素数さん** · 2017/12/26(火) 01:00:16.29

ゲームは1回に限定されているので
事前確率と事後確率は一致します

**１３２人目の素数さん** · 2017/12/26(火) 05:24:17.34

>>233
間違ってないから指摘できないだけだろ。
カッコ悪い～。

コインが５回続けて表がでたら0.5^5 <0.05なのでイカサマコイン
とするなら
1/6^<0.05ならいびつなサイコロ。
点推定を帰無仮設にせず>204のように分布を事前確率にする方がいい。

**１３２人目の素数さん** · 2017/12/26(火) 06:39:56.34

あまりにも当たり前すぎることを見落としている。
単に試行回数が少ないだけ。

二項分布を正規分布で近似するための条件は経験則として
・npとnqの小さい方が10(場合によっては5)より大きい。
・0.1≦p≦0.9　で、かつ　5<npq
・25<npq
等が知られている。コイン(p=1/2)なら20～100回、サイコロ(p=1/6)なら30～180回　
といずれでも数十回試行することが必要。
逆に言うと、これらから大きく離れた回数で、何らかの結論を出すような理論は危険。信憑性が足りない。

参考　http://www.naro.affrc.go.jp/org/nfri/yakudachi/sampling/pdf/logical-sample-number.pdf

**１３２人目の素数さん** · 2017/12/26(火) 07:13:31.29

＞何らかの結論を出すような理論は危険

ｔ分布すら知らんのか！

**１３２人目の素数さん** · 2017/12/26(火) 08:16:20.70

>>239
二項分布も知らないレス古事記は放置が一番よ

**１３２人目の素数さん** · 2017/12/26(火) 09:13:34.13

>>240
整理しよう。
あるサイコロ、あるいは、コインがあり、その１の目が出る確率、あるいは、表が出る確率が
1/6、1/2としてよいかを検定しようとしている。
その検定に必要な試行回数は239で示したような回数が必要であり、>>207で行ったような
たった2回の試行では足りない、というのが239の内容だ。

そこに、t分布がどのように現れるのか？
t分布は、体重、身長、点数、．．．等という、正規分布の確率変数に出来るデータを直接
いくつか得て、それを元に、想定していた分布と差があるかどうかを検証する。
その「いくつか」の個数がデータの数だとか、自由度の直結するものだ。

しかし、239で与えた試行回数というものは、全く異なる。
正規分布の確率変数に直結する一つのデータを得るために必要な試行回数だ。
239の回数だけ、試行を行い、はじめて、t分布で言うところの、「１つのデータ」を得ることが出来る。

あなたは、次元の異なる内容を比較して反論したつもりでいるだけ。

**１３２人目の素数さん** · 2017/12/26(火) 12:12:04.68

>>239

試行数が少なくても計算できるのがベイズ統計。

サイコロのある目のでる確率が1/8以下か1/4以上であるときを歪（いびつ）なサイコロと定義する。
事前分布としてどの目のでる確率も1/6で、ディリクレ分布（集中度母数=1）に従うとして
１の目が2回続いたときの１の目のでる事後確率分布をJAGSで計算してグラフ化すると次のようになる。
95%信頼区間に歪でない場合の確率1/8～1/4が含まれるので歪とは判断されない。
http://i.imgur.com/WJJwIWK.png

1の目が5回続いたときの事後確率分布は
https://i.imgur.com/G9lpd0u.png
これは95％信頼区間の下限が1/4を超えているから歪であると判断される。

**１３２人目の素数さん** · 2017/12/26(火) 12:16:52.98

>>239
正規分布で近似する必要はどこにもない。

**１３２人目の素数さん** · 2017/12/26(火) 12:21:29.57

>>239

あんたには>219の問題は解けないだろ？

信頼区間は広くなるが、結論は出せる。

**１３２人目の素数さん** · 2017/12/26(火) 13:02:42.03

>>245
信仰心を持てば解けるのです！！

**１３２人目の素数さん** · 2017/12/26(火) 13:10:49.28

>>239
https://www.youtube.com/watch?v=YyohWpjl6KU

の12:41から　ベイズ推計で1打数1安打と2打数0安打の打率が推定されている。

他の選手のデーターから事前分布を設定しての算出。

データが少ないと信頼区間が広くなるだけで算出はできる。

**１３２人目の素数さん** · 2017/12/26(火) 14:45:43.43

>>246
事前分布を信仰すれば解ける

**１３２人目の素数さん** · 2017/12/26(火) 15:55:16.98

＞そのサイコロをふって1の目がでた。2回目は2の目がでた。

これを題材にしてベイズ推計する。

事前分布としてどの目のでる確率も1/6で、ディリクレ分布（集中度母数=1）に従うとして
事後確率のおのおのの目の分布を図示すると。
http://i.imgur.com/yTUhYkq.png
という風になる。
95%HDI(Highest Intensity Interval)がどの目でも
1/8～1/4を含むから、
どの目に関しても歪とは結論されない。

別の試行で計算してみる。
18回サイコロを投げて1の目が10回、2の目が8回でたときの
事後分布は
http://i.imgur.com/2RlV9g3.png
２の目以外は非歪コイン域（Range of Practical Equivalence: ROPE)と
95%HDIが重ならないので、２以外の目は歪と結論できる。

標本数が少ないとHDIが広くなるだけ。
正規分布近似など全く必要なし。

**１３２人目の素数さん** · 2017/12/26(火) 16:14:54.26

以上の議論で、

少数例でも結論はだせる。

とうぜん信用区間は広くなる、信憑性が低くなっていることは区間幅で数値化されているのだから問題なし。

どこにもｐ値との比較はでてこない。強いて言うなら９５％HDIの５％が危険率に匹敵するくらい。

**１３２人目の素数さん** · 2017/12/26(火) 20:08:52.62

ほぼ一直線の分布曲線が、ベイズ更新により、なだらかなピークを持つ曲線に変化したのを見て、
「ほら、この辺に平均値があるはず」等と、喜んでいるだけ。
頻度主義はいわば、鋭いピークを持つ分布曲線になるまで、じっと結論を待つことにアナロジーできる。

>>少数例でも結論はだせる。
>>とうぜん信用区間は広くなる、信憑性が低くなっていることは区間幅で数値化されているのだから問題なし。

「サンプル数が少ないと、信憑性が低くなる」
ということを
「サンプル数が少ないと、信憑性が低くなるが、それを数値化しているから問題ない」
と強弁しているだけだね。
つまり、「少数例でも結論はだせる」ではなく、「だせたつもりでいる」だけ。

一定の信用度を持つまで結論を先送りするか、信用度を犠牲にして結論をだすかの違い。

**１３２人目の素数さん** · 2017/12/26(火) 21:38:58.06

>>251
事前分布をもとに結論が出せてるじゃん。
コインの例なら一様分布を選ぶか一か八かのbeta(0.5,0.5)にするから弱情報分布のbeta(2,2)を選ぶかが、主観的と呼ばれるだけ。
ベイズの確率はcredibility信憑性なのだから、何の問題もない。

正規分布近似の必要は全くないので近似できる標本数が必要という議論は誤りだね。

**１３２人目の素数さん** · 2017/12/26(火) 21:42:17.50

>>251
事前分布をもとに結論が出せてるじゃん。

コインの例なら一様分布を選ぶか、一か八かのbeta(0.5,0.5)にするか、弱情報分布のbeta(2,2)を選ぶかが、主観的と呼ばれるだけ。
ベイズの確率はcredibility信憑性なのだから、何の問題もない。

正規分布近似の必要は全くないので近似できる標本数が必要という議論は誤りだね。

**１３２人目の素数さん** · 2017/12/26(火) 21:51:31.77

>>251
じゃあ、>219の各ゴルゴの期待値とその信頼区間を
頻度主義統計で答えてみ！
100発100中ならサンプル数として十分だろ。
ゴルゴ13とゴルゴ14の命中率はどちら上か検定してみ！
サンプル数不足なら1000発1000中のゴルゴ12とのゴルゴ13との比較でもいいぞ。
頻度主義統計でp値出してみ。

**１３２人目の素数さん** · 2017/12/26(火) 21:57:12.23

>>251
直線の一様分布にも平均値あるんだが、頭が腐ってない？

**１３２人目の素数さん** · 2017/12/26(火) 22:55:59.71

ゴルゴ13
ゴルゴ14
ゴルゴ15は

全員同じ能力で各々10000発撃ったときの命中率は10000発10000中のみ

**１３２人目の素数さん** · 2017/12/27(水) 00:14:11.16

命中率がp未満とする。
n発撃って、全発命中する確率はp^n未満となるが、これがたまたま発生したと考えると、
p^n<0.05　や　p^n　<　0.01　という式が立てられる。
これが、ゴルゴにより達成されたと考え、この結果の否定が採用される。

例えば、n=1000　で　危険率0.05を採用すると、　p<0.997009　からp≧0.997009
例えば、n=1000　で　危険率0.01を採用すると、　p<0.995405　からp≧0.995405
例えば、n=100　で　危険率0.05を採用すると、　p<0.970487　からp≧0.970487
例えば、n=100　で　危険率0.01を採用すると、　p<0.954993　からp≧0.954993
例えば、n=10　で　危険率0.05を採用すると、　p<0.741134　からp≧0.741134
例えば、n=10　で　危険率0.01を採用すると、　p<0.630957　からp≧0.630957
例えば、n=1　で　危険率0.05を採用すると、　p<0.05　からp≧0.05
例えば、n=1　で　危険率0.01を採用すると、　p<0.01　からp≧0.01
あくまで、命中率の下限を評価しただけなので、実際の命中率は、1とそれぞれの間のどこかにある。

危険率5%で、
1000発1000中　→　10000中　9970発～10000発　平均　9985
100 発100 中　→　10000中　9705発～10000発　平均　9852
10　発10　中　→　10000中　7411発～10000発　平均　8705
1　発1 　中　→　10000中　 500発～10000発　平均　5250

**１３２人目の素数さん** · 2017/12/27(水) 06:31:31.84

>>257
対称でない確率分布から期待値だすのに片側検定での境界値と
上限値を足して２で割るかよ？

期待値は原点周りの一次モーメントだぞ。
ベイズでの期待値を教えてあげよう。
命中率の事前分布を一様分布にするとｎ発ｎ中のゴルゴの命中期待値は(n+1)/(n+2)になる。

**１３２人目の素数さん** · 2017/12/27(水) 07:15:29.14

>>258

そして　事後確率の９５％信頼区間は　０．０５の(n+1）乗根から１になる。

**１３２人目の素数さん** · 2017/12/27(水) 07:18:48.33

>>258
>命中率の事前分布を一様分布にすると
正規分布なら？

**１３２人目の素数さん** · 2017/12/27(水) 07:43:22.18

>>257
もとのデータが変わらないのに危険率を変えるとオマエのいう平均値が変わるのは変だと思わんのかよ？

まさに主観的ｗｗｗｗ

オマエの「平均値」計算式でn=100のときの「平均値」がどう変動するかグラフにしてやったぞ。

http://i.imgur.com/6OIUvas.png

**１３２人目の素数さん** · 2017/12/27(水) 07:46:39.94

>>260
正規分布は－∞から＋∞までとるから、正規分布の仮定は最初から間違いだよ。

定義域が０～１のβ分布を使うほうがよい。

一様分布もβ分布の特殊型なのはベイズ統計の常識。

**１３２人目の素数さん** · 2017/12/27(水) 07:51:42.33

>>260
正規分布を事前分布にするとして

平均と分散はどう主観的に設定すんのよ？

スナイパーなのだから、命中率の平気値は5割以上だろとか、いやプロなんだらゴルゴ１３は9割以上でゴルゴ１５はまぐれだから5割未満じゃないの？

おのおのの分散はどう設定する？

こういう議論をしなくていいのが、一様分布ではある。

まあ、生まれる男の生まれる確率が一様分布というのは事前分布としては俺も不適切だと思う。

**１３２人目の素数さん** · 2017/12/27(水) 08:05:14.37

>>256
fisher.testやカイ二乗検定だとそういう結論になるだろね。

**１３２人目の素数さん** · 2017/12/27(水) 08:23:03.86

有意水準（危険率）を変えれば推定区間幅が変わるのは頻度主義でもベイズでも同様。
だが、危険率を変えたら推定平均値（期待値）も変わるという
>527の議論は頻度主義でも落第。

**１３２人目の素数さん** · 2017/12/27(水) 15:03:00.79

>>265
>257のアンカーミス。
データの変化はないのに。
平均値（期待値）の算出が検者の主観（危険率）で決まるはずはないね。

**１３２人目の素数さん** · 2017/12/27(水) 16:16:26.53

>>257
対称でない確率分布から期待値だすのに片側検定での境界値と
上限値を足して２で割るかよ？

反論を待っているぞ。

**１３２人目の素数さん** · 2017/12/27(水) 16:19:59.78

>>260
>正規分布なら？
の要望に応じてstanでやってみた。

n=100のケース

一様分布の平均と同じく事前正規分布の平均は0.5とする。
標準偏差はGelman *1)に準じてHalf-Cauchyでやってみる。

*1)https://projecteuclid.org/download/pdf_1/euclid.ba/1340371048
(逆ガンマ分布は母数の影響を受けすぎなので弱情報分布に向かないという趣旨の論文)

平均0.5 標準偏差は半コーシー分布
mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat
p 0.9899 0.0002 0.0100 0.9628 0.9860 0.9929 0.9972 0.9997 2394 1.0005
sigma 3.3759 0.3620 12.2452 0.2954 0.7799 1.5483 3.3236 14.7428 1144 1.0016

平均0.5 標準偏差は[0,10]の一様分布（確率変数の標準偏差として明らかに過剰)
mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat
p 0.9901 0.0001 0.0096 0.9642 0.9861 0.9930 0.9971 0.9997 6746 1.0005
sigma 3.0639 0.0467 2.6177 0.3145 0.9298 2.1411 4.6519 9.2510 3146 1.0009

WinBUGSで推奨の逆ガンマ分布を標準偏差の事前分布にしてみると
mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat
p 0.9901 0.0002 0.0098 0.9640 0.9864 0.9931 0.9971 0.9998 1780 1.0008
sigma 3.7042 0.8736 28.9458 0.2199 0.4260 0.7150 1.5033 17.5846 1098 1.0013

最初から一様分布にしたときと大差なし。
mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat
p 0.9902 0.0001 0.0097 0.9648 0.9863 0.9933 0.9972 0.9997 7377 1.0002

**１３２人目の素数さん** · 2017/12/27(水) 17:18:30.60

ベイズ統計でゴルゴ１３（百発百中）とゴルゴ１４（十発十中）の命中率の差の分布も計算できる。

http://i.imgur.com/fGDobGW.png

平均、最頻値、中央値は以下の通り
mean 　　　　　　　 median 　　　　　 mode
0.07288324 　　　0.05019718 　　　0.01531325

９５％信用区間の中心が平均値になるのではないのは明らか。

**１３２人目の素数さん** · 2017/12/27(水) 20:44:43.55

大数の法則は裏を返せば
「サンプルサイズが小さい方が、より極端な値をとる確率が高い」
ということでもある
この性質によって差が出ただけのものに対しても、
人はそれが偶然によるものではなく、何か意味があると錯覚してしまいやすい

**１３２人目の素数さん** · 2017/12/27(水) 21:19:43.00

信仰心をふりかざすキティ害のスレ

数学板なのに

**１３２人目の素数さん** · 2017/12/27(水) 21:59:36.93

議論をする相手には、いくつか条件が必要です。そうでなければ、まともな議論になりません。
詳しく述べることは控えますが、私はあなたとは議論しません。
これを最後に去りますが、一点補足します。

>>257の方法において、危険度を少しゆるめの値、0.1353(=1/e^2)を採用すると、
ベイズの結論に漸近的に一致する結果を得ます。（n→∞で一致します。）
あなたが棄て、いちゃもんをつけている方法から、あなたが信仰するのと同じ結論が出てきます。
ではさよなら。

**１３２人目の素数さん** · 2017/12/27(水) 22:06:27.29

「偶数が表に書かれたカードの裏は赤色である」という
仮説を検証するにはどのカードをひっくり返すべきか？
https://ds055uzetaobb.cloudfront.net/image_optimizer/315d3d3cdc153302a1892adb9216e9f0570abbeb.png

赤色のカードをひっくり返したくなるのが『確証バイアス』

**１３２人目の素数さん** · 2017/12/28(木) 02:23:56.05

捨て台詞を残して敗走宣言、カッコ悪いね。
危険率つきでの平均値の次は勝手にnを増やすかよ。

>257の平均値の計算式はこれだろ
> a=0.05
> n=c(1,10,100,1000)
> 5000*(a^(1/n)+1)
[1] 5250.000 8705.672 9852.435 9985.044

**１３２人目の素数さん** · 2017/12/28(木) 02:45:01.21

撃つ前の命中率の事前分布を一様分布として
事後確率はベータ分布B(n+1,1)の期待値だから
期待値は(n+1)/(n+2)
10000発打ったときは
> n=c(1,10,100,1000)
> 10000*(n+1)/(n+2)
[1] 6666.667 9166.667 9901.961 9990.020
n→∞にする意味はない。
n発n中のときの期待値を計算しろという問題なのだから。

**１３２人目の素数さん** · 2017/12/28(木) 03:06:11.65

ベイズでG13（百発百中）とG14（十発十中）の命中率の差の分布も計算できる。
http://i.imgur.com/fGDobGW.png

命中率の差の平均が7.3%
95%信用区間は-2.4%～24%と0を跨ぐので命中率に有意差はないと表現できる。
G14の方が命中率が高い可能性も9.4%あることも計算できる。

少数例から決断を迫られるときの指標にはなる。

**１３２人目の素数さん** · 2017/12/28(木) 03:16:06.97

>>271
数学では信仰は公理と呼ばれる。

論理学でこれを公理とする宗派もある。

(A1) φ→(ψ→φ)
(A2) (φ→(ψ→χ))→((φ→ψ)→(φ→χ))
(A3) (¬φ→¬ψ)→(ψ→φ)

**１３２人目の素数さん** · 2017/12/28(木) 05:02:28.77

>>277
>数学では信仰は公理と呼ばれる。
ベイズ統計では公理というよりはむしろやはり信仰と呼ぶ方がしっくり来るな

**１３２人目の素数さん** · 2017/12/28(木) 05:14:18.71

>>278
ベイズでの確率は信憑性を表す数値、自身の確信度や他人への説得力の指標。

事前分布は信仰。

無情報分布や弱情報分布の方が信者が集めやすい。

**１３２人目の素数さん** · 2017/12/28(木) 09:15:30.25

ベイズの統計は、モピロン数学ぢゃ。
事前分布は公理ぢゃない。かつ
事前分布は信仰なんかぢゃない。つまり、
事前分布は大概、主観なのぢゃ。
まぁっ、精密には、動物的直感なのぢゃ。
ベイズぢゃない統計こそ、迷信なのぢゃ。

**１３２人目の素数さん** · 2017/12/28(木) 13:44:38.04

落ちこぼれは馬鹿を認めたくなく信仰と言いたがる

**１３２人目の素数さん** · 2017/12/28(木) 14:43:21.82

>247
少数例でベイズで遊んでみた。

打者A：1打数1安打、打者B:2打数0安打とするとき打者Aの方が打率が高いといえるか？

打者の打率は一様分布に従うとする（平均5割なので現実離れである）。
打率の差を描くと
http://i.imgur.com/8Ry5CIn.png
95％HDIが０を跨ぐので有意差があるとは判断できない。

https://www.youtube.com/watch?v=YyohWpjl6KU
1打数1安打と2打数0安打の記録は投手が打者になったときの記録のようなので
Beta(0.1,0.5)を事前分布に設定して(打率.167相当)、打率の差の事後分布を描くと
http://i.imgur.com/kMTGO7m.png
95％HDI下限が0を越えているのでAの方が打率が高いと結論できる。

事前分布という信仰によって判断が変わる。

**１３２人目の素数さん** · 2017/12/28(木) 19:26:45.19

打率の期待値(平均)を1/6,標準偏差を0.05となるβ分布、Beta(9.09 45.46)でやってみる。

http://i.imgur.com/3ZF9sa5.png

となって有意差なし。こういう遊びができるのもベイズの魅力だね。

**１３２人目の素数さん** · 2017/12/28(木) 19:29:15.37

ベイズの事前分布は信仰、頻度主義のp<0.05も信仰。

ベイズの方が提供してくれる情報が多い、というのが俺の感想。

異論は認める。

**１３２人目の素数さん** · 2017/12/28(木) 19:34:36.49

事前分布を決めてしまえば
まだ一発も撃ったことのない0発0中のゴルゴ16の命中期待値
のような、データ数が少ないどころか0個の場合でも算出・結論できる

**１３２人目の素数さん** · 2017/12/28(木) 20:29:50.46

「まだ弾を撃ってない」は、
「2発撃って1発、命中」みたいなものか。

**１３２人目の素数さん** · 2017/12/28(木) 20:49:30.00

■大数の法則が成立しないケース

大数の法則は期待値の存在を前提としている
そのため、期待値の存在しない場合に大数の法則を適用する
ことは適切ではない

つまり、「サイコロを１回投げて1の目の出る確率」は、
観測不可能なのである

**１３２人目の素数さん** · 2017/12/29(金) 06:05:40.91

一様分布は
principleof insufficient reason(理由不十分の原則)
に準拠。

**１３２人目の素数さん** · 2017/12/29(金) 15:07:00.03

もとの問題(>207)をベイズの手法で検討する。

サイコロを振って１の目が何回続いたら９９％の確率でイカサマといえるかを考えてみる。
どの目のでる確率も1/9～1/3であるなら許容範囲としてイカサマとは見做さない、とする。

各々の目のででる確率は集中度母数＝１のディリクレ分布に従うとして
グラフ化(stanでサンプリング)すると

http://i.imgur.com/zAw3jud.png

９回続くと１の目がでる確率の９９％Highest Density Intervalが許容範囲と重ならないので９回と計算できた。

**１３２人目の素数さん** · 2017/12/29(金) 16:46:40.76

>>289
1の目が最初から9回でた場合と
全部の目が1000回でた後1の目が9回でた場合と
同じ結果？

**１３２人目の素数さん** · 2017/12/29(金) 18:03:29.80

>>290
最初から１の目が続いたときのシミュレーション。

**１３２人目の素数さん** · 2017/12/29(金) 18:16:14.78

>>291
本当に9回も連続しないといけない？

**１３２人目の素数さん** · 2017/12/29(金) 18:35:31.87

>>291
他の目の出かたも考慮が必要だよな

**１３２人目の素数さん** · 2017/12/29(金) 19:04:11.62

>>292
95%の信頼性でよければ7回になる。

**１３２人目の素数さん** · 2017/12/29(金) 19:08:14.72

サイコロで1が2.57回連続の
確率は、0.01ぢゃ

∵　1/6^2.57 = 0.01

つまり
1が3回連続で、有意にイカサマぢゃ

信頼度は0.99ぢゃ、

若干トンデモ論ぢゃから参考程度ぢゃ

**１３２人目の素数さん** · 2017/12/29(金) 19:34:05.22

1が確率1で他の目が確率0の場合と
1が確率3/8で他の目が確率5/8の場合と
同じ？

**１３２人目の素数さん** · 2017/12/29(金) 19:38:38.68

>>293

１～６の目がそれぞれ60,50,40,30,20,10回でたときの
各々の目がでる確率の分布は
次のようになる。　95%信頼区間が6の目が許容範囲と重ならないのでイカサマサイコロという判断になる。

http://i.imgur.com/kNFi9OM.png

**１３２人目の素数さん** · 2017/12/29(金) 19:39:03.29

296は
イカサマの程度のこと

**１３２人目の素数さん** · 2017/12/29(金) 19:46:59.72

>>298
事前分布をパラメータがc(1,1,1,1,1,1)のディリクレ分布にしての計算。

**１３２人目の素数さん** · 2017/12/29(金) 19:49:03.98

>>295
ではサイコロの1,3,5の順に出たら(1/6)^3=0.00463なのでイカサマ？？？

**１３２人目の素数さん** · 2017/12/29(金) 19:52:26.44

>>295
ではサイコロの目が1,3,5の順に出たら(1/6)^3=0.00463なのでイカサマ？？？