ベイズの統計学を学び始めたんだけど

**１３２人目の素数さん** · 2018/01/28(日) 10:28:36.16

《平均寿命のワシの超確率Kサン論》

例えば、寿命の西暦3001年の統計が
極めて簡単かつ仮に
　　P(0才→20才 | 2980年生) = 0.01
　　P(20才→40才 | 2960年生) = 1
　　P(40才→60才 | 2940年生) = 1
　　P(60才→80才 | 2920年生) = 1
　　P(80才→100才 | 2900年生) =0.99
　　‎P(100才→120才 | 2880年生) = 0.0
としよう。

西暦3001年平均寿命は、ワシのKサン論なら
0.01*(0+20)/2 + 0.99*(80+100)/2 = 89.2才

尚、2980年生れの子は、
20才まで生きる確率は、0.99
40才まで生きる確率は、0.99^2
60才まで生きる確率は、0.99^3
…
138才まで生きる確率は、0.99^69 = 0.5
なのぢゃ。
ぢゃ～また。

**１３２人目の素数さん** · 2018/04/02(月) 11:30:20.85

高齢化すなあ

**１３２人目の素数さん** · 2018/04/04(水) 06:47:19.33

ベイズとはたぶん無関係だが話題提供。

壺の中に n 種類の異なるクーポンが入っている。1回の試行で壺の中から1枚クーポンを引き、引いたものと同じ種類のクーポンを壺の中に戻すものとする。
n 種類（全種類）のクーポンを集めようとしたとき、 t 回以上の試行回数が必要となる確率はいくつだろうか?

**１３２人目の素数さん** · 2018/04/04(水) 07:38:38.43

>>581
P(t)=1 for t≦n

**１３２人目の素数さん** · 2018/04/04(水) 19:52:26.47

むずい・・・壺とかコインをイメージしただけで拒絶反応が出る

￥ ◆2VB8wsVUoo · 2018/04/07(土) 06:57:05.95

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 06:57:26.54

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 06:57:46.69

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 06:58:06.02

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 06:58:28.48

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 06:58:49.23

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 06:59:11.04

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 06:59:34.93

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 07:00:00.84

￥

￥ ◆2VB8wsVUoo · 2018/04/07(土) 07:00:21.79

￥

**１３２人目の素数さん** · 2018/04/11(水) 17:49:10.70

帰納法から導けるのは仮説のみ(´・ω・`)

**１３２人目の素数さん** · 2018/04/11(水) 19:42:39.37

母数が分布する楽しさそして悦び

**１３２人目の素数さん** · 2018/04/12(木) 15:56:27.16

〔参考書〕

H．C．von Baeyer 「QB ism - 量子×ベイズ」森北出版 (2018/Mar)
　256p．3024円　松浦俊輔 (訳)、　木村元 (解説)
　量子情報時代の新解釈
　http://www.morikita.co.jp/books/book/3166

**１３２人目の素数さん** · 2018/04/14(土) 01:19:44.45

数学の信憑性・信頼性を議論できるのが楽しいところ

**１３２人目の素数さん** · 2018/04/14(土) 08:59:37.39

帰無仮説が正しいときに棄却する確率Pr(Reject | H0)が第一種の過誤。
棄却された帰無仮説が正しい確率Pr(H0 | Reject)をFalse Positive Report Probabilityと呼ぶらしい。

条件付き確率で条件入れ替えってベイズぽいよね。

**１３２人目の素数さん** · 2018/04/14(土) 09:40:43.31

P(H0|Reject)=P(Reject|H0)P(H0)/P(Reject)

=P(Reject|H0)P(H0) / { P(Reject|H0)P(H0) + P(Reject|H1)P(H1) }

第一の過誤=α 第二種の過誤βとすると

P(H0|Reject)= αP(H0)/{αP(H0) + (1-β)(1-P(H0))}

でP(H0)を事前確率に想定しなければ算出できないな。

**１３２人目の素数さん** · 2018/04/14(土) 11:06:50.62

αちいさくすればβでかなんねん

**１３２人目の素数さん** · 2018/04/14(土) 19:31:00.84

７００

**１３２人目の素数さん** · 2018/04/15(日) 20:28:04.88

>>600

FPRPを0.05に固定して、グラフにしてみた。

http://i.imgur.com/JeQl6bs.png

**１３２人目の素数さん** · 2018/04/16(月) 08:31:54.88

FPRP　=　Pr(H0|y)

　　　　　＝　BF*PO/(BF*PO+1)　　　　

（ BF = Pr(ｙ｜H0)/Pr(y | H1) : Bayes factor　, PO = π0/(1-π0) 帰無仮説のオッズ)

￥ ◆2VB8wsVUoo · 2018/05/08(火) 12:31:18.68

￥

￥ ◆2VB8wsVUoo · 2018/05/08(火) 12:31:37.61

￥

￥ ◆2VB8wsVUoo · 2018/05/08(火) 12:31:56.42

￥

￥ ◆2VB8wsVUoo · 2018/05/08(火) 12:32:16.30

￥

￥ ◆2VB8wsVUoo · 2018/05/08(火) 12:32:37.90

￥

￥ ◆2VB8wsVUoo · 2018/05/08(火) 12:32:57.95

￥

￥ ◆2VB8wsVUoo · 2018/05/08(火) 12:33:21.88

￥

￥ ◆2VB8wsVUoo · 2018/05/08(火) 12:33:42.88

￥

￥ ◆2VB8wsVUoo · 2018/05/08(火) 12:34:04.22

￥

￥ ◆2VB8wsVUoo · 2018/05/08(火) 12:34:27.68

￥

**１３２人目の素数さん** · 2018/05/08(火) 16:18:13.67

学び終わったの？

**１３２人目の素数さん** · 2018/05/08(火) 17:10:30.94

モデル建てるの下手糞なんで

**１３２人目の素数さん** · 2018/05/11(金) 20:19:21.07

「ビールには水が入っている」

「ウィスキーにも水が入っている」

「ブランデーにも水が入っている」

よって「水を飲むと酔っ払う」(・∀・)

**１３２人目の素数さん** · 2018/05/11(金) 23:29:48.34

>>616
水が重回帰で選択されなかったら
いいのかな？
選択されたら介入で因果関係を証明するしかないのかな？

**１３２人目の素数さん** · 2018/05/25(金) 01:19:23.20

統計学は他の板へ。
数学とは何も関係ないから。

**１３２人目の素数さん** · 2018/05/25(金) 09:11:41.15

>>618
統計学は数学と無関係というのが帰無仮説かな。

**１３２人目の素数さん** · 2018/05/30(水) 06:22:50.55

薬剤ｙを1人ずつ投与して効果判定したら、3人めで効果が確認できた。
薬剤ｇを9人同時に投与したら3人に効果があった。
どちらの有効性が高いか？

別バージョン（こっちがオリジナルｗ）

ゆるゆる女子大生に1人ずつメールで誘ったら3人めが開脚。、
がばがば女子大生9人に一斉にメールを送ったら3人が開脚。
どっちが開脚が容易か？

開脚率の期待値を計算してみた。

ゆるゆる女子大生の開脚率期待値：ｒ人目で初めて開脚
r=3
Ex.yuru <- function(r){
integrate(function(x)x*(1-x)^(r-1)*x,0,1)$value/integrate(function(x)(1-x)^(r-1)*x,0,1)$value
}
Ex.yuru(r)
2/(r+2)

がばがば女子大生の開脚率期待値：N人中ｚ人開脚
N=9
z=3
Ex.gaba <- function(N,z){
integrate(function(x) x*choose(N,z)*x^z*(1-x)^(N-z),0,1)$value/integrate(function(x)choose(N,z)*x^z*(1-x)^(N-z),0,1)$value
}
Ex.gaba(9,3)
(z+1)/(N+2)

**１３２人目の素数さん** · 2018/05/30(水) 09:56:02.97

＞統計学は他の板

統計学板なんてのもあるのか？

**１３２人目の素数さん** · 2018/05/30(水) 14:55:21.09

俺は測度論から地道にアプローチしてるから・・・

**１３２人目の素数さん** · 2018/05/31(木) 09:00:57.49

オークションでの出品者の評価が
出品者A　良い９人　悪い１人
出品者B　良い４人　悪い０人
であったとするとどちらが評価の高い出品者と言えるか？

**１３２人目の素数さん** · 2018/05/31(木) 22:44:09.75

>>618
「何も」ってのは流石に言い過ぎかな

**１３２人目の素数さん** · 2018/06/06(水) 23:14:01.56

よく確率で、英語だと、
such thatって出てきますけど、
どういう意味ですか？

～みたいな、で解釈してもいい？

**１３２人目の素数さん** · 2018/06/06(水) 23:14:39.29

>>620
ex.gaba ex.yuru にはやられました。

**１３２人目の素数さん** · 2018/06/07(木) 01:22:19.55

>>625
なんとなれば

**１３２人目の素数さん** · 2018/06/07(木) 06:42:15.63

>>626
読んでくれた人がいたのは嬉しいね。

**１３２人目の素数さん** · 2018/06/07(木) 10:44:04.94

クソ寒いのに気づけよｗ

**１３２人目の素数さん** · 2018/06/09(土) 16:49:23.29

>>625
～であるような

**１３２人目の素数さん** · 2018/06/09(土) 19:06:29.75

>>625
例文を出してもらった方が答やすい。

**１３２人目の素数さん** · 2018/06/10(日) 14:13:13.00

>>618
＞　統計学は他の板へ。
＞　数学とは何も関係ないから。

禿同
統計学板を作って隔離して欲しいよね。
理論統計とか気持ち悪くて吐きそう

**１３２人目の素数さん** · 2018/06/10(日) 14:25:33.92

予備校の持ってる偏差値ピッグデータの方が噴飯モノの欧米のデータサイエンティスト笑わせだろ

**１３２人目の素数さん** · 2018/06/10(日) 19:39:18.24

なんかのポーズか？たっぷり吐いとけよ

**１３２人目の素数さん** · 2018/06/10(日) 20:25:28.52

>>633
どゆこと？

**１３２人目の素数さん** · 2018/06/10(日) 21:07:13.18

>>632
GOOGLEで
統計学で検索すると約 40,000,000 件
統計学　数学で検索すると約14,700,000 件
統計学　物理学で検索すると約 6,310,000 件
数学と物理学で統計学との関係の強さに差はない、を帰無仮説にする。
χ二乗検定でX-squared = 4543700でp.value < 2.2e-16
で帰無仮説は棄却された。

**１３２人目の素数さん** · 2018/06/11(月) 11:26:29.75

落ちこぼれの相手は無駄

**１３２人目の素数さん** · 2018/06/11(月) 19:20:38.06

予備校の模試での合否判定ってロジスティク回帰でやってのかな

**１３２人目の素数さん** · 2018/06/11(月) 19:52:10.85

事前分布はおみくじで決める

**１３２人目の素数さん** · 2018/06/12(火) 07:37:51.94

一様事前分布の代わりに使われるJefferyの分布beta(0.5,0.5)って
何の有用性があるのか今一つわからない。
2/π*arcsin(√x)になるのはわかるんだが。

**１３２人目の素数さん** · 2018/06/12(火) 12:36:19.41

β分布は0通るからダメだろ

**１３２人目の素数さん** · 2018/06/17(日) 17:20:53.12

>>640
Jefferyのは一対一のパラメータ変換後も関係が維持されて不偏になって余計なこと考えずに済む。
Φ=t(θ)のとき、
p(θ)～|J(θ)|^1\2→p(Φ)～|J(Φ)|^1\2

β(0.5,0.5)はpdfがベルヌーイ分布の時だな、ほかの時は知らん

wikiでよければこの辺は書いてある
https://en.m.wikipedia.org/wiki/Jeffreys_prior

**１３２人目の素数さん** · 2018/06/17(日) 17:35:32.25

江戸末期の田舎の下級武士に経済ユダヤが支援してテロを起こさせ江戸幕府を転覆させたのが明治維新。
江戸末期から日本は経済ユダヤとの繋がりがありお互いの利益の均衡を目指してきたのが今日までの政治
の中心課題だと言えます。複式簿記　資本主義　株式制度現在の経済の根幹を作ったのは彼等であり、
全ての産業を掌握する彼等（総資産数京円以上）の意向を無視出来ません。旧ソ連　中国共産党　北朝鮮　
ISISを作ったのは彼等であり、日本の技術流出　東芝の半導体事業からの撤退、シャープの倒産全て彼らの
シナリオ通りに動いてます。また、ここ数百年における世界の全ての紛争、戦争は彼等によって引き起こさ
れました。
彼らの目指している世界は自分達を支配階級とした人類の管理であり歯向かう人間の排除です。　
私達が右や左と罵り合う姿は彼らにとって好都合であり、対立は彼らの支配体制の強化になります。そういっ
たことを全ての日本人が理解しないと同じことを繰り返し、十数年後　あの時安部が日本を滅茶苦茶にした。　
今度の保守の誰々さんこそ日本を救うと喚いてるかもしれません。消費税廃止　移民反対と当たり前のことを
各政治家に要求し続けると同時に政治家は全員ユダヤの手先だと疑い続けないと日本の独立は成し得ません。

世界中の人間が知るべきこと

・世界の全てのメディアはユダ金が牛耳っている。

・トランプ　プーチン　習近平　安部　麻生　テリーザ・メイ　メルケル　文在寅　金正恩はユダ金の手下であり仲間である。
テレビに出てる有名な政治家は国内外問わず全員ユダヤの手先だと考える事。右や左などによる対立は茶番である。

・全てのテロと紛争と戦争は、ユダ金達と軍産複合体によって引き起こされている。

**１３２人目の素数さん** · 2018/06/18(月) 11:40:53.22

工作員ご苦労さん

**１３２人目の素数さん** · 2018/06/18(月) 17:07:19.91

>>642
ありがとうございました。
Fisherの情報量から勉強してみます。

**１３２人目の素数さん** · 2018/06/21(木) 15:08:46.58

このように立方体を100段積み上げるには何個必要か？
http://livedoor.4.blogimg.jp/veritedesu/imgs/8/8/88fd10d5.gif

答.171700

**１３２人目の素数さん** · 2018/06/21(木) 19:00:41.42

>>646
( 1/6*n*(n+1)*(2*n+1) + 1/2*n*(n+1) )/2

**１３２人目の素数さん** · 2018/06/22(金) 11:50:53.85

>>618
何も関係ないw
でも根拠は出さない
おまえの主観なんてだれも興味ねぇよ
何も強い関係ないなんて、全称命題的な否定するやつはまずバカ

**１３２人目の素数さん** · 2018/06/22(金) 21:14:04.73

>>646
求める個数の一般解は
婆(k+1)/2
=這這1
ロリーローリンの公式から
n(n+1)(n+2)/3!
n=100より求める個数は
100・101・102/6
=10100・17
=171700

**１３２人目の素数さん** · 2018/06/25(月) 21:42:44.02

■このゲームができるのは1回だけです

Aのツボは99個の青い球と1個の赤い球が詰まっている

Bのツボは99個の赤い球と1個の青い球が詰まっている

このとき、自分の目の前のツボから1個球を
取り出してみたら赤い球であった

目の前のツボはAのツボだろうか、Bのツボだろうか

**１３２人目の素数さん** · 2018/06/26(火) 07:05:29.72

問題

９９人の囚人がいます。彼らの頭に１～１００までのナンバーカードが貼りつけられた帽子をランダムにかぶせます。
他人の帽子は見ることができても、自分の帽子は見ることができません。
帽子の数は全部で１００なので、一つ使われずに余ります。
そのナンバーは囚人達にはわからないようにしておきます。
この状況で、囚人たちに一斉に自分のナンバーを宣言させて、全員が正解だったら釈放するという賭けをします。
囚人たちには帽子をかぶせられる前に相談タイムが設けられています。
どういう戦略を取れば、助かる確率を最も高くできるでしょうか？

**１３２人目の素数さん** · 2018/06/26(火) 07:35:03.42

>>651
98人の数字に出てこなかった2つをお互いに申告したら使われてない数字が分かるから自分の数字が分かるンじゃないの？

**１３２人目の素数さん** · 2018/06/26(火) 07:51:27.34

>>652
帽子を被されてからは囚人間の意思疎通はできない前提の問題。

**１３２人目の素数さん** · 2018/06/26(火) 08:20:50.65

>>650
Aを選ぶ確率がJeffery分布に従うとすると

# b=1-a
# P(r|a)=1/100
# P(r|b)=99/100
# P(a|r)=P(r|a)P(a)/[P(r|a)P(a)+P(r|b)P(b)]=0.01p/(0.01p+0.99(1-p))

library(rjags)
data=list(shape1=0.5,shape2=0.5)
modelstring='model{
par=0.01*p/(0.01*p+0.99*(1-p))
p ~ dbeta(shape1,shape2)
}めあ
'
writeLines(modelstring,'TEMPmodel.txt')
model=jags.model('TEMPmodel.txt',data=data)
update(model)
samples = coda.samples( jagsModel , variable=c("par",'p'), n.iter=100000 )
coda::HPDinterval(samples[,'par'])
hist(as.matrix(samples)[,'par'],freq=FALSE,main='',col='gray',xlab='Pr(A|red)',
breaks=50, axes=FALSE,ylab=''); axis(1)

求める確率P（箱A｜赤玉）は

平均
> mean(as.matrix(samples)[,'par'])
[1] 0.03687427

信頼区間
> coda::HPDinterval(samples[,'par'])
[[1]]
lower upper
var1 0.0000001471041 0.1601718
attr(,"Probability")
[1] 0.95

**１３２人目の素数さん** · 2018/06/26(火) 08:24:07.39

#　タイプミス修正

library(rjags)
data=list(shape1=0.5,shape2=0.5)
modelstring='model{
par=0.01*p/(0.01*p+0.99*(1-p))
p ~ dbeta(shape1,shape2)
}
'
writeLines(modelstring,'TEMPmodel.txt')
model=jags.model('TEMPmodel.txt',data=data)
update(model)
samples = coda.samples( jagsModel , variable=c("par",'p'), n.iter=100000 )
coda::HPDinterval(samples[,'par'])
par=as.matrix(samples)[,'par']
hist(par,freq=FALSE,main='',col='gray',xlab='Pr(A|red)',
breaks=50, axes=FALSE,ylab=''); axis(1)
BEST::plotPost(par,showMode=TRUE)
mean(par)
quantile(par,c(0.025,0.50,0.975))

**１３２人目の素数さん** · 2018/06/26(火) 08:30:29.74

確率分布を考えないなら
赤玉でたときにAの箱であった確率は
> 0.01*0.5/(0.01*0.5+0.99*0.5)
[1] 0.01

一様分布にしたらこうなった。

> mean(par)
[1] 0.0369026

> coda::HPDinterval(samples[,'par'])
[[1]]
lower upper
var1 0.0000001761594 0.1594358
attr(,"Probability")
[1] 0.95

**１３２人目の素数さん** · 2018/06/26(火) 09:21:38.52

>>650
一様分布でのシミュレーションを100万回繰り返してみた。

pickup <- function(){ # A:Box 1, Red:Ball 1
A=c(1,rep(0,99))
B=c(0,rep(1,99))
AB=list(A,B)
Box=sample(1:2,1)
Ball=sample(AB[[Box]],1)
c(Box=Box,Ball=Ball)
}
pickup.sim <- function(k=1e3){
re=replicate(k,pickup())
PAR=sum(re['Box',]==1 & re['Ball',]==1)/sum(re['Ball',]==1)
return(PAR)
}
re=replicate(1e3,pickup.sim())
mean(re)
HDInterval::hdi(re)
median(re)
Mode(re)[1]

平均値
> mean(re)
[1] 0.01009577
95%信頼区間
> HDInterval::hdi(re)
lower upper
0.001901141 0.018329939
attr(,"credMass")
[1] 0.95
中央値
> median(re)
[1] 0.01002004
最頻値
> Mode(re)[1]
　 x
0.01020133

**１３２人目の素数さん** · 2018/06/26(火) 09:48:26.60

>>652
囚人がランダムに答えると、2の99乗分の1の釈放確率。
ネットで検索すると解答がみつかる。
釈放確率が1/2にできるという。
解説読んでも理解できなかったが、シミュレーションしたらその通りだった。
解答のurlと
シミュレーションのスクリプトはこれ。
http://rio2016.2ch.net/test/read.cgi/math/1501755792/443

**１３２人目の素数さん** · 2018/06/27(水) 13:50:01.55

ある大学の学生数は５００以上１０００人以下であることはわかっている。
無作為に２人を抽出して調べたところ
二人とも女子学生である確率は１／２であった。
この大学の学生数と女子学生数を求めよ。

**１３２人目の素数さん** · 2018/06/27(水) 19:33:41.72

問題文に問題があると思うが、意図を汲んで解くと

学生数=696
女子学生数=492

**１３２人目の素数さん** · 2018/06/28(木) 06:21:32.75

確率がちょうど1/2になる整数のペアは

女子　男子
3 1
15 6
85 35
493 204

問題文の表現に問題あるかな？
xC2　÷　yC2=1/2の解を求める問題。

**１３２人目の素数さん** · 2018/06/28(木) 15:46:33.46

>>661

次に1/2になるのは

女子 2871 男子1189　総数4060

**１３２人目の素数さん** · 2018/06/29(金) 01:14:56.80

計算式は？

**１３２人目の素数さん** · 2018/06/29(金) 07:39:17.32

2x(x-1)=y(y-1)

**１３２人目の素数さん** · 2018/06/29(金) 11:42:33.70

日本人の血液型はＡ,Ｏ,Ｂ,ＡＢの比率が概略４：３：２：１であるという。
全部の血液型を集めるのは平均で何人集めればよいか？

シミュレーションで12.37、切り上げて１３人になった。

解析解はよくわからん。

**１３２人目の素数さん** · 2018/06/29(金) 16:46:01.89

2x(x-1)(x-2)(x-3)=y(y-1)(y-2)(y-3)の整点は？

**１３２人目の素数さん** · 2018/06/29(金) 18:11:56.30

>>666
式値=0は除くと
x=7, y=8
2*7*6*5*4=8*7*6*5

**１３２人目の素数さん** · 2018/06/29(金) 20:05:31.49

A:2x(x-1)=y(y-1)

この曲線Aは、４個の自明な整点
(x,y) ∈ {0,1}×{0,1}
を持つ

これが
無作為に２人を抽出して可能となる組み合わせ

｛男男　男女　女男　女女｝

に対応するという事かね？(´・ω・`)

**１３２人目の素数さん** · 2018/06/29(金) 21:39:50.47

>>668
>659は
xC2　÷　yC2=1/2
500<y<100
の自然数解を求めるだけの話。

**１３２人目の素数さん** · 2018/06/29(金) 22:10:22.60

**１３２人目の素数さん** · 2018/07/03(火) 16:09:39.62

あるタクシー会社のタクシーには１から通し番号がふられている。

タクシー会社の規模から保有タクシー台数は１００台以下とわかっている（弱情報事前分布）。

この会社のタクシーを５台みかけた。最大の番号が６０であった。

この会社の保有するタクシー台数の期待値と９５％信用区間を求めよ。

**１３２人目の素数さん** · 2018/07/03(火) 21:40:38.58

Sum[n C[59,4]/C[n,5],{n,60,100}]/Sum[C[59,4]/C[n,5],{n,60,100}]
=2590100/36231≒71.4885

Sum[C[59,4]/C[n,5],{n,60,92}]/Sum[C[59,4]/C[n,5],{n,60,100}]
=0.947035
Sum[C[59,4]/C[n,5],{n,60,93}]/Sum[C[59,4]/C[n,5],{n,60,100}]
=0.95496

60～93

**１３２人目の素数さん** · 2018/07/03(火) 22:29:08.46

>>672
正解！

**１３２人目の素数さん** · 2018/07/04(水) 00:03:05.36

Rで書くと

n=60:100
pmf=choose(60-1,5-1)/choose(n,5) #Pr(max=60|n)
pdf=pmf/sum (pmf)
sum( n*pdf) #E(n)

plot(n,cumsum(pdf))
abline(h=0.95,lty=3)

plot(n,cumsum(pdf),xlim=c(75,100),ylim=c(0.75,1),type='h')
abline(h=c(0.80,0.90,0.95),lty=3)

累積質量関数をグラフにすると
http://imagizer.imageshack.com/img924/9020/nxNiAP.jpg

**１３２人目の素数さん** · 2018/07/04(水) 20:33:40.52

時系列データでデータが下降傾向にあるってことを確認する統計手法ってあるの?
二項分布でp＝1/2として検定するとか?

例えば5回連続以上で下降になれば微妙なさげでも下降傾向があると判定できる?

**１３２人目の素数さん** · 2018/07/04(水) 20:35:41.15

5回連続で下降になると(1/2)^5＜5%になるからって意味。

**１３２人目の素数さん** · 2018/07/04(水) 23:06:28.81

>>675
jonckheere検定というのがある。
以前に別スレにRのスクリプトを投稿した。
http://rio2016.2ch.net/test/read.cgi/math/1501755792/387

**１３２人目の素数さん** · 2018/07/05(木) 10:06:33.58

同窓会に各人、景品を持ち込む。
全体を集めてクジで持ち帰る景品が決まる。
自分の景品を持ち帰ることになる人数の期待値はいくらか？

**１３２人目の素数さん** · 2018/07/05(木) 15:14:25.79

>>678
1

**１３２人目の素数さん** · 2018/07/05(木) 18:14:31.75

同窓会に参加した人数ｘで

１／ｘ

**１３２人目の素数さん** · 2018/07/05(木) 18:26:25.16

こういう文章問題になると頭真っ白になる

**１３２人目の素数さん** · 2018/07/05(木) 18:53:43.61

>>680
2人なら0*1/2+2*2で期待値は１人だよ。

**１３２人目の素数さん** · 2018/07/05(木) 18:54:49.45

2人なら0*1/2+1/2*2で期待値は１人だよ。

**１３２人目の素数さん** · 2018/07/05(木) 19:01:56.33

期待値とは平均のことだよ

**１３２人目の素数さん** · 2018/07/05(木) 19:39:42.78

>>678
kは0 からｎまでとして

k*nCk*(1/n)^k*(1-1/n)^(n-k)

がｎによらず１になることが示せれば終わり。

**１３２人目の素数さん** · 2018/07/05(木) 19:46:49.88

>>680
それは、ある一人が自分の景品を持ち帰る確率な。

**１３２人目の素数さん** · 2018/07/05(木) 23:55:11.14

そもそも一人あたり何個の景品を持って来るの？
一人一個持ってきて、分割せず一個を渡すなら、期待値は一人じゃないの？

**１３２人目の素数さん** · 2018/07/06(金) 14:37:02.37

インフルエンザの迅速キットは特異度は高いが感度は検査時期によって左右される。
ある診断キットが開発されたとする。
このキットは特異度は９９％と良好であったが、
感度については確かな情報がない。
事前確率分布として一様分布を仮定する。
５０人をこの診断キットで診断したところ４０人が陽性であった。
この診断キットの感度とその95%CI、及び母集団の有病率とその95%CIは？

**１３２人目の素数さん** · 2018/07/06(金) 20:27:38.96

１回のじゃんけんで決まる勝者の数が最大になるのは何人でじゃんけんをしたときか？

計算していたら４人になったのは意外。

**１３２人目の素数さん** · 2018/07/06(金) 21:23:09.39

思考プロセスを書きなさい

**１３２人目の素数さん** · 2018/07/06(金) 22:07:41.15

>>689
あいこのときは勝者が出るまでやり直すなら
ｎ人のジャンケンなら期待値は n/2人

**１３２人目の素数さん** · 2018/07/07(土) 00:29:03.30

>>689
２～１０人で全員で一度だけじゃんけんをしたときの勝者の数の期待値は

6 / 9
27 / 27
84 / 81
225 / 243
558 / 729
1323 / 2187
3048 / 6561
6885 / 19683
15330 / 59049

[1] 0.6666667 1.0000000 1.0370370 0.9259259 0.7654321 0.6049383 0.4645633 0.3497942
[9] 0.2596149

４人のときが84/81で最大値。

**１３２人目の素数さん** · 2018/07/07(土) 00:39:16.72

>>691
あいこはやり直しでの
ジャンケンのシミュレーション、１は3に勝ち、3は2に勝ち、2は1に勝つ
ｘは１，２，３　の並び
1回のジャンケンでの勝者の数を返す
Win <- function(x){# 1 beats 3, 3 beats 2, 2 beats 1
if(length(unique(x))!=2 ) return(0) # no winner
u=sort(unique(x))
if(all(u==c(1,2))) return(sum(x==2))
if(all(u==c(2,3))) return(sum(x==3))
if(all(u==c(1,3))) return(sum(x==1))
}

Jnk.sim <- function(n){
x=sample(1:3,n,replace = TRUE)
while(Win(x)==0){ # repeats when no winner
x=sample(1:3,n,replace = TRUE)
}
Win(x)
}
mean(replicate(1e3,Jnk.sim(10)))

10人でのシミュレーションで期待値は約５
> mean(replicate(1e3,Jnk.sim(10)))
[1] 4.99

**１３２人目の素数さん** · 2018/07/16(月) 18:54:06.55

時系列にベイズ統計を使うメリットって？

**１３２人目の素数さん** · 2018/07/29(日) 02:17:03.15

　　　　　　　　,,＿＿,,
　　　　　　／　　　｀､
　　　　　/　　　　　　　ヽ
　　　　　/　●　　　 ●　|
　　　／l　 '''''　し　 ''''''　|
　　 /　　l　　　＿＿.　　 |
　　 l　　/ヽ＿ ` --' ＿ノ
　　＼　　　　　￣　　ヽ∩
　　　　⌒l 　　　　　　　l三 |
　　　　　 |　　　　　　　ヽ.__|

**１３２人目の素数さん** · 2018/07/31(火) 15:04:18.63

エーザイのアルツハイマー新薬のベイジアン解析の資料読んで
俺に分かりやすく説明してください

**１３２人目の素数さん** · 2018/08/01(水) 13:00:18.65

>>696
ネットワークベイジアンメタアナリシス？

**１３２人目の素数さん** · 2018/08/04(土) 18:11:25.52

高校で一般人も習う条件付き確率になぜ変な名前をつけて喜んでんの?

**１３２人目の素数さん** · 2018/08/05(日) 10:32:08.32

>>698
なんでも確率変数にできるから。
p値の信頼区間(ベイズでは信用区間と呼ぶ)もだせるよ。

**１３２人目の素数さん** · 2018/08/05(日) 12:24:22.57

嘘には三つの種類がある
ただの嘘と
真っ赤な嘘と
統計だ
ってアカポス取れない数学科が統計に流れて薬学だの保険屋になって詐欺をするんだな

**１３２人目の素数さん** · 2018/08/05(日) 13:19:41.73

統計は嘘をつくための道具だよ
いかに上手く丸め込むか
尤もらしいことを言えた者が勝ち
最尤推定なんて
「もっとももっともらしい」
ってまさにそれだし

**１３２人目の素数さん** · 2018/08/05(日) 13:20:30.13

それでも推定はまだ可愛げがある
検定お前はダメだ

**１３２人目の素数さん** · 2018/08/05(日) 14:27:25.67

>>698
MCMCと組み合わせるといい感じだから

**１３２人目の素数さん** · 2018/08/05(日) 16:07:05.46

>>701
小児甲状腺がんが増えていないとかに援用されてるね。

**１３２人目の素数さん** · 2018/08/06(月) 02:46:32.85

信頼区間と信用区間は別物

**１３２人目の素数さん** · 2018/08/10(金) 08:07:29.43

1964年、茨城県南の国道バイパスで突如自家用車が
消失するという事件が起こった
毎日新聞でも取り上げられたこの不可解な失踪事件は
今もなお未解決である

**１３２人目の素数さん** · 2018/08/11(土) 02:40:19.11

検定はだめだめ言われるけど
なんで未だにどの教科書にも基礎事項としてでてくるんだ?

**１３２人目の素数さん** · 2018/08/11(土) 06:20:08.06

>>701
コクランのロゴの由来を読むと考えが変わるかも
https://www.cochrane.org/ja/2017/about-us/our-logo

**１３２人目の素数さん** · 2018/08/11(土) 11:09:54.37

>>707
フィッシャーさんが偉かったから

**１３２人目の素数さん** · 2018/08/11(土) 12:56:56.92

>>707
嘘が上手かったから

**１３２人目の素数さん** · 2018/08/12(日) 07:03:58.48

>>710
メンデルの法則の実験データは法則に合致し過ぎて捏造の疑いを指摘したのがフィシャーだったかな。

**１３２人目の素数さん** · 2018/08/12(日) 07:11:07.05

統計による「検定」
サイコロを２回振ったら順に1,2であった。
その確率は(1/6)*(1/6)=1/36=0.027 < 0.05だから
このサイコロはイビツである。
100人に一人が当たるくじを1本太郎君が引いたら当たった。
この確率は0.01 < 0.05だからこのくじはイカサマである。

**１３２人目の素数さん** · 2018/08/12(日) 07:45:35.34

>>712
正にこれ
なんで5％しか起こらないことが起こったからといって
仮定を否定する根拠になるわけがない
しかも
改めた結論を元に別のことをまたまた検定してとか
検定に検定を重ねまくることが良くある
1枚でも眉唾な曇りガラスを
何枚も重ねて得られる結論って意味ないだろ

**１３２人目の素数さん** · 2018/08/12(日) 11:32:43.28

>>712
まさにコレか?

検定に問題あるといえこれは検定を理解してない
ダメな統計の典型でしょコレ
検定力全く考慮してないし
というか科学を理解してないような

**１３２人目の素数さん** · 2018/08/12(日) 11:41:59.92

＞検定に検定を重ねまくることが良くある
これはやってる本人が問題性に気付かないでやったり悪用するなら問題だけど
問題性に気づいてて探索的にやるのは別に問題ない
検討したい仮説がみつかれば
それを確かめるための実験をくむなり新しいデータをとって追試することが大事なわけで
検定でやる必要はないけど
再現性こそ科学をささえるものなのではないかと思うけど

**１３２人目の素数さん** · 2018/08/12(日) 11:44:36.37

検定の問題ってのは結局
使う側にも結果を見る側にも誤解をあたえやすいってのが問題なのではないかと

**１３２人目の素数さん** · 2018/08/12(日) 12:12:05.87

コインを５回投げたら全部、表であった。

0.5^5　<　0.03125なのでこのコインはイカサマ。

コインを５回投げたら表裏表裏表であった。
0.5^5 < 0.03125なので　このコインもイカサマ。

**１３２人目の素数さん** · 2018/08/12(日) 12:16:07.59

(脱字修正)

コインを５回投げたら全部、表であった。

0.5^5　=　0.03125 < 0.05 なのでこのコインはイカサマ。

コインを５回投げたら表裏表裏表であった。

0.5^5 = 0.03125 < 0.05 なので　このコインもイカサマ。

**１３２人目の素数さん** · 2018/08/12(日) 12:36:00.12

p値とは、その事象以下の確率でしか起こらない現象の確率の総和である。
　　　　　　　　　　　　↑↑

サイコロをふって１の目が１０回でた。その確率は(1/6)^10

6 2 4 5 2 5 1 3 6 2　の順にでる確率も(1/6)^10である。

1 4 2 4 2 2 4 4 1 1　の順にでる確率も(1/6)^10である。

....

この順列は6^10通り存在するｔ。

これを全部加算するとｐ値は(1/6)^10 * 6^10 = 1

ゆえに、いかなるサイコロも統計的にイカサマとはいえない。

**１３２人目の素数さん** · 2018/08/12(日) 12:40:57.07

>>718
仮説が立ってない
データで検証しうる仮説は何をたてたの?
検定はまず仮説からたてないとダメ
君がやってるのは統計的仮説検定ではないよ

**１３２人目の素数さん** · 2018/08/12(日) 12:44:40.42

検定に置いて大事なのは
サンプルサイズ、検定力、有意水準、効果量
仮説もきちんと事前にたてるのプロセスとして大事

このあたりが欠けてる検定は何も意味ないよ

**１３２人目の素数さん** · 2018/08/12(日) 12:46:12.27

あれ?このやりとり前にもやったような。。。
同じやつが書いてるのならループするだけだな
落ちるわ

**１３２人目の素数さん** · 2018/08/12(日) 12:47:29.69

帰無仮説は表がでる確率=1/2
サイコロの各々の目がでる確率=1/6
じゃね？

**１３２人目の素数さん** · 2018/08/12(日) 14:11:00.62

そこが問題じゃない
1/6であることが起こったから
帰無仮説を棄却するというのが根拠ないってこと
それから
前に上げたこと以外に
両側検定なら対立仮説が棄却されるのに
片側検定なら採択されるとか
恣意的に両側片側を選んで上手く欺すことが可能なことも多い
だいたい
片側検定では正の範囲あるいは負の範囲だけ考えるんだから
つまりは条件付き確率を考えるようなもの
であるからして有意水準は半分にしないとおかしい
両側検定の有意水準÷２＝片側検定の有意水準
であるべきなのに同じ有意水準でいいとしてるのが
この欺瞞の元凶

**１３２人目の素数さん** · 2018/08/12(日) 14:14:37.21

>>719

サイコロの各々の目がでる確率=1/6を事前分布として

サイコロをふって１の目が１０回でたら、１の目のでる確率のモード値は0.7

6 2 4 5 2 5 1 3 6 2　の順にでたら、１の目のでる確率のモード値は0.07

98％CIとともに図示すると、http://i.imgur.com/CTvq0lL.jpg

ｐ値なんぞ判断には不要。

**１３２人目の素数さん** · 2018/08/12(日) 15:14:16.30

ベイス？？

**１３２人目の素数さん** · 2018/08/12(日) 16:01:37.80

サイコロのある目のでる確率の９５％CIが０．１０～０．２０に含まれたときにその目に関しては歪ではない、と定義する。

サイコロを１０００回投げて１～６の目の回数が
　
　309　 251 　196　 151 　 49 　 44

であったときの各々の目のでる確率分布は以下のようになる。

95%HDI　と 0.10-0.20を比べて１、２、５、６は歪、３はどちらとも言えない、４は歪でないと判断できる。

https://i.imgur.com/w4YD0t9.jpg

**１３２人目の素数さん** · 2018/08/12(日) 17:54:58.31

>>723
1のでる確率＝1/6じゃなくて
それぞれの確率＝1/6?
全部の確率について仮説たててるの?
P1=P2=P3=P4=P5=P6＝1/6が仮説?
それどう考えても自由度足りないよね?

その仮説考えたら次にすべきは
どういうデータを取れば論証できるだろうかになるわけだが
2回ふってでた目をみてそれの確率求めることで一体なにが論証できると思う?
それって何が出ても1/36になるけどそれが検証可能なデータだと思う?
そこに何の意味があるの?

そもそもなぜそこで、n＝2の母比率検定じゃなくて、
N=1の一回目の確率x二回目の確率という事象の確率を検討するの?

検定いぜんに実験の企画段階がめちゃくちゃ可笑しいとおもうんだけどな

**１３２人目の素数さん** · 2018/08/12(日) 18:04:24.47

>>724
そうかね自分は科学的なしゅほうだとおもうけどな

科学的な手法ってのは
問をたて仮説をたて
それを検証できるデータをとり
そこから仮説がどうなのか検証し
どうやらこの仮説ははいろいろ説明できるようだぞというなら
とりあえず残しておく
いやいろいろ説明できない点があるぞというときは
とりあえず研究対象から外す

ほんでほかのやつが残った仮説にもどうやら問題あるようだ
こっちのほうがうまく説明できるようだと別の仮説を立てる

しかしかし、以前、は研究対象から外したものがいろいろ調べてみると正しいようだというデータをあつめるやつがいる

これって科学的仮説がたどっていく過程そのもの何だがな
仮説検定はその一旦を担ってるいる似すぎないだけであって
それで全てというものではない。

科学なんてあくまで仮説の積み上げで
仮説が多くの合意を得ることもあるが、その仮説が正しいとするのは結構曖昧にすぎず
不安定なものに過ぎない

根拠がないと言うが統計によってえられた結論ってそもそもどんなものも大した根拠なくて主観がどこかにはいってるよね。

**１３２人目の素数さん** · 2018/08/12(日) 19:39:29.57

片側両側については一理ないこともないとおもう

しかし、片側にするってことは片側は起きないだろうという論理的説明を一応出来る状態にあるということ
となると対立仮説も片側に発生する可能性がたかくなるわけでしょ。
だったらかりに推定する母数が平均値なら、きむ仮説でたてた平均値にちかい真の平均値も増えるだろう
だったら採択いきは狭くして棄却域増やさざるを得なくなる
という仮説

こういう宗教的論争を多数生み出すてんで結局仮説検定は問題あるんだけどね。

**１３２人目の素数さん** · 2018/08/12(日) 21:19:55.98

帰無仮説をサイコロの各々の目がでる確率=1/6とするとき

１の目が続けて何回でたら、帰無仮説を棄却する？

棄却されたときに１の目がでる確率はどれくらいのなのか？

1/6.0000001 なのか 1/2なのか？　p値は何かを語るだろうか？

むしろ、１の目のでる確率の95%CIが1/12から1/3なら許容範囲、1/12以下や1/3以上なら１の目に関して歪なサイコロと判断する方が実用的だと思う。

１の目が２～９回連続したときの１の目のでる確率をグラフにすると次のようになる。

http://i.imgur.com/nUd5UMO.jpg

ROPE：Range Of　Practically Equalの略　（1/6の半分および2倍の1/12～1/3とした）

この結果から７回以上連続すれば、歪なサイコロと呼べると思う。

**１３２人目の素数さん** · 2018/08/12(日) 22:08:12.40

>>728
ディリクレ分布でP1=P2=P3=P4=P5=P6＝1/6を事前確率分布にするよ。

**１３２人目の素数さん** · 2018/08/12(日) 22:14:39.76

>>732
まじで?
よく知らんけど
そんだけのおもい仮説検証で
N=1で自由度足りるの?

**１３２人目の素数さん** · 2018/08/12(日) 22:17:22.64

>>733
それでMCMCして１の目が２～９回連続したときの１の目のでる確率をグラフが

http://i.imgur.com/nUd5UMO.jpg

**１３２人目の素数さん** · 2018/08/12(日) 22:17:27.59

N=1で6個の仮説を検証できるて凄くないか?
天才っているんだなw
どう考えても無理を可能にする天才
すげぇわ

**１３２人目の素数さん** · 2018/08/12(日) 22:18:50.58

自由度どう考えても足りないんだけどどうやって補完してるの?

**１３２人目の素数さん** · 2018/08/12(日) 22:21:19.95

５回1の目が出たときの事後分布はこんな感じでディリクレ分布がMCMCされるよ。

もちろんpi.1+pi2+...+pi.6=1の縛りはある。

pi.1 pi.2 pi.3 pi.4 pi.5 pi.6
[1,] 0.3283620 0.051967675 0.03618622 0.16401712 0.367065379 0.052401570
[2,] 0.6824722 0.009042027 0.02910249 0.03210041 0.018967898 0.228314983
[3,] 0.5938329 0.015613992 0.04579314 0.22754563 0.027786023 0.089428325
[4,] 0.5801030 0.033073118 0.01888069 0.19814067 0.001983984 0.167818557
[5,] 0.5501332 0.056247586 0.04896485 0.02131748 0.090452926 0.232883935
[6,] 0.3149563 0.051999120 0.04049730 0.32030618 0.039353349 0.232887755
[7,] 0.5496275 0.154893875 0.23899680 0.02146069 0.028756420 0.006264765
....

**１３２人目の素数さん** · 2018/08/12(日) 22:21:43.52

N=1で統計的に正しいですって結果出されても説得力まったくないなぁ
統計は詐欺だと立証されてるようなもんだけどw

**１３２人目の素数さん** · 2018/08/12(日) 22:23:22.50

ごめん詳しいこと知らないので分かるようにせつめして
N=1で六個の仮説についてはんだんできるってすごくね?
どういう理屈?

**１３２人目の素数さん** · 2018/08/12(日) 22:24:15.64

>>735

それがベイズ統計の醍醐味でもあり、胡散臭さでもある。

こういうのね

事前分布を決めてしまえば
まだ一発も撃ったことのない0発0中のゴルゴ16の命中期待値
のような、データ数が少ないどころか0個の場合でも算出・結論できる

**１３２人目の素数さん** · 2018/08/12(日) 22:27:04.16

>>740
よくわからんけどそうなると統計的仮説検定とあんまかわらんような気がするけど

**１３２人目の素数さん** · 2018/08/12(日) 22:29:07.04

N=1ってさ人文科学の事例研究なんだよね
そこから一般論を導き出すようなかんじ
人文科学ってこれだからばかにされるんだけど
コレをうわまわる手法が統計にはあるのかすげぇなw

**１３２人目の素数さん** · 2018/08/12(日) 22:37:10.89

サイコロの目の出る確率が目の数に比例する、

2は1の目の出る確率の2倍

3は１の目の出る確率の3倍
....

とかいう事前分布のとき

1の目が続けて5回でたときの1の目のでる確率の事後分布のグラフも書けるよ。

**１３２人目の素数さん** · 2018/08/12(日) 22:40:11.41

>>743
グラフ書けるかどうかじゃなくて
バカにも分かるように説明して下さい

**１３２人目の素数さん** · 2018/08/12(日) 22:41:21.70

N=1で6個の仮説の真実説位を検証できる理屈についておしえて

**１３２人目の素数さん** · 2018/08/12(日) 22:45:25.16

何を持って歪なサイコロとするか、各々の目のでる確率の分布をどう仮定するか、というだけの話。

**１３２人目の素数さん** · 2018/08/12(日) 22:48:05.81

これを多項分布に応用しただけの話。

ゴルゴ13は100発100中
ゴルゴ14は10発10中
ゴルゴ15は1発1中
とする。

各々10000発撃ったとき各ゴルゴの命中数の期待値はいくらか？

**１３２人目の素数さん** · 2018/08/12(日) 22:48:28.76

>>746
よくわからんが
有意水準の設定と変わらんね

しょうじきN=1で六個の仮説を検定できるなんて
統計的検定より胡散臭いけど結論がよく分からん

**１３２人目の素数さん** · 2018/08/12(日) 22:51:42.49

>>747
それとN=1で六個の仮説を論証出来るのと同関係あるの?

N=1と多項分布がどうかんけいあるのよくわからんえけど

**１３２人目の素数さん** · 2018/08/12(日) 22:55:25.81

>>747
これは命中確率の事前分布を一様分布として

ゴルゴ13は100発100中だったときに

命中確率の分布がどう変わるか、を計算することになる。

ベイズ統計って　事前と事後で　確率分布がどう変わるか（relocation of credibility）を探る手法。

**１３２人目の素数さん** · 2018/08/12(日) 23:01:14.39

>>749
すべての目の出る確率が等しいと事前確率分布を設定して
1回サイコロをふったら１の目がでた。
各々の目の出る事後確率分布はどうなるか？

これだけの話。

>727で数値を

1 0 0 0 0 0

に置き換えるだけ。

**１３２人目の素数さん** · 2018/08/12(日) 23:01:25.62

>>750
自分に返答するのは意味不明だけど
けっきょくN=1で六個の仮説を論証できる原理って何なの?
バカにも
IME okashiku natta
sayonara

**１３２人目の素数さん** · 2018/08/12(日) 23:38:31.35

直ったわ
とりあえずN=1で6個の仮説証明できる原理を教えて

**１３２人目の素数さん** · 2018/08/13(月) 07:42:59.36

>>753
>751に既述。
原理は事前分布の信仰。

**１３２人目の素数さん** · 2018/08/13(月) 08:20:30.92

１から６の目の出る確率がパラメータα1=α2=...=α6=1のディリクレ分布に従うを事前確率分布とする（これは信仰）。

1回サイコロをふったら１の目がでた。
各々の目の出る事後確率分布はどうなるか？

をMCMCして出すだけ。

１の目の出る確率は平均0.287[95%CI 0.0161-0.593]
２～５の目の出る確率は各々平均0.143[95%CI 0-0.392]

と計算されたが、この分布で歪がどうかは、

何を歪と判断基準にするのか、というだけのお話。

**sage** · 2018/08/17(金) 03:36:43.23

確率はすべて条件つき確率であり、この点、事後確率をかんがえるベイズの理論は正しい。

**１３２人目の素数さん** · 2018/08/17(金) 09:12:30.98

>>756
おまえなあ、sageを名前のほうに書いてるのは故意にやってる？
笑えないんだけど？

＞　ベイズの理論は正しい。

その場合の「正しい」の定義が不明なので意味はない。
意味はないことを書くのが趣味なのかね？
数学で示すべき。
数学板なんだから。

**１３２人目の素数さん** · 2018/08/17(金) 09:51:51.87

誤差の分布が正規分布という事前確率で頻度主義統計も議論していると思う。

**１３２人目の素数さん** · 2018/08/18(土) 10:01:05.05

どの面も出るのが同様に確からしい
6面ダイスを独立に2回振った時に
少なくとも一回は1の目が出る確率は
いくらですか？

**１３２人目の素数さん** · 2018/08/18(土) 12:43:32.76

>>759
＞同様に確からしい

どの程度、同様に確からしいのを事前確率分布して計算するのがベイズ統計。

ディリクレ分布でパラメータを(1,1,1,1,1,1)とするのか、(10,10,10,10,10,10)とするのか、(100,100,100,100,100,100)とするのかで

少なくとも一回は1の目が出る確率分布は変わる。

図示すると、以下の通り、http://i.imgur.com/J1XUpAw.jpg

**１３２人目の素数さん** · 2018/08/18(土) 15:36:03.95

>>754
つまり宗教なの?

**１３２人目の素数さん** · 2018/08/18(土) 16:32:44.71

>>759
＞同様に確からしい

どの程度、同様に確からしいのかを事前確率分布して計算するのがベイズ統計。

ディリクレ分布でパラメータを(1,1,1,1,1,1)とするのか、(10,10,10,10,10,10)とするのか、(100,100,100,100,100,100)とするのかで

少なくとも一回は1の目が出る確率分布は変わる。

図示すると、以下の通り、http://i.imgur.com/J1XUpAw.jpg

**１３２人目の素数さん** · 2018/08/18(土) 16:34:57.61

>>761
日本人女性の身長の平均値は1～２ｍの間にある、
というのもまあ、信仰と言えなくもない。

**１３２人目の素数さん** · 2018/08/18(土) 16:47:58.22

初心者はまずこの本読んでみろ

ベイズ統計の理論と方法
渡辺澄夫

**１３２人目の素数さん** · 2018/08/20(月) 14:48:32.89

渡部洋先生のを薦める

**１３２人目の素数さん** · 2018/08/20(月) 15:01:08.82

ジョーカーを除いたトランプ５２枚の内、ダイヤが３９枚
ハートが１３枚あるとする
この中から１枚のカードを抜き出し、表を見ないで箱の中にしまった
そして、残りのカードをよく切ってから３８枚抜き出したところ、
３８枚すべてがダイヤであった
このとき、箱の中のカードがダイヤである確率はいくらか

**１３２人目の素数さん** · 2018/08/20(月) 19:26:00.92

>>766
> 39/52 * choose(38,38)/choose(51,38) / ( 39/52 * choose(38,38)/choose(51,38) + 13/52 * choose(39,38)/choose(51,38) )
[1] 0.07142857

**１３２人目の素数さん** · 2018/08/20(月) 19:42:13.13

>>767
1 / 14

**１３２人目の素数さん** · 2018/08/20(月) 19:54:20.26

D=39
H=13
T=D+H
# choose(n,r) : nCr

39/52 * choose(38,38)/choose(51,38) / ( 39/52 * choose(38,38)/choose(51,38) + 13/52 * choose(39,38)/choose(51,38) )

(D/T * 1/choose(T-1,D-1)) /((D/T * 1/choose(T-1,D-1)) + H/T * choose(D,D-1)/choose(T-1,D-1))

(D/T)/(D/T+H/T*D)

D/(D+H*D)

1/(1+H)

**１３２人目の素数さん** · 2018/08/20(月) 19:57:51.64

>>766
これ面白いな。

ダイヤがD枚
ハートがH枚あるとする
この中から１枚のカードを抜き出し、表を見ないで箱の中にしまった
そして、残りのカードをよく切ってからD-1枚抜き出したところ、
すべてがダイヤであった
このとき、箱の中のカードがダイヤである確率は　1/(H+1)

**１３２人目の素数さん** · 2018/08/20(月) 20:51:49.87

ハート１３枚、ダイヤ３９枚の合計５２枚のトランプカードから
一枚のカードを表を見ないで箱に入れる

Ωの部分集合を事象と言う
Ω自身は全事象と言う

Ω＝｛ハート，ダイヤ｝となる

各 i （１≦i≦４）が根元事象である

ハートが出るという事象A＝｛ハート｝で確率P(A)は

P(A)＝１／４　となる

最初に箱に入れた時を i
山札をシャッフルしてダイヤがｎ枚出た後をｊとして

箱の中のカードがハートであるという事象Aを考える.

A＝｛（i，j）|　i または j がハート｝

Ω＝｛（i，j）|１≦i≦４，１≦j≦５２－ｎ｝となり

この２０８－４ｎ通りの各要素が根元事象

ダイヤが出る枚数はｎ＝３８

Ω＝｛（i，j）|１≦i≦４，１≦ｊ≦５２－ｎ｝から

#A＝４ｘ（５２－ｎ）－３ｘ（５１－ｎ）

　　＝２０８－４ｎ－１５３＋３ｎ

　　＝５５－ｎ

#Aは事象Aに含まれる要素の個数

ハートである確率は

P(A)＝（５５－ｎ）／（２０８－４ｎ）＝１７／５６

ダイヤ以外である確率P(Ｘ)＝P(A)

ダイヤである確率は

∵ｑ＝１－｛（５５－ｎ）／（２０８－４ｎ）｝＝３９／５６

最初に箱の中にしまったカードが
ダイヤである確率は

P（B）＝３／４＝４２／５６

**１３２人目の素数さん** · 2018/08/20(月) 21:45:48.19

>>771
3/4って39/52だから
求める条件付き確率はじゃなくね？

**１３２人目の素数さん** · 2018/08/20(月) 22:05:29.00

>>766
この試行を何回も繰り返して
38枚全てがダイアだった試行を集めて
そのうち箱の中のカードがダイアの割合を求めているんじゃないの？

**１３２人目の素数さん** · 2018/08/20(月) 22:24:11.95

>>766
1/14だよ

**１３２人目の素数さん** · 2018/08/20(月) 23:13:53.37

# 数を減らしてシミュレーションしてみる。
# カードは８枚、ダイアDは６枚、ハートHが２枚。
# ８枚から１枚を箱に入れて残りの７枚から５枚引いたら全部ダイアとする。
# 全部ダイアであったときに箱の中のカードがダイアである割合を出してみる。
# 1万回の試行をしてその割合を出すという操作を100回やって平均値や中間値を出してみた。

rm(list=ls())

D=1
H=0
cards=c(rep(D,6),rep(H,2))
n.DH=length(cards)
n.D=sum(cards)
sim <- function(){
index_of_inbox=sample(1:n.DH,1)
inbox=cards[index_of_inbox]
outbox=cards[-index_of_inbox] # cards out of box
drawn=sample(outbox,n.D-1) # 2 cards drawn from outbox
c(inbox=inbox,drawn=drawn)
}
rate_sim <- function(k){
re=replicate(k,sim())
sum(apply(re,2,function(x) sum(x))==n.D)/sum(apply(re,2,function(x) sum(x[-1]))==(n.D-1))
}
re=replicate(100,rate_sim(1000))
summary(re)

> summary(re)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.2269 0.3164 0.3360 0.3368 0.3587 0.4327

引いたカードがすべてダイアであったとき、箱の中のカードがダイアである割合は1/(H+1)の1/3になった。

**１３２人目の素数さん** · 2018/08/20(月) 23:33:22.50

ダイヤが出る枚数はｎ＝５

Ω＝｛（i，j）|１≦i≦４，１≦ｊ≦３２－ｎ｝から

#A＝４ｘ（３２－ｎ）－３ｘ（３１－ｎ）

　　＝１２８－４ｎ－９３＋３ｎ

　　＝３５－ｎ

#Aは事象Aに含まれる要素の個数

ハートである確率は

P(A)＝（３５－ｎ）／（１２８－４ｎ）＝５／１８

ダイヤ以外である確率P(Ｘ)＝P(A)

ダイヤである確率は

∵ｑ＝１－｛（３５－ｎ）／（１２８－４ｎ）｝＝１３／１８

最初に箱の中に入れたカードが
ダイヤである確率は

P（B）＝３／４

**１３２人目の素数さん** · 2018/08/20(月) 23:43:12.62

>>776
引いたカードがすべてダイアであったときという条件下での確率ではないよ。
シミュレーションでも否定された。

**１３２人目の素数さん** · 2018/08/20(月) 23:44:19.68

ジョーカーを除いたトランプ５２枚の中から１枚のカードを抜き出し、
表を見ないで箱の中にしまった
そして、残りのカードをよく切ってから３枚抜き出したところ、
３枚ともダイヤであった
このとき、箱の中のカードがダイヤである確率はいくらか

これで計算値が一致する