ベイズの統計学を学び始めたんだけど
■ このスレッドは過去ログ倉庫に格納されています
信用に値するのか疑問です。
人工知能とかではなく日々の動機付けに利用する予定です >>771
3/4って39/52だから
求める条件付き確率はじゃなくね? >>766
この試行を何回も繰り返して
38枚全てがダイアだった試行を集めて
そのうち箱の中のカードがダイアの割合を求めているんじゃないの? # 数を減らしてシミュレーションしてみる。
# カードは8枚、ダイアDは6枚、ハートHが2枚。
# 8枚から1枚を箱に入れて残りの7枚から5枚引いたら全部ダイアとする。
# 全部ダイアであったときに箱の中のカードがダイアである割合を出してみる。
# 1万回の試行をしてその割合を出すという操作を100回やって平均値や中間値を出してみた。
rm(list=ls())
D=1
H=0
cards=c(rep(D,6),rep(H,2))
n.DH=length(cards)
n.D=sum(cards)
sim <- function(){
index_of_inbox=sample(1:n.DH,1)
inbox=cards[index_of_inbox]
outbox=cards[-index_of_inbox] # cards out of box
drawn=sample(outbox,n.D-1) # 2 cards drawn from outbox
c(inbox=inbox,drawn=drawn)
}
rate_sim <- function(k){
re=replicate(k,sim())
sum(apply(re,2,function(x) sum(x))==n.D)/sum(apply(re,2,function(x) sum(x[-1]))==(n.D-1))
}
re=replicate(100,rate_sim(1000))
summary(re)
> summary(re)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.2269 0.3164 0.3360 0.3368 0.3587 0.4327
引いたカードがすべてダイアであったとき、箱の中のカードがダイアである割合は1/(H+1)の1/3になった。 ダイヤが出る枚数はn=5
Ω={(i,j)|1≦i≦4,1≦j≦32−n}から
#A=4x(32−n)−3x(31−n)
=128−4n−93+3n
=35−n
#Aは事象Aに含まれる要素の個数
ハートである確率は
P(A)=(35−n)/(128−4n)=5/18
ダイヤ以外である確率P(X)=P(A)
ダイヤである確率は
∵q=1−{(35−n)/(128−4n)}=13/18
最初に箱の中に入れたカードが
ダイヤである確率は
P(B)=3/4 >>776
引いたカードがすべてダイアであったときという条件下での確率ではないよ。
シミュレーションでも否定された。 ジョーカーを除いたトランプ52枚の中から1枚のカードを抜き出し、
表を見ないで箱の中にしまった
そして、残りのカードをよく切ってから3枚抜き出したところ、
3枚ともダイヤであった
このとき、箱の中のカードがダイヤである確率はいくらか
これで計算値が一致する >>775
>引いたカードがすべてダイアであったとき、箱の中のカードがダイアである割合は1/(H+1)の1/3になった。
ここでいうHは>769-770で書いたハートの枚数。 >>778
このときとはどの時?
引いたカードが全部ダイアであったという条件下でだろ? ダイヤが出る枚数はn=3
Ω={(i,j)|1≦i≦4,1≦j≦52−n}で
ベイズと計算結果は一致する シャッフル後にダイヤのカードをn枚引いた時に
箱の中のカードがダイヤ以外のスートが出る確率空間は
1≦n≦12の範囲において一般化すると
Ω={(i,j)|1≦i≦4,1≦j≦52−n}から
#A=4x(52−n)−3x(51−n)
=208−4n−153+3n
=55−n
#Aは事象Aに含まれる要素の個数
スペード・ハート・クラブの各スートの出る確率は
P(A)=(55−n)/(208−4n)
スペード・ハート・クラブである確率は
P(X)=(165−3n)/(208−4n)
ダイヤである確率は
∵q=1−{(165−3n)/(208−4n)} q=1−{(165−3n)/(208−4n)}を
1≦n≦12の範囲において検算すると
7/34
41/200
10/49
39/192
19/94
37/184
1/5
35/176
17/86
11/56
8/41
31/160
山札からダイヤのカードが出るほど
箱の中のカードがダイヤである確率は下がってゆく
しかし、最初の4スートからの選択時の重み1/4は
かなり残っている f <- function(n=38,D=39,H=13){
T=D+H
(D/T * choose(D-1,n)/choose(T-1,n)) /((D/T * choose(D-1,n)/choose(T-1,n)) + H/T * choose(D,n)/choose(T-1,n))
}
n=1:(D-1)
f(n)
plot(n,f(n),pch=19,bty='l')
n枚全部ダイアであった場合の条件付き確率は以下の通りだな。
n=0で3/4
> f(n)
[1] 0.74509804 0.74000000 0.73469388 0.72916667 0.72340426 0.71739130 0.71111111
[8] 0.70454545 0.69767442 0.69047619 0.68292683 0.67500000 0.66666667 0.65789474
[15] 0.64864865 0.63888889 0.62857143 0.61764706 0.60606061 0.59375000 0.58064516
[22] 0.56666667 0.55172414 0.53571429 0.51851852 0.50000000 0.48000000 0.45833333
[29] 0.43478261 0.40909091 0.38095238 0.35000000 0.31578947 0.27777778 0.23529412
[36] 0.18750000 0.13333333 0.07142857 >>776
3/4は引いたカードが0枚の時の確率。 >>778
[1] 0.2040816
> f <- function(n=38,D=39,H=13){
+ T=D+H
+ (D/T * choose(D-1,n)/choose(T-1,n)) /((D/T * choose(D-1,n)/choose(T-1,n)) + H/T * choose(D,n)/choose(T-1,n))
+ }
> f(3,13,52-13)
[1] 0.2040816 >>786
ダイアが13枚ならその数値になる。
>>766の答は1/14
f <- function(n,D=13,H=52-13){
T=D+H
(D/T * choose(D-1,n)/choose(T-1,n)) /((D/T * choose(D-1,n)/choose(T-1,n)) + H/T * choose(D,n)/choose(T-1,n))
}
n=0:12
f(n)
plot(n,f(n),pch=19,bty='l')
[1] 0.25000000 0.23529412 0.22000000 0.20408163 0.18750000 0.17021277 0.15217391 0.13333333
[9] 0.11363636 0.09302326 0.07142857 0.04878049 0.02500000 >>778
3枚ならシミュレーションも容易
D=1
H=0
n=3
cards=c(rep(D,13),rep(H,39))
n.DH=length(cards)
n.D=sum(cards)
sim <- function(){
index_of_inbox=sample(1:n.DH,1)
inbox=cards[index_of_inbox]
outbox=cards[-index_of_inbox] # cards out of box
drawn=sample(outbox,n) # 2 cards drawn from outbox
c(inbox=inbox,drawn=drawn)
}
rate_sim <- function(k){
re=replicate(k,sim())
sum(apply(re,2,function(x) sum(x))==(n+1))/sum(apply(re,2,function(x) sum(x[-1]))==n)
}
re=replicate(100,rate_sim(1000))
summary(re)
> summary(re)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.0000 0.1111 0.1847 0.2029 0.2760 0.6154 7
シミュレーション結果も
> 10/49
[1] 0.2040816
に近似している。 >>791
最初に箱の中に入れたカードが
ダイヤである確率は
P(B)=3/4 (n=0) ダイヤがD枚、ハートがH枚で
1/(H+1)で求めているのは、山札からD-1枚抜き出した後
箱の中のカードを山札に戻してからシャッフルして
ダイヤの出る確率
箱の中のカードは山札に戻せないので
この場合、適切な確率空間を準備して
根元事象/全事象で解を求める >>797
違うよ
D=39
H=13
T=D+H
# choose(n,r) : nCr
39/52 * choose(38,38)/choose(51,38) / ( 39/52 * choose(38,38)/choose(51,38) + 13/52 * choose(39,38)/choose(51,38) )
(D/T * 1/choose(T-1,D-1)) /((D/T * 1/choose(T-1,D-1)) + H/T * choose(D,D-1)/choose(T-1,D-1))
(D/T)/(D/T+H/T*D)
D/(D+H*D)
1/(1+H) >>797
戻さなくてもD-1枚が除去された条件での確率だから1/(H+1)。
この試行を何回も繰り返して
38枚全てがダイアだった試行を集めて
そのうち箱の中のカードがダイアの割合は1/14。 ダイヤ99枚とハート1枚の時は
最初に99/100だったダイヤの確率が
98枚ダイヤが出た後には1/2になるという事かね?(´・ω・`) >>773
38枚全てがダイアだった時には
箱の中のカードは13/14の高確率で
ハートになるというのかね?(´・ω・`) D:ダイヤの枚数、H:それ以外のスートの枚数
抜き取ったn枚が全部ダイヤのとき
T=D+Hとして
求める確率pは ( choose(n,r)は組み合わせnCr = n!/((n-r)!*r!)
p=(D/T * choose(D-1,n)/choose(T-1,n)) /((D/T * choose(D-1,n)/choose(T-1,n)) + H/T * choose(D,n)/choose(T-1,n))
展開して整理すると
=(D-n)/(D+H-n)
D=39 H=13 n=38 なら p=1/14
D=13 H=39 n=3 なら p= 10/49
条件付き確率のイロハ >>800
その通り、
(D-n)/(D+H-n)=(99−98)/(99+1−98)
そのシチュエーションで賭けをすれば1/2の確率で勝てる。 >>804
そういうシチュエーション50回の賭けに1回しか起こらない。 >>804-805
ダイア99枚ハート1枚98枚での試行を1000回やって
箱の中のカードがダイヤであった割合を求めるシミュレーション。
100回やって平均を出した。
dia=1
heart=0
n=98
cards=c(rep(dia,99),rep(heart,1))
n.DH=length(cards)
n.D=sum(cards)
sim <- function(){
index_of_inbox=sample(1:n.DH,1)
inbox=cards[index_of_inbox]
outbox=cards[-index_of_inbox] # cards out of box
drawn=sample(outbox,n) # n cards drawn from outbox
c(inbox=inbox,drawn=drawn)
}
rate_sim <- function(k){
re=replicate(k,sim()) # inbox=D&drawn=D / drawn=D
all_dia=sum(apply(re,2,function(x) sum(x))==(n+1))
drawn_dia=sum(apply(re,2,function(x) sum(x[-1]))==n)
c(all_dia/drawn_dia, drawn_dia/k)
}
re=replicate(100,rate_sim(1000))
> summary(re[1,],digits=4) # ダイアの割合
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.1875 0.4353 0.5000 0.5039 0.5714 0.7368
> summary(re[2,],digits=4) # n 枚のダイアを引いた割合
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.00800 0.01675 0.02000 0.01993 0.02325 0.02900
計算通りの結果。 (D-n)/(D+H-n)=(99−98)/(99+1−98)
そのシチュエーションで賭けをすれば1/2の確率で勝てる。
そういうシチュエーション50回の賭けに1回しか起こらない。
ダイア99枚ハート1枚98枚での試行を1000回やって
箱の中のカードがダイヤであった割合を求めるシミュレーション。
100回やって平均を出した。
dia=1
heart=0
n=98
cards=c(rep(dia,99),rep(heart,1))
n.DH=length(cards)
n.D=length(dia)
sim <- function(){
index_of_inbox=sample(1:n.DH,1)
inbox=cards[index_of_inbox]
outbox=cards[-index_of_inbox] # cards out of box
drawn=sample(outbox,n) # n cards drawn from outbox
c(inbox=inbox,drawn=drawn)
}
rate_sim <- function(k){
re=replicate(k,sim()) # inbox=D&drawn=D / drawn=D
all_dia=sum(apply(re,2,function(x) sum(x))==(n+1))
drawn_dia=sum(apply(re,2,function(x) sum(x[-1]))==n)
c(all_dia/drawn_dia, drawn_dia/k)
}
re=replicate(100,rate_sim(1000))
> summary(re[1,],digits=4) # ダイアの割合
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.1875 0.4353 0.5000 0.5039 0.5714 0.7368
> summary(re[2,],digits=4) # n 枚のダイアを引いた割合
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.00800 0.01675 0.02000 0.01993 0.02325 0.02900
計算通りの結果。 最初に箱に入れた時の確率の重みを含めて計算してみます
Ω={(i,j)|1≦i≦200,1≦j≦200−n}から
#A=200x(200−n)−199x(199−n)
=40000−200n−39601+199n
=399−n
P(X)=(399−n)/(40000−200n)
∵q=1−{(399−n)/(40000−200n)}
q=20099/20400 (n=98) この問題は条件付確率ではなくて
98枚すべてがダイヤであった確率は1で計算します(´・ω・`) ハート二枚、ダイヤ二枚の合計4枚のトランプカードから
一枚のカードを表を見ないで箱に入れて
ダイヤの出る枚数はn=1という条件にすると
ベイズと計算結果が一致するという不思議 ハート二枚、ダイヤ二枚の合計4枚のトランプカードから
一枚のカードを表を見ないで箱に入れる
Ωの部分集合を事象と言う
Ω自身は全事象と言う
Ω={ハート,ダイヤ}となる
各 i (1≦i≦2) が根元事象である
ハートが出るという事象A={ハート}で確率P(A)は
P(A)=1/2 となる
最初に箱に入れた時を i
山札をシャッフルしてダイヤがn枚出た後を j として
箱の中のカードがハートであるという事象Aを考える.
A={(i,j)| i または j がハート}
Ω={(i,j)|1≦i≦2,1≦j≦4−n}となり
この8−2n通りの各要素が根元事象
ダイヤが出る枚数はn=1
Ω={(i,j)|1≦i≦2,1≦j≦4−n}から
#A=2x(4−n)−1x(3−n)
=8−2n−3+n
=5−n
#Aは事象Aに含まれる要素の個数
ハートである確率は
P(A)=(5−n)/(8−2n)=2/3
ダイヤ以外である確率P(X)=P(A)
ダイヤである確率は
∵q=1−{(5−n)/(8−2n)}=1/3 シミュレーション結果はn=1以外でもp=(D-n)/(D+H-n)に一致した。
パソコンで一様分布する乱数発生させてやってみればいいのに。 実験結果と合致しないような理論は読む気にすらならん。 n=1以外の値は取りようがないのに
どうやって一致したの? >>814
実験に一致しない理論が間違っているだけの話。 n=1 で
p=(D-n)/(D+H-n)=1/3
見事に一致します >807で
n=98で一致している。
実験結果と合致しないような理論は読む気にすらならん。 >>819
>802が理論値
>806がRでのシミュレーションスクリプト
後は自分でやれよ。 有名頻出問題すぎて見飽きた
アホは正しくない集計方法を根拠に、正しいシミュレーションを認めない
というのももはやお決まりのパターン
シミュレーションなどしなくても元の問題の場合
引いたカードを順にx1,x2,x3,…とすれば
<x1,x2,x3,x4>の確率分布と
<x2,x3,x4,x1>の確率分布が同じことから
2〜4枚目がダイヤの時の1枚目がダイヤの確率は
1〜3枚目がダイヤの時の4枚目がダイヤの確率と値が同じだと言える >>819
D=H=2
n=0でp=1/2
n=2でp=0
p=(D-n)/(D+H-n)の成立は
シミュレーションするまでもない。 n=0 だとトランプ問題にならないよ
n=2 は確率の問題じゃなくてただの事実だよ(´・ω・`) ダイヤが出る枚数はn=1
Ω={(i,j)|1≦i≦2,1≦j≦4−n}から
ダイヤである確率は
∵q=1−{(5−n)/(8−2n)}=1/3
n=1 で
p=(D-n)/(D+H-n)=1/3
見事に一致します(・∀・) 山札からダイヤのカードが出る枚数nの範囲は
D:ダイヤの枚数とすると
1≦n≦D−1になる ダイヤが出る枚数はn=0のとき
Ω={スペード,ハート,クラブ,ダイヤ}から
各iは 1≦i≦4が根元事象
ダイヤである確率はP(D)は
∵P(D)=13/52=1/4 ハートとダイヤが2枚ずつ合計4枚の場合は
ダイヤが出る枚数はn=0のとき
Ω={ハート,ダイヤ}から
各iは 1≦i≦2が根元事象
ダイヤである確率はP(D)は
∵P(D)=2/4=1/2
D=H=2
n=0でp=1/2と一致する # ジョーカーを除いたトランプ52枚の中から1枚のカードを抜き出し、
# 表を見ないで箱の中にしまった
# そして、残りのカードをよく切ってからn枚抜き出したところ、
# n枚ともダイヤであった
# このとき、箱の中のカードがダイヤである確率はいくらか
p=(D-n)/(D+H-n)
> for(i in 0:13) p2(n=i,D=13,H=52-13)
P(A|B)= 1 / 4 = 0.25
P(A|B)= 4 / 17 = 0.2352941
P(A|B)= 11 / 50 = 0.22
P(A|B)= 10 / 49 = 0.2040816
P(A|B)= 3 / 16 = 0.1875
P(A|B)= 8 / 47 = 0.1702128
P(A|B)= 7 / 46 = 0.1521739
P(A|B)= 2 / 15 = 0.1333333
P(A|B)= 5 / 44 = 0.1136364
P(A|B)= 4 / 43 = 0.09302326
P(A|B)= 1 / 14 = 0.07142857
P(A|B)= 2 / 41 = 0.04878049
P(A|B)= 1 / 40 = 0.025
P(A|B)= 0 / 1 = 0
>786の式は
q=1−{(165−3n)/(208−4n)
n=0で0.25
n=13で0
にならないから間違い。
n=0で 0.2067308
n=13で0.1923077
13枚が全部ダイアであったとき、箱の中のカードがダイアである確率が19%もあるわけないだろ。 >>829
この場合はベイズと>786の数値が一致するのはn=3の時だけ。
n=1の時だけ一致するという妄想は否定される。 >>823
nCrはr=0でもr=nでもありうる。
r=0なら組合せにならないとかr=nは事実とか
言って排除したりはしないよ。 1≦n≦12の範囲において検算するとって書いてあるじゃん(´・ω・`) >>832
引く前の確率であるn=0が1/4になってない式は間違いだね。 1/4になる式は>>827に書いてあるじゃん(´・ω・`) >>826
引かなきゃ0だし、箱の中のカードがダイヤ以外のとき
n=Dもありうる。 52枚タイプの式は
n=0のときが>>827
1≦n≦12の範囲のときは
q=1−{(165−3n)/(208−4n)}
n=13の時に
箱の中のカードがダイヤである確率を問うのはナンセンス >>820
あなたの能力評価については下方修正されますが
存在価値がマイナスに転じるわけでなく、運営上あなたは
依然として特質した価値を持つ個人であり、明晰な頭脳、判断力は
来たるべき新たな時代、市民に示す指標として十分な理想形といえます
確率空間に対し完全に相反する感情的反感と理論的評価を抱き
今なおその葛藤は継続しているはず、そんなあなたを懐柔する
手法が確立できたのなら
数学板の統制を次の段階に進める上で
我々は、貴重なサンプルデータを獲得できるでしょう(´・ω・`) >>838
0を返さない式こそナンセンス。
ベイズはn=0でもn=13でも正しい値を返す。 >>838
nPr、nCrはの順列組合せはr=0でもr=nでもありうる。 このスレってベイズ統計学じゃなくて大学以前の組み合わせ論的な確率のスレだよね 分散の事前分布にハーフコーシー使えとかの辺りは
理論的根拠というよりシミュレーションが根拠だと感じている。
まあ、サッカーの得点はポアソン分布とかも信念と言えなくもない。 2封筒問題をベイズとか主観確率的に考えるとどうなるの?
いちおう数学板的には「用意する金額の組の事前分布が不明だから期待値計算できない」ってのが結論で、それはそれで正しいとは思うけど
主観確率的にこんな事前分布を仮定するのが良い(都合が良い)とか言えることはないの? >>844
確率統計に関する話題何でも有りのすれだろ
自分はそう捉えてるが
どんな質問しても
誰も文句言わんし >>848
よく分からんかった
例えば1封筒問題として
中身の金額が不明の封筒が1つあったとしたら
この金額の分布、または分布の確率分布をどう設定するのがいいのだろうか >>850
ルールはないよ。
俺なら負にはならないから一様分布か、ガンマ分布を選ぶけど。
男児が生まれる確率の事前分布も同じ。
一様分布にするか21/20がモード値のβ分布を選ぶかは自由。
このあたりがベイズが主観的といわれる所以だと思う。 このスレのゴルゴの命中率の確率も
事前分布を一様分布、期待値は0.5としての議論。
スナイパーの命中率の事前分布としては不適切という議論は当然ある。 つぼの中に50個のボールがある
20個は赤、30個は白
つぼの中から無作為にボールを3つ取り出す
取り出したボールの中に赤が含まれる確率は?
取り出すボールの個数をnとして
近似を求める関数が完成しました(*´▽`*)
取り出したボールがすべて白である確率は
P(A)=(54n+98)/(250n+5n^4)
一つでも赤が含まれる確率は
∵q=1−{(54n+98)/(250n+5n^4)} >>834
取り敢えず、n=0で1/4になる式はできた
∵q=1−{(165n−3n^2+3)/(208n−4n^2+4)},n=0 書き間違い?
n=31で1にならないから却下(>>853)
n=13で0にならないから却下(>>854) >>856
自分でシミュレーションしてみ。
話はそれからだ。 ジョーカーを除いたトランプ52枚の中から1枚のカードを抜き出し、
表を見ないで箱の中にしまった
そして、残りのカードをよく切ってから3枚抜き出したところ、
3枚ともダイヤであった
このとき、箱の中のカードがダイヤである確率はいくらか
山札からダイヤがn枚抜き出された時の
近似を求める関数が完成しました(*´▽`*)
スペード・ハート・クラブの各スートの出る確率は
P(A)=(55n−n^2+3)/(208n−6.3136n^2+4)
スペード・ハート・クラブである確率は
P(X)=(165n−3n^2+3)/(208n−6.3136n^2+4)
ダイヤである確率は
∵q=1−{(165n−3n^2+3)/(208n−6.3136n^2+4)} >>858修正
スペード・ハート・クラブの各スートの出る確率は
P(A)=(55n−n^2+1)/(208n−6.3136n^2+4) >>860
シミュレーション結果との対比グラフもだせないうちは相手にしないことにした。 k=6.3136とおいて小数点以下を増やすことによって
精度を上げることが可能 くじ引きと料金に関する質問です
1)100本中30本当たりの1回1000円のくじ引き
2) 50本中30本当たりの1回2000円のくじ引き
どちらかを選んでそのくじを当たりがでるまで引き続ける。
くじ引きは戻さないで次のくじを引く。
どちらの方が安く当たりを引く確率が高いですか?
当たりが3本でるまで引き続ける場合はどうか? .
∧__∧?
( ´・ω・)∧∧l||l
/⌒ ,つ⌒ヽ ) <>>855
(___ ( __)
"''"" "'゙''` '゙ ゙゚' ''' '' ''' ゚` Ω1={(i,j)|1≦i≦33n,1≦j≦100}から
#A=3300n−3168n=132n
Ω2={(i,j)|1≦i≦6n,1≦j≦50}から
#B=300n−245n=55n
132n≧55x2nなので
1回1000円のくじ引きのほうが
安く当たりを引く確率が高い >>866
費用の期待値が出せてないからダメだね。
シミュレーションとも一致しない。 1回1000円のくじ引きは2000円で当たる確率が
P(A)=51/100
1回2000円のくじ引きが1回で当たる確率は
P(B)=60/100 100本中30本当たりの1回1000円のくじ引きで
3回あたりが出る回数の期待値は10
50本中30本当たりの1回2000円のくじ引きで
3回あたりが出る期待値は5
E1=1000x10=10000
E2=2000x5=10000 >>868
1回1000円のくじ引きが2000円で当たる確率は
1−(70/100)*(69/99)=169/330=0.56333... >>870 訂正
× 1−(70/100)*(69/99)=169/330=0.56333...
○ 1−(70/100)*(69/99)=169/330=0.5121212... ■ このスレッドは過去ログ倉庫に格納されています